- •ДніпропетровсьКий університет імені альфреда нобеля Кафедра прикладної лінгвістики та методики навчання іноземних мов автоматичний морфологічний аналіз
- •Дніпропетровськ-2015
- •Короткі теоретичні відомості до робіт №1-№3 Практична робота № 1. Поняття автоматичного морфологічного аналізатора
- •Практична робота №2. Морфологічно розмічені корпуси
- •2.1 Представлення промаркованих слів
- •2.2 Доступ до морфологічно розміченого корпусу
- •2.3 Спрощений набір тегів для маркування морфологічних характеристик
- •2.4 Іменники
- •2.5 Дієслова
- •2.6 Повний набір тегів
- •2.7 Дослідження морфологічно розміченого корпусу
- •3.1 Порівняння проіндексованих списків та словників
- •3.2 Тип даних словник в Python
- •3.3 Визначення (створення) словників
- •3.4 Словники по замовчуванню
- •3.5 Проведення обчислень з використанням словника
- •3.6 Комплексні ключі та значення
- •3.7 Інвертування словника
- •Порядок виконання практичних робіт №1-№3
- •Зміст звіту по практичним роботам №1-№3
- •Інтернет посилання
- •Короткі теоретичні відомості
- •4.2.The Lookup Tagger Пошуковий морфологічний аналізатор
- •Практична робота №5. Використання n-грамів в автоматичному морфологічному аналізі
- •5.1.Уніграм аналізатор
- •5.2. Розділення даних для тренування та тестування аналізаторів
- •5.3. Морфологічний аналіз на основі n-грамів
- •5.4. Поєднання (комбінування) аналізаторів
- •5.5. Морфологічний аналіз невідомих слів
- •5.6. Збереження результатів тренування аналізаторів
- •Практична робота №6. Transformation-Based Tagging
- •6.1. Категорії слів англійської мови
- •Порядок виконання робіт №5-№6.
- •Зміст звіту
- •Методичні вказівки
2.5 Дієслова
Дієслова це слова, які описують дії і події (таблиця 3). В реченнях дієслова виражають відношення між одним або декількома іменниковими виразами.
Таблиця 3
Word |
Simple |
With modifiers and adjuncts (italicized) |
fall |
Rome fell |
Dot com stocks suddenlyfelllike a stone |
eat |
Mice eat cheese |
John ate the pizza with gusto |
Дієслова можуть бути прокласифіковані згідно кількості аргументів (звичайно це іменникові вирази), які вони вимагають. Слово fallє неперехідне, вимагає один аргумент (що буде падати). Словоeatє перехідне, вимагає два аргументи (хто їсть, що їсть). Часто дієслова є ще складніші, наприкладput(вимагає три аргументи).
Використовуючи засоби бібліотеки NLTK можна здійснити різноманітні дослідження вживання дієслів. Відсортований за частотою список дієслів можна отримати наступним чином:
|
Частотний розподіл містить інформацію про частоти пар слово-тег. Якщо вважати слово – умовою, а тег – подією, то можна побудувати умовний частотний розподіл для таких умова-подія пар. В результаті побудови умовного частотного розподілу можна дізнатися впорядкований за частотою набір тегів для певного слова:
|
Якщо змінити порядок елементів в парах слово тег і вважати теги – умовою та слова подією, то можна встановити слова, які найчастіше маркуються певним тегом:
|
Для пояснення відмінностей між VD(past tense) таVN(past participle), можна знайти слова які промарковані іVDіVN, та переглянути контексти в яких вони зустрічаються:
|
В другому випадку past participle kickedзустрічається після допоміжного дієсловаhave. Чи вірно це?
Виконати самостійно.Використовуючиcfd2['VN'].keys() знайти список всіх пар слово тег , які зустрічаються передVN.