- •Чинники, що зумовили формування комп’ютерної лінгвістики як науки
- •Поняття кл. Історія розвитку кл
- •Зв’язки кл з іншими нелінгвістичними науками
- •Поняття кл. Основні напрямки кл
- •Основні напрямки кл. Комп’ютерна лексикографія
- •Основні напрямки кл. Аналіз текстів на природній мові
- •Історія розвитку та сучасний стан систем машинного перекладу
- •Прикладні системи розробку яких, забезпечує кл
- •Характеристика об’єкту досліджень в кл
- •Характеристика предмету досліджень в кл
- •Два типи моделей опису мовленнєвої діяльності. Розширена класифікація моделей
- •Класифікація моделей опису мовленнєвої діяльності
- •Етапи створення лінгвістичної моделі
- •Вимоги до побудови лінгвістичних моделей
- •Класифікація лінгвістичних моделей за способом побудови
- •Класифікація лінгвістичних моделей за способом аналізу мовних об’єктів
- •22. Система рівнів абстракції опису лінгвістичних явищ в кл
- •23. Критерії вибору формалізму для представлення лінгвістичних явищ в кл
- •24. Граматики, що використовуються для опису в кл
- •25.Загальна схема опрацювання текстів на природній мові
- •26. Аналіз окремих слів. Характеристика етапу
- •27. Аналіз окремих речень. Характеристика етапу
- •28. Аналіз тексту в цілому. Характеристика етапу
- •29. Поняття автоматизована система опрацювання текстів. Характеристика основних підходів до її розробки
- •30. Які задачі вирішує модуль ама в системах автоматичного опрацювання текстів природною мовою
- •Загальна умовна структура системи ама
- •32. Основні принципи розробки систем ама
- •33.34.35 Основні групи методів ама
- •37. Етапи ма з використанням словників
- •38. Етапи створення швидкодіючого алгоритму ма
- •39. Які основні вимоги висуваються до систем ама
- •40.Основні поняття морфологічної моделі мови флективного типу
- •41.Основні складові лінгвістичного забезпечення систем ма.
- •43. Які складові необхідні для опису мови в її морфологічній моделі?
- •44. Поняття таблиці морфів. Навести приклад
- •45. Поняття списки масок. Навести приклад
- •46. Поняття списки морфів. Навести приклад
- •47. Поняття технічної частини мови
- •48 Яку інформацію повинен містити кожен запис у словнику основ
- •49. Порівняння методів ма «справа-наліво» і «зліва-направо»
- •50. Переваги методів ма «зліва-направо»
- •51. Характеристика задачі побудови словника основ і пошуку в ньому, як задачі керування базою даних
- •52. Загальна структура словника основ, яка забезпечує мінімум звертань до диска
- •53. Алгоритм пошуку у словнику основ. Навести приклад
- •54.Алгоритм роботи «стека вкладених ключів». Навести приклад
- •55.Алгоритм формування словника основ. Навести приклад
- •57.Типи граматичних правил для зняття омонімії
- •58.Використання прихованої моделі Маркова в алгоритмах зняття омонімії
- •60.Алгоритм зняття омонімії методом на основі нормалізуючи підстановок і позицій сусідніх слів
23. Критерії вибору формалізму для представлення лінгвістичних явищ в кл
формалізм – мова є вродженою компонентою людськогг мислення, залежить від способу використання мови
вимоги до вибору формалізму:
-лінгвістична природність(зручність відображення явищ природи)
-формальна потужність(класифікація природних мов і граматик)
-обчислювальна ефективність(формалізм, що забепечує більшу швидкодію і має більшу ефективність)
24. Граматики, що використовуються для опису в кл
Граматика скінченних автоматів
Скінченний автомат містить 6набір станів(нетермінальних символів), серед яких виділяють один або декілька початкових і кінцевих і умов переходу між станами. Інформацією для переходу за умов служать символи, що поступають з стрічки, яку читає автомат. Часто умови переходу не задаються безпосередньо, а а обчислюються словарним компонентом, що ставить у відповідність символам або ланцюжкам символів стрічки-символи їх узагальнених класів.
Контекстно-вільні граматики
Граматики, які описуються у вигляді правил, що ставлять у відповідність нетермінальним символам в своїх лівих частинах набір термінальних і нетермінальних символів в правих частинах. синтаксис контекстно-вільних граматик дуже простий, аля для опису бгатьох феноменів природньої мови простого апарату не достатньо.
Когнтекстн- залежні граматики
Граматики залежності не дають можливості зручного представлення словосполучень як одиниць аналізу, а такеож зєднання тих структур, які по своїй природі не є залежними один від одного, наприклад, сурядних конструкцій
25.Загальна схема опрацювання текстів на природній мові
текст >>>>>>поділ на окремі речення->>>>>>>>>>>>>>>>>поділ на слова>>>>>>>>
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>характерстики слів->>>>>>>>>>синтаксична структура речення>>>>>>>>>>>>>>>>>>>>>>>
результати
опрацювання
тексту 1)рівень текту 2)рівень речення 3)рівень слова
26. Аналіз окремих слів. Характеристика етапу
сюди належать морфологічний та морфемний аналіз слів. Вхідними параметрами є текстове представлення окремої словоформи. Метою є визначення певногг набору морфологічних характеристик і встановлення словоформ. Результати морфологічного аналізу неоднозначні. Правильність і повнота морфологічного аналізу залежать від:
1)правильності лінгвістичної моделі, яка закладена в основу морфологічного аналізатора
2)рівня формалізації знань у створеній машинній граматиці(як ми реалізовуємо дану модель)
27. Аналіз окремих речень. Характеристика етапу
Здійснюється синтаксичний аналіз. Метою є визначити взаємозвязки між реченнями та частинами речень. Завданням програми є – використовуючи морфологічну інфу про слова побудувати синтаксичну структуру вхідного речення.
Об”єктом аналізу є речення, яке представлене у вигляді набору словоформи, яким представлена у відповідність набір морфологічних характеристик.
Результатом є синтаксична структура речення яка представляється як інфа про взаємозвязки між словоформаими даного речення . найчастіше результати синт аналізу представляються за допомогою графа(вузо-словоформа, лінгв. звязок - дуги). в англ мові представляються у вигляді дерев.