- •Чинники, що зумовили формування комп’ютерної лінгвістики як науки
- •Поняття кл. Історія розвитку кл
- •Зв’язки кл з іншими нелінгвістичними науками
- •Поняття кл. Основні напрямки кл
- •Основні напрямки кл. Комп’ютерна лексикографія
- •Основні напрямки кл. Аналіз текстів на природній мові
- •Історія розвитку та сучасний стан систем машинного перекладу
- •Прикладні системи розробку яких, забезпечує кл
- •Характеристика об’єкту досліджень в кл
- •Характеристика предмету досліджень в кл
- •Два типи моделей опису мовленнєвої діяльності. Розширена класифікація моделей
- •Класифікація моделей опису мовленнєвої діяльності
- •Етапи створення лінгвістичної моделі
- •Вимоги до побудови лінгвістичних моделей
- •Класифікація лінгвістичних моделей за способом побудови
- •Класифікація лінгвістичних моделей за способом аналізу мовних об’єктів
- •22. Система рівнів абстракції опису лінгвістичних явищ в кл
- •23. Критерії вибору формалізму для представлення лінгвістичних явищ в кл
- •24. Граматики, що використовуються для опису в кл
- •25.Загальна схема опрацювання текстів на природній мові
- •26. Аналіз окремих слів. Характеристика етапу
- •27. Аналіз окремих речень. Характеристика етапу
- •28. Аналіз тексту в цілому. Характеристика етапу
- •29. Поняття автоматизована система опрацювання текстів. Характеристика основних підходів до її розробки
- •30. Які задачі вирішує модуль ама в системах автоматичного опрацювання текстів природною мовою
- •Загальна умовна структура системи ама
- •32. Основні принципи розробки систем ама
- •33.34.35 Основні групи методів ама
- •37. Етапи ма з використанням словників
- •38. Етапи створення швидкодіючого алгоритму ма
- •39. Які основні вимоги висуваються до систем ама
- •40.Основні поняття морфологічної моделі мови флективного типу
- •41.Основні складові лінгвістичного забезпечення систем ма.
- •43. Які складові необхідні для опису мови в її морфологічній моделі?
- •44. Поняття таблиці морфів. Навести приклад
- •45. Поняття списки масок. Навести приклад
- •46. Поняття списки морфів. Навести приклад
- •47. Поняття технічної частини мови
- •48 Яку інформацію повинен містити кожен запис у словнику основ
- •49. Порівняння методів ма «справа-наліво» і «зліва-направо»
- •50. Переваги методів ма «зліва-направо»
- •51. Характеристика задачі побудови словника основ і пошуку в ньому, як задачі керування базою даних
- •52. Загальна структура словника основ, яка забезпечує мінімум звертань до диска
- •53. Алгоритм пошуку у словнику основ. Навести приклад
- •54.Алгоритм роботи «стека вкладених ключів». Навести приклад
- •55.Алгоритм формування словника основ. Навести приклад
- •57.Типи граматичних правил для зняття омонімії
- •58.Використання прихованої моделі Маркова в алгоритмах зняття омонімії
- •60.Алгоритм зняття омонімії методом на основі нормалізуючи підстановок і позицій сусідніх слів
43. Які складові необхідні для опису мови в її морфологічній моделі?
Для опису мови потрібно: таблиця морфів, список морфів, список грамем, список масок.
44. Поняття таблиці морфів. Навести приклад
Дані таблиці необхідні для кожної позиції, для кожної частини мови.Стрічки таблиці морфів утворюють парадигми, різні стрічки відповідають різним класам словозмін.Грамеми відповідають стовпчикам таблиць.Словник містить основи слів з вказанням відповідних стрічок таблиць морфів.
45. Поняття списки масок. Навести приклад
Для опису дефлективності парадигм вводиться поняття маски.Маска- це стрічка певних знаків , припустимо + -. Довжина стрічки дорівнює довжині стрічки таблиці морфів.Кожен з цих знаків, що відповідає певному стовпчику таблиці морфів, задає інформацію вибору даного стовпчикапри аналізі або синтезі. Таким чином маска забороняє певні стовпчики таблиці морфів.Списком масок називається список , що використовується в системі для даної позиції дано частини мови.На рис. в словнику крім номерів стрічок таблиць морфів , прписані також номери масок.
46. Поняття списки морфів. Навести приклад
Коли йдеться про поєднання декількох суфіксів, додається ще одна таблиця-список морфів. Для кожної позиції словоформи всі попередні позиції в моделі форм грають роль подібну до ролі основ, а всі наступні підпорядковують їй аналогічно тому , як в найпростішому випадку вибір єдиного суфіксального морфа визначається основою.У відповідності до цього складається так як би міні-словники морфів для кожної позиції .В них для морфів вказують номери стрічок таблиць морфівдля всіх настуних позицій.Такі списки називаються списками морфів.
47. Поняття технічної частини мови
В «середині» кожної частини мови таблиці складать взаємопов*язану систему, але таблиці однієї частини мови не пов*язані з таблицями іншої.Такі окремі підсистеми таблиць називають в моделі технічними або формальними частинами мови.Кожна формальна частина мови задається незалежною реалізацією системи таблицьПараметром формальної частини мови є кількість позиційі вона визначає кількість таблиць необхідних для опису даної частини мови.
48 Яку інформацію повинен містити кожен запис у словнику основ
текст основи; інформація, що ідентифікує лексему (номер); номер технічної частини мови –набір таблиць; набір грамем для нульової позиції; набір номерів масок; набір номерів стрічок таблиць морфів; службова інформація
49. Порівняння методів ма «справа-наліво» і «зліва-направо»
При «с-н»робиться спроба вичленити кінцеву частину словоформи і потім перевірити наявність в словнику частини, що залишилась (основи),умовної. При «з-н» робиться спроба знайти у словнику певнупочаткову частину ланцюжка букв, а потім перевірити , що частина , яка залишилась , може бути можливо квазіфлексією для даної основи.При обох підходах може бути невдале розбиття і тоді треба пробувати розбивати слово іншим чином.
50. Переваги методів ма «зліва-направо»
В даному методі значно спрощується перевірка відповідності основ їх квазіфлексії , бо вони є відомими. Не треба вказувати кінець слова у вхідному тексті.Задачу побудови словникаі пошуку в ньому можна розглядати як задачу керування базою даних, тому нам не потрібно ніякої лінгвістичної інформації.