Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Всеволодова-Комп.обработка.doc
Скачиваний:
16
Добавлен:
15.11.2019
Размер:
4.58 Mб
Скачать

2. Обзор лингвистических программ

. 2.1. ВИДЫ ЛИНГВИСТИЧЕСКИХ ПРОГРАММ

В наше время технологии автоматической обработки тек­стов на естественном языке являются весьма перспективными, и результаты их исследований представляют собой определен­ный коммерческий интерес, в связи с чем оказывается довольно трудным найти какую-либо специфическую информацию по данным темам, выходящую за рамки популярной литературы.

Компьютерная лингвистика (КЛ) — наука, родившаяся на стыке информатики и языкознания из потребности в общении с компьютером на естественном языке.

Спектр приложений КЛ простирается от простейших про­граммок обработки текста (транслитерации, проверки правопи­сания и других) до более сложных, например, программы авто­реферирования, поисковые системы и программы машинного перевода.

Изучением многообразия лингвистических программ, их ти- пологизацией и другими проблемами компьютерной лингвисти­ки в России занимается междисциплинарный семинар ДИАЛОГ, который проводился с 1975 по 1989 г. и был возобновлен в 1995 г. Это самое представительное российское мероприятие, целиком посвященное компьютерной лингвистике и ее приложениям, со­бирающее каждый год большое число ведущих специалистов в области интеллектуальных языковых технологий из компьютер­ных фирм, вузов и научных институтов со всей России и из-за ру­бежа. Постоянными участниками ДИАЛОГа являются Московс­кий государственный университет, РГГУ, Институт языкознания РАН, компании «ABBYY», «Яndex», «ПРОМТ»; РосНИИ искус-

37

ственного интеллекта, Институт проблем информации РАН. На­учная программа семинаров ДИАЛОГ охватывает основные на­правления фундаментальных исследований и коммерческих раз­работок, находящихся на пересечении лингвистики, методов представления и обработки знаний и самых современных инфор­мационных технологий. В 2007 г. обновился сайт семинара http:// www.dialog-21.ru/. Теперь этот профессионально сделанный веб-ресурс предоставляет самые свежие новости из мира компьютер­ной лингвистики и интеллектуальных технологий. На сайте ра­ботает конференция, публикуется еженедельный дайджест наи­более интересных новостей. Кроме того, здесь можно найти все материалы семинаров ДИАЛОГ за последние три года.

Возрожденный в 1995 г. в статусе международного ДИАЛОГ на сегодня остается единственным мероприятием подобного рода, собирающим не только цвет российской лингвистической науки, но и крупнейшие компании, работающие в области ком­пьютерной лингвистики, а также авторитетных представителей смежных наук. Он играет ключевую роль в развитии связей между отечественными фирмами, научными институтами и ву­зами, интересующимися данной тематикой. Аудитория семина­ра постоянно растет, а число докладов, опубликованных в тру­дах семинара, увеличилось по сравнению с 1995 г. втрое.

В определенный момент ДИАЛОГ достиг масштаба, требую­щего некоторой реорганизации для его дальнейшего развития. Поэтому в прошлом году было принято решение о создании Ас­социации «Компьютерная лингвистика и интеллектуальные технологии» (КОЛИНТ). Ее учредителями стали постоянные участники ДИАЛОГа: компании «ABBYY», «Яndex», «ПРОМТ», «Ашманов и партнеры», SCIPER (Париж), а также Российская ассоциация искусственного интеллекта, научные институты ИПИ и ИППИ РАН, РосНИИ искусственного интеллекта, ИМ СОРАН, ИИ Казанского госуниверситета, филологический фа­культет МГУ.

Это позволило вывести ДИАЛОГ на новый уровень органи­зации и представительности. Без преувеличения можно сказать, что именно ДИАЛОГ позволяет сегодня оценить текущее состо-

38

яние отечественной прикладной лингвистики и ее приложений в информационных технологиях, задать ориентиры для их раз­вития.

Предлагается выделить в области интересов ассоциации сле­дующие тематические направления КОЛИНТ (данный список открыт для обсуждения):

  • теоретическая и когнитивная лингвистика;

  • синтаксис, семантика, прагматика и их взаимодействие;

  • диалог и речевой акт;

  • модели национальных языков;

  • интерфейсы на естественном языке;

  • понимание связного текста и модель предметной области;

  • речевое взаимодействие с компьютером: анализ и синтез;

  • технологии представления и обработки знаний;

  • естественный язык и Интернет;

  • машинный перевод;

  • автоматическая обработка полнотекстовых документов;

  • корпусная лингвистика;

  • словарь, тезаурус, онтология.

Большое количество лингвистических программ собрано в Каталоге лингвистических программ и ресурсов в Сети (www.rvb. ru/soft/-catalogue-/catalogue.html).

Данный каталог включает в себя описание программ, свя­занных с анализом текстов и вычислительной лингвистикой, а также соответствующих ресурсов, доступных сегодня в Интер­нете. Упор при составлении каталога делался на бесплатные программы, доступные для загрузки. Однако описаны также не­которые on-line и коммерческие версии программ. Тематически каталог разбит на следующие разделы:

  • программы анализа и лингвистической обработки текстов;

  • программы преобразования текстов;

39

психолингвистические программы; генераторы текстов и «говорящие» программы; системы обработки естественного языка; коллекции ресурсов; словари и тезаурусы.