Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1IT.doc
Скачиваний:
4
Добавлен:
20.09.2019
Размер:
150.02 Кб
Скачать

1)Теоретическое языкознание2)прикладная лингвистика (инженерная, компьютерная, структурная, математ.) в 70е годы возник термин «структурная, прикладная и математическая лингвистика»

В настоящее время прикладная лингвистика

Математическая вычислительная (инженерная\компьютерная)(квантитативная) изучает математические методы и статистику Компьютерная лингвистика – раздел прикладного языкознания, изучающий теорию моделирования языка, речи, речемыслительной деятельности человека, и представить свои результаты в виде алгоритмов и программ.

Основные методы компьютерной лингвистики – метод моделирования или метод моделей.Модель – абстрактное, формализованное описание объекта, системы объектов, процесса или явления, выраженных конечным набором предложениями языка, математическими формулами, таблицами, схемамиСвойства1.Упрощенный аналог объекта 2.Не сложнее оригинала3.Имеет общий или универсальный характер4.Отражает существенные черты объекта5.Должна быть логически правильной6.Должна быть максимально экономичной Типы моделей:•Структурные,Функциональные(для изучения поведения сам соврем ВИЛМ, Динамичные

4. Алгоритм – определенная взаимосвязанная конечная последовательность действий приводящих к решению некоторых типовых задач.

Свойства:A. Дискретность (непостоянство) B. Результативность C. Массовость D. Детерменинованность E. Формализованность Формы записи:1.Словесная

2.Использование специального алгоритмического языка3.Табличная форма4.Программа 5.Графическая форма а+в=с (овал, параллелограмм, прямоугольник, ромб, круг)начало ввод: а и в ,а+в=с печать с конец

Типы:•Линейные•Разветвляющийся (хотя бы один блок «если»)•С циклической структурой (содержит циклы)

Техническое обеспечение ИТ: 1.Основные конструктивные блоки компа2.Функциональные узлы компа

3.Сопоставление принципов переработки текстовой информации человеком

6 Устройство ввода и вывода информации (клавиатура, мышь, сканер, модем, видео-фото камера)

Клавиатура – несколько групп клавиш (алфавитно-цифровые и знаковые, функциональные дополнительные цифровая клавиатура, служебные или управляющие)

Клавиатура (безопасные или нет)Неэргономичные эргономичные: с подставкой для рук, расщепленная, с волнообразынм расположением клавиш, с обратным наклоном панели, беспроводные (инфракрасная, радиоуправляемая), со сканером отпечатков пальцев, коммуникационный центр (встроенный телефон, наушники, устройство чтения пластиковых карт).

Мышь•Оптомеханическая с шарико-роликовым механизмом + колесик-скроллинг•Оптическая (оптосенсорная)•Беспроводная (с инфракрасным излучением или радиоуправляемая)•Интерактивная с виброрежимом.Сканер (по принципу отражения света) В отраженном свете работающая В походящем свете (слайд-сканеры)Сканер (по принципу сканирования)Ручные Планшетные Роликовые Барабанные Проекционные (слайд-сканеры)

Сканер (по цветопередаче)Черно-белые Цветные (с 1989 года)Внешняя память: жесткий диск или винчестер (характеризуется емкостью, скоростью доступа к данным), гибкие диски (магнитные носители или дискеты, оптические носители или лазерные диски CD-R\RW, DVD-R\RW), USB-накопители или адэфыр-память.

Модем (модулятор, демодулятор)Внутренний Внешний Факс-модем Программный (часть функций выполняет процессор)Фото- и видео-камеры, веб-камеры Альтернатиные устройства ввода информации: устройства ввода речевой информации (микрофон), биометричные технологии ввода информации (распознавание лице), мысленное управление компьютером Устройство выводаМонитор

Принтер

- матричные (скорость печати 1-3 стр\мин). Достоинство: высокая устойчивость к внешним условиям, возможность печати на плотной бумаге. Недостатки: минимальные возможности работы с цветом-лазерные (16-32 стр\мин)-струйные (22 стр\мин)Хорошая масштабируемость, возможность получения фотографического качества, высокие эксплуатационные расходы

-плоттер – для широкоформатной печати и рулонной печатей, схем, чертежей…

Скорость обработки информации – 3 мллрд. Операций\сек

7Устройства обработки информации

Основное устройство обработки информ.-центр.процессор или микропроцессор.в общем виде в микропроцессор входит:1.арифмет.или логич.устрой ство.в этом блоке выполняются все действия2.сопроцессор(ы)размещ. На плате, служит для увелич.скор.вычислений,особенно с числами большой точности.3.устройства управления осуществл.через сис-мную шину.4.кэш-память-быстродейтсвующ.память,состоит из2-хблоков один для хранения часто использ. данных,второй-кодов.Параметры микропроцессора:1.тактовая частота,2.производительность(кол-во операций в с.)3.разрядность-способность за 1 такт обработать определ.число битов.4.набор команд(арифметич, логич действия,управления командами)биочип-небольшая пластина с нанесенными на нее в строчном порядке молекулами белка или ДНК

8.Функц узлы комп:устр хран информ.

Внешняя память;внутренняя память.Внешняя:-винчестер(характериз объемом,памятью 2мгбайта;скоростью доступа к данным);-дискеты,магнитные носители(1,44мгбайта);-лазерные диски(CD/DVD-ROM/R/RW-4,7Гб);-флеш-память(макс 32-64);-карта памяти(2-4Гб).Внутренняя:-ОЗУ(оперативная память(2-4Гб 1 планка,можно установить до 4-х планок,энергозависимая,кратковременная);-ПЗУ(стоянное запоминающ устройство,системные программы,тестир устр-во,при его вкл и обслуж работу основных устройств).

9. класифик.комп.по размеру весу функциям

Платформы совр ПК: в зав-ти от аппаратного и программного обеспечения выдел 3 платформы ПК, им разн ОС, процессоры и конфигурацию 1)WINIEL-80% всех ПК, исп в бизнесе, для обработки текстов, раб с большими баз данных, для телекомм.2) apple- исп в переобич издательствах, для созд разл мультимедийных приложений3)сеперкомпы- мощные многопроцессорные компы, мощные профессиональные графич станц серверы 4)Power PC- исп для хранения большого кол-ва инфо, для созд или обработки видео, реш задач в обл искусственного интеллекта. В посл вр набл тенденция сближ между компами 1 и 2 платформ и через некот вр они могут стать совместимыми. Осн классификации:I-по размеру и весу;1)напольные (3 платформа), S= 150м22) настольные3)портативные, вес 1-4 кг, толщина 18 мм, им все ф-ции и конструкц узлы как и у настольного компа., не уступ ему, могут раб от сети и от батареи до 24ч; 4)карманные- вес 200гр, с цв жк монитором, проблема- клава, где для каждой клавиши до 4х ф-ций, есть клавы с сенсорным экраном, нет винчестера, все По запис во внутрен память (ИЗУ) и ОС, усечён версия прикладных программ, роль внешних жискет вып флешки, раб от батареи , им сенсорный экран с ф-цией увелич экрана;5)смартфон- моб тел, раб на своей ОС, можно исп для раб в и-нете.6)коммуникатор- карманный комп+телефон, позв раб с эл табл, текстом и графикой, им сенсорный экран с ф-цией увел экрана. II- по ф-циям /назнач:1)бизнес компы облад выс производит для вып стадартных офисных прилодений, могут раб автономно в сети;2) промышл компы кот исп на производстве, чаще всего в оч вредных усл, могут раб оч выс и низ Т, под водой, в космосе, выдерживают сильные удары и вибрацию, исп в хим, нефтепер пром-ти из-за большой надежности в крупных нац банках;3) супер комп многопрофессорные, быстродействие- более 1 трл операций в сек, осн прим в сейсмологии, метеорологии, яд физике, для созд сложной двумерной, трехмерной графики, стоимость более 100 млн долл, сущ в единичных экземплярах, 4)дом компы- дл самообраз, развл, ведения дом хоз-ва, дом частный бизнес; 5) нейрокомпы – многопроцессорны, отлич по архитектуре и по принц хран данных, иногда хран не в отдельных ячейках, а в нкейросетях, нет разделения на акт процессор и пассивную память, исп для обработки и анализа видеоизобр, для распозн текста и речи для созд контекстной рекламы в нэте и фильтрауии спама, для созд систем безоп и видеонабл.

10. структура ПО, системное ПО

ПО- совок пр-мм, предст на машинных яз. ПО делится на 3гр: системное ПО (25%), прикладные проги (50%), прикладные инструм средства (25%). Системное ПО- все проги кот исп для раб обслуж ПК. ОС, проги-оболочки, утилиты, дрвйвера. Самая гл системная прога- ОС без кот ПК не раб. ОС- осн управляющая прога, исп-щая для координации внутр ф-ций ПК и для контроля выполнения всех операций в компе, загруж при вкл компа. Функции ОС: упр раб компа и его ресурсами, запуск проги на выполнение, даёт пользователю удобный интерфейс- способ общения компа и пользователя. Классификация ОС: по интерфейсу 1)текстовые(простые)- рассчитаны на 1го пользователя, однозадачные,16разрядные, несетевые, раб неудобно. 2)графические- им графич интерфейс с наличием окон, пинтограмм, кнопок и упр-ие происх мышью; многопользовательские, 32разрядные, сетевые-виндовс 95,98,2000, миллениум,хр,виста.3)мультимедийные- для мощных многопроцессорных компов, позв-т созд мультимед базы данных,64разрядные, многозадачные(до 100 приложений);4) соц интерфейс- предпол-тся, что в буд будут разраб ОС кот занчительно упростят раб пользователя с ПК- должны будут поодерживать интерактивный ввод, вывод инфо- двусторонний диалог на естеств яз. о режиму раб: 1)автономные- раб на отд ПК;2)сетевые- при созд сетей, по архитект их можно класифицир:а)клиент-клиент- где все ПК равноправны;б) клиент-сервер- архитектура корпаративных и глобальных сетей. Осн ф-ции сетевой ОС: связ все ПК и переферийные устройсвтва в сети, координир все ф-ции компов и переферийных устройств, обеспеч защищ доступ к данным и перефер устройствам. Утилиты- проги, кот пом раб пользователю с системой и повыш ее эффективность: внутр, внешн. Внутр: проверка диска на логич ошибки, дефрагментация диска, уст и уд прог и оборудования. Внешн: уст доп-но на комп: антивир, архиваторные. Вирус- прога кот может созд свои копии и внедрять их в файлы, изм сост дисков и прин др вредоносные действ. Проги-драйвера исп для упр устройствами компа.

11Прикладныепрограммы.Прикладныеинструментальныесредства Прикладные программы – программы, решающие специфические задачи для выполнения видов работ -деловые-прикладные программы – 60%,домашние прикладные программы

Деловое ПО:•Экономические (бухгалтерские, складские, кадровые, финансовые, аналитические)

•Офисные (системы управления документооборота, автоматизации делопроизводства)•Лингвистические программы (распознавание речи и синтез речи, автоматическое чтение текста, словари)

На смену офисному ПО – электронные офисы

Microsoft office•Текстовый процессор Word•Табличный процессор Excel•Компьютерная графика PowerPoint•Профессиональная графика Photoshop•Почтовая программа•Web-браузер Internet Explorer•Для создания web-страниц•Для создания бизнес-приложений

Преимущества электронного офиса:•Надёжность и безопасность •Инструменты совместной и коллективной работы.СУБД – программа с помощью которой осуществляется управление данными в базе данных, а также доступ к ним•Настольные (более 20 видов) ориентированные на пользователя не умеющего программировать•Сложные

Основные направления развития офисного ПО:1.Создание сетевых версий офисного ПО

2.Совершенствование и интеграция технологий распознавания речи в рамках естественного речевого интерфейса3.Внедрение технологии интеллектуальной обработки текста, порождение текста, автоматическое составление документа.Лингвистическое ПО – программы, разрабатываемые совместно программистами и лингвистами по обработке текстовой информации, пониманию и порождению текста.Домашнее ПО включает: ведение домашнего хозяйства и развлечения, ведение бизнеса (контрактная система), система работы на дому, самообразование (словари, учебные курсы, виртуальные университеты, образовательные программы)

12Понятие о комп. Сети.Компоненты сети.Классификация комп.сетей по территориальному признаку 1.Компьютерная сеть – объединение нескольких компов таким образом, что они могут взаимодействовать друг с другом с целью совместного использования инфо

Компоненты компьютерной сети:•Аппаратные компоненты – сами компы, периферийные устройства, средства электр. связи, коммуникац-ое оборудование (концентратор ,Коммутатор –устройство, которое анализирует адрес компа-получателя. Маршрутизатор –устройство для соединения двух и более сетей, определяет в какую сеть идет инфо и далее она попадает на коммутатор или концентратор)•Прграммные компоненты – сетевая ОС, которая управляет переферийными устройствами, координирует работу компов, обеспечивает доступ к данным и коллективную работу пользователей; сетевой протокол; сетевые приложения.Сетевая ОС: серверная либо клиентска.Сетевые приложения = СУБД; прогр управления сетями и анализа работы в сети; программы сетевой защиты.По территориальному признаку: •Локальные•Корпоративные (региональная)•Сеть мирового масштаба или глобальная сетьПо доступу:•Открытые•Закрытые•С ограниченным доступом

Локальная сеть – сово-ость компов и других средств вычислительной техники, объединенных с помощью высокоскоростных кабелей и работающих под управлением настольной или сетевой ОС Возможности: совместное использование файлов и программ; обмен информацией; совместное использование переферичных устройств.Каналы связи:•Проводные (кабель типа витая пара, опто-волоконный, линии электропитания)•Беспроводная (, Bluetooth)

Рост беспроводных каналов связи•Мобильность•Срочность•Невозможность кабельной сети.Устройства для подключения к сети: сетевая карта, модем, концентратор или коммутатор.

Схема объединения компов и периферийных устройств в сеть – топология (звезда-соединение; общая шина – линейная цепочка из всех компов,; кольцо)Конфигурация сети:•Сеть без мощных компов-серверов – одноранговая сеть (клиент-клиент)

•С одним или несколькими компами-серверами – клиент-сервер

Корпоративные (Intranet) 1994г. Стив Телллем Intranet - -территориально-распределенная сеть, частная или корпоративная для хранения и передачи внутрифирменной и межфирменной информации, с использованием средств локальной сети и Internet.Основные возможности:1.Поддержание ежедневной фун-и организации (распространение приказов, объявлений) 2.Предоставление сотрудникам доступа к архивам и базам данных3.Коллективная работа сотрудников4.Доступ сотрудников к сети Internet.Основная структура – клиент-серверТипы серверов:•Сервер, обеспечивающий доступ к данным – файловый сервер• Сервер без данных•Коммуникационный сервер (почтовый, серверы чаты)

Каналысвязи:1.Тел. линии 2.Оптоволоконные3.Телевизионные (кабельные чаще всего)4.Спутниковая связ

13Основные ресурсы и услуги сети Глобальная сеть-Internet – это сеть использует высокоскоростные каналы связи для объединения компов, находящихся на значительном состоянии друг от друга.

Возможности глобальных сетей:1.Создание глобальной системы компьютерных телекоммуникаций и передачи данных2.Создание мирового информационного пространства3.Создание среды для творческого самовыражения человека4.Использование Internet в профессиональной деятельности (ведение совместных проектов, поиск работы, информация о себе, реклама, совершенствование профессиональной подготовки)5.Образование (дистанционное обучение, поиск информации для научной работы)1958 Эйзенхауэр в рамках обороны США созданы 2 организации – NASA и ARPA (агенство по перспективным исследованиям)1965 создана сеть ARPANET (состояла из 4 компов)1971 14 компов в сети1972 37 компов в сети1982 – правила работы в сети – TCP\IP1983 ARpANET разделяется на MILNET (военная сеть) и NSFNET (научная сеть)Хосты – компы, работающие в сети.1ое подключение в Беларуси в 1989 провайдер Unibel.1994 полная работа семи в Беларуси.2.Обязательное условие работы в сети – наличие IP-адреса IP-адрес – 32разрядное двоичное число, цепочка символов 0 и 1, которая точно определяет местонахождение компа.IP-адреса приводятся к виду десятичных чиселДля удобной работы с IP адреса – доменная система (поверх АйПи адресов записывается доменное имя).Имя домена – цепочка буквенных символов (аббревиатуры, полные слова), которые однозначно определяют конкретный комп. 2 типа доменов верхнего уровня: национальные домены (территориальная принадлежность: .by, .ru, .ua) и родовые домены (тип организации, где развернута сеть com, mil, edu, net, gov, org, info)IP-адреса обязаны с IP-протоколом.URL (универсальный адрес документа).URL-адрес имеет структур.Протокол://комментарий домена/ путь к файлу/имя файла http://www.microsoft.com.Большинство документов создаются по гипертекствовой технологии (world whole web)Технология всемирная паутина создана в 1989 в европейском ядерном центре под руководством Тима Бернерса Ли Гипертекст – нелинейный, непоследовательный текст, метод представления текста, изображения, звука, видео, связанных друг с другом произвольной ассоциативной связью. Гипертекстовый документ расположен на web-странице. Web-страница создана с помощью технологии www.Web-страницы – web-сайт (группа web-страниц, одна тема, общий стиль оформления, взаимные гипертекстовые ссылки) Web-портал – сайт для очень широкой или очень узкой аудитории или выполняющий некоторые специфические функции.Гипертекстовый документ имеет формат .html3.Для навигации в сети существуют специальные клиентские программы – web-браузер.1й браузер появился в 1994, отображал только текстовую информацию.IE, Opera, Mozila, Firefox.Основные возможности браузера:1.Загрузка страницы по введенному URL-адресу2.Перемещение по гипертекстовым ссылкам3.Ускорение процесса загрузки страницы4.Сохранение web-страницы целикомДоступ к сети: выход в инет

MCI-TELEKOM между провайдеровDEMOS (METROCOM) один из российских провайдеров

14 ИТ в 3-ем тысячелетии.Вирт.Реальность

предпосылки появления виртуальной реальности:1944 – первый авиационный имитатор полетов.1956 – экспериментальный театр «Сенсорама» м Хейлика.1972 – имитатор авиационных полетов с использованием компа.1972 – М. Крюгер ввел термин «искусственная реальность».1985 – Дж. Линьер ввел термин «виртуальная реальность»Виртуальная реальность – компьютерная система, применяемая для создания искусственного мира, пользователь ощущает себя в этом мире, может быть управляем в нем и может манипулировать его объектамиУровни виртуальности:1.Телевидение2.Компьютерные игры3.ИнтернетАппаратные средства1.Современный компьютер с быстрым процессором2.Цифровые очки3.Шлемы 4.Перчатка 5.Мышь, джойстик, рульОбласти применения:1.Тренажеры для пилотов2.Моделирование боевых операций3.Компьютерные игры4.Медицинские исследования5.Архитектура6.Исследования сейсмических данных7.Тренировки спортсменов8.Создание в кино виртуальных декораций9.Палеонтология10.МоделированиеТипы технологий, используемых в виртуальной ситсеме:1.«окно в мир» - для созерцания.2.«видеоналожение» - в телевидении.3.«Полное погружение» с использованием трехмерного изображения, звука и тактильных ощущений.4.«дистанционное присутствие» - медицина.5.«смешанная реальность» - дистанционное присутствие + полное погружение.6.«виртуальная реальность второго лица» - для тренажеров

15 Назначение и возможности систем автомат.чтения текста Система авто чтения текста – прикладная программа, позволяющая преобразовывать текст с бумажного носителя (слайд\фотопленка) в электронный текстовый файл, который далее можно обрабатывать другими прикладными программами (машинного перевода).В 60-70е годы ученые из США Патрик Уинстон и Маврон Минский предложили смоделировать принципы распознавания предметов человеком на искусственные системы:1.принцип целостности 2 целенаправленности 3.адаптильности (способность к самообучению)4.в 1977 в Москве была создана одна из первых групп по созданию систем авто чтения текста, в дальнейшем она была преобразована в компанию ABBYY Softoan House, ее продукты – Fine Reader версий стандарт, профессиональную и рукописную (распознает рукописные тексты)система Cunei Form и ее организация Cognitive Technologies.1ые системы авто чтения требовали обучения распознаванию нового начертания, назывались мультифонтовые. Последние системы имеют правило начертания каждого символа и называются интеллектуальными или онтофонтовыми.основные возможности систем авто чтения текста:1.ввод печатных документов,подготовленных на разных принтерах2.распознавание всех шрифтов без обучения3.способность системы самообучаться и распознавать нечитабельные тексты на основе читабельных 4.распознавание текстов на неизвестных языках 5.распознавание таблиц, стандартных форм, ценных бумаг, штрихкодов, конвертов, чертежей схем 6.распознавание по сети 7.распознавание документа на сложном фоне 8.распознавание в фоновом режиме.этапы распознавания1ый - сканирование или получение графического изображения. В первых системах существовали трудности при сканировании: 1. На одной странице два и более шрифтов разного стиля и начертания. 2. Многоязычность текста. 3. Несколько колонок в тексте. 4. Встроенное графическое изображение.Второй – анализ и распознавание полученного изображения (каждого отдельного символа). Распознавание строится на основе трех стандартов: 1. Шаблонные или растровые классификаторы. Каждое графическое изображение поочередно сравнивается с эталоном в базе данных. Наиболее вероятный или менее отличающийся признается. 2. Признаковые классификаторы, которые анализируют не все изображение знака, а лишь некоторые признаки, которые вычисляются по формулам. 3. Структурные классификаторы, которые содержат информацию и правилах начертания или структуре.

В Fine Reader работают все три классификатора и имеется дополнительный четвертый – структурно-пятенный эталон, где изображение представлено в виде набора пятен, связанных парами

16.Аннотация и реферат:Позиц и логико-семант методы.Реферат-текст,к-й кратко выражает тему первичного докум,методы,цель результаты(размер в 2-3р меньше самого докум.);Аннотация-найкратчайшее изложение основного содерж первичного док(объем 150-200знаков).Составл аннотации и реферата с пом компа наз автоматич компрессией или сжатием информ либо автомат аннотированием и рефериров текста или машинным экстрагированием.Эти работы ведутся с к.50-хг.прошлого века.Первый в мире машин реферат был получен американцем(Генри Луном).В основе позиц метода лежит идея о том,что осн критерием значим предлож явл место предлож в исходн тексте.Выделяют 2 метода:-метод заглавия(считается,что осн содержание текста выраж заголовком и подзаголовком,поэтому словарь ключ слов сост из знаменат слов заголовков,процент правильности 30-40%);-метод локализации(работает для текстов опред.тематики;считается,что в таких текстах информ о цели фиксирована,точно также как инфо о методах и результатах.Для определ фиксир места проводится эксперимент,отбир и анализир множество текстов по одной тематике.На основе эксперимента пол данные,что о цели говорится,напр в 1,2 предлож 1 обзаца,в методах напр в 2,3 предлож 2 обзаца.На основании получ данных эти предлож выбир в реферат.Работает на 25-5%.Поэтому эти методы исп совместно и дают результат 70-75%.Логико-семант.исследуют структуру и семантику текста.первый реферат по этому методу был получен в сер70-хг.системой ADAH(Automatic Document Abstracting Method).Для работы такой системы созд словарь индикаторов.Каждому слову в таком словаре преписывают семантическ код(благородный,признательный-имеют отрицательный код,метод,гипотеза-положит).

17 Статистический метод авто реферирования текста Статистические считаются самыми объективными, однако они игнорируют полностью смысл. Генри Лун определил 2 условия, по которым предложения выбираются в реферат: 1) они должны содержатьчастотные знаменательные слова, 2) должны содержать больше таких слов и они должны находится на небольшом расстоянии друг от друга.Основные смысловые единицы машинных аннотаций и рефератов:•Ключевые слова (термин, относящийся к основному содержанию текста и повторяющийся несколько раз)•Ключевые словосочетания (словосочетания, которые содержат несколько ключевых слов)•Ключевые предложения (предложения, которые содержат 2 и больше ключевых слов или словосочетаний)Весь процесс авто аннотирования и реферирования осуществляется в следующей последовательности:1.Состасоставляет алфавитно-частотный словарь словоформ и абзацев2.Составляет алфавитно-частотный словарь словоформ текста путем объединения словарей абзацев (указываются абсолютная частота слова – число абзацев, где встречалось слово и номера этих абзацев).3 Из полученного словаря вычленяется словарь потенциальных опорных слов (отбрасываются служебные слова – артикли, предлоги и т.д.)4.Из полученного словаря вычленяется словарь главных или ключевых опорных слов, путем применения математических формул (например коэффициент важности)5.Определяются предложения, содержащие 2 и более ключевых слова.6.В реферат включаются все ключевые предложения в порядке их следования.7.В аннотацию включают все ключевые слова в порядке их следования посмле некоторой стандартной фразы или клише

18Перевод текста с помощю компютера(машин.перевод) МП делится на несколько этапов:

1. 1949 – середина 60-х. в 1954 в Джорджтауне был продемонстрирован первый машинный перевод с русского на английский девяти простых предложений по физике. В 1955 году в Москве создан центр перевода. В этом же году в СССР был продемонстрирован МП с французского на русский по математике. Первые системы МП были в основном бинарные. Алгоритм перевода привязан к конкретному лингвистическому материалу. В конце второго этапа специалисты пришли к выводу, что получить полностью МП невозможно2. середина 60 – конец 70 годов характеризуется углубленными теоретическими исследованиями в области языкознания и разработкой программ синтаксического и семантического характера. В это время создается целый ряд практических систем. Начала работать система SYSTRUN. В СССР – АРАП, ФРАП, ЯРАП, ИЕРПА.3. конец 70 – начало 90-х зарактеризуется ростом объема информации для перевода. Все системы на данном этапе многовариантны, поддерживали многоуровневый анализ текста, а также правила перевода не были жестко привязаны к лингвистическому материалу.4. начало 90-х – наше время. Выделяют стратегии МП:•Прямой бинарный перевод. Эффективность обеспечивается использованием больших автоматических переводных словарей и средств редактирования.•Трансформационный перевод. Основывается на предложении о невозможности установления прямой связи между языками. Исходный текст должен пройти при переводе ряд изменений•Перевод с помощью языка посредника. Связана с уровнем развития систем искусственного интеллекта, а также с использованием сложных баз знаний. Язык–посредник является языком использования баз знаний, где знания представлены в виде фреймов, семантических сетей и т.д.2.Виды систем МП. В наше время перевод разделяется:•Интеллектуальный (выполняет человек)•Авто перевод (характеризуется пред и постредактированием)•Автоматизированные системы: перевод компом с помощью человека (характеризуется интерредактированием – вмешательством внутри); перевод человеком с помощью компьютера. Первые такие системы назывались АРМами переводчика.В зависимости от переведенного материала различают:•Перевод художественной литературы•Научно-технический перевод.По форме представления перевода различают:•Письменный•Устный.По цели:•Практический перевод•Учебный перевод•Экспериментальный перевод•Эталонный перевод. В последнее время –машинный перевод:•Информативный•Профессиональный•Персональный

19 Структура сис-мы машинного перевода,назначение ее основных блоков

Системы машинного перевода:1.PARS – создана в Харькове. Содержит англо-русский и русско-английский модули. Особенность: анализатор многозначных слов.2.SILOD\MULTIS – Санкт-Петербург. Многоязычная система «отсюда и обратно». Особенность: использование базы данных, разработка морфологии, словарь оборотов или устойчивых словосочетаний.3.СОКРАТ – Москва. Включает модули:•Профессиональный модуль для перевода научно-технических текстов•Персональный для перевода отдельных слов или небольших текстов•Сократ-Интернет для перевода страниц в Интернет•Сократ-Словарь•Модуль для КПК4.PROMT начал разрабатываться с 1991. В 1999 французский журнал по тестированию систем признал PROMT одной из лучших систем МП.Система включает в себя модули:•PROMT – профессиональная среда для перевода•Электронный словарь•Модуль, позволяющий получать синхронный перевод страниц Интернет•Модуль, реализующий функции перевода в приложениях Microsoft Office•Программа, предназначенная для быстрого перевода отдельных слов и словосочетаний•Программа для быстрого перевода текста, предварительно сканированного в буфер обмена.Особенности PROMT:•Сохраняет форматирование исходного текста•Поддерживает все текстовые форматы файла•Позволяет резервировать слова, выделять незнакомые слова, поддерживает трансляцию. В последних версиях новая функция – ассоциированная память. По сути дела это первый шаг по внедрению новой технологии, известной на западе как ТМ……S.TRADOS – в основе принцип сбора и хранения фрагментов переведенных текстов на двух языках. Эти фрагменты хранятся в специальном накопителе переводов. Такие системы эффективны при переводе больших массивов похожей документации с большим количеством повторений.Международные системы МП:1.ПФЕ – на базе Джорджтаунского эксперимента. Стратегия – прямой перевод. В настоящее время используется в комиссии по атомной энергии.2.GETA – русско-французская система МП, разработанная в Гренобельском университете. Научно-экспериментальная система , использует язык-посредник.3.TAUM – предназначена для перевода английских текстов на французский. Система на основе трансформационного анализа. Схема системы МП АПС. Исходный текст Подсистема морфологического анализа Синтаксис анализа Синтаксис синтеза Морфология синтеза Текст перевод Синтаксические соответствия 3.Структура системы МП

Принципиальный алгоритм системы МП.Начало,Ввод данных,Морфологический анализ слов предложения,Синтаксический синтез.,Поиск синтаксической структуры,Морфологический синтез,Печать перевода,конец.подсистема морфологического анализа предусматривает, что каждое слово получает наборы лексико-грамматических признаков. Сущ 2 способа такого получения: выбор из словаря, анализ компом флексий и определение лексико-грамматических признаков.В подсистеме синтаксического анализа определяет функциональные сегменты предложения. Подсистема синтаксического синтеза определяет синтаксическую структуру выходного предложения при обращении к блоку синтаксических соответствий. Подсистема морфологического синтеза предусматривает грамматически правильное оформление перевода.

Установление соответствий возможно следующими 2 способами:1.Синтаксическая структура исходного языка один к одному переносится на перевод2.Синтаксическая структура перевода получается путем трансформации синтаксической структуры исходного языка. АПС может быть словарем словоформ или словарем основ. Выбор того или иного зависит от типа языка.

20 Определ.понятия «понимание текста комп.».Уровни автомат. Пониман.письм.текста

Прим компов во всех сферах чел жизни привело к возраст объема хранимой в них инфо представляемой в текстовой или устно-реч ф-ме на естественных яз-х. Стиль общения пользователя с ПК приобретает черты естесвенной коммуник в основе кот лежит письм и устн речь чела. Задачи автомат понимания и порождения текста и речи сложны. Для их реализации в ПК нужно вложить огромный объем знаний об окр мире, естесвен яз-х, а также оч сложное правило текста и речеобразования. Все это буд реализовано в буд, а пока ПК позв обрабатывать письм тексты и устн речь огранич-ю только конкретной предметной областью. Речемыслит деят-сть чела оч сложный и неизуч до конца вид деятельности поэтому нельзя гов о его полном моделировании. Сущ разные точки зрения на проблему комп понимания. Выдел разные ур понимания, построены разн сис-мы способн понимать текст. Понимание в сис-х сод-х фрагменты статистич мира (научно-технич лит-ра)- извлеч из текста наиб сущ с т зрения ПК инфо. Получ в рез понимания инфо может выполнять базу данных комп сис-м или м б пересдана пользователю. Под передачей им в виду способность ПК отв на вопр пользователя отност-но событий, фактов, опис в исходном тексте в виде связанного текста а не отд слов или предлож. В общем плане согласно совр теориям автомт понним текста ПК понял текст еди он может:1)кратко излож его сод(аннотация, реферат)2) отв на вопр к тексту;3)на основе текста нарис картинку/схему4) привед в тексте свед-я предст в иной ф-ме(табл, график, даграмма);5)создать текст пер-lf$6) сравнить сод текстов и выдать инфо что общего и какие различия7) путем анализа текстов извлечь такие знания кот можно поместить в нек базу знаний. Можно выдел след ур автомат понимания:1) морфологич,2) синтаксич,3)семантич,4)гиперсинтаксич (семантич связи между предлож текста). Комп сис-ма поним текст должна им в своей базе знания: о яз, реальном мире, правила исп знаний о яз, правила и знаний о фрагентах реального мира, знания и исп сис-му желающ получить от ПК некот понимание текста.

21 Типы автоматического понимания текста

1) Понимание-узнавание - комп узнает например морф структуру каждого слова, проводит синт анализ предложения

2) П-уподобление - Комп должен иметь знания о языке и правила использования этих знаний, находит в памяти ответы на вопросы

3) П-прогнозирование - Комп должен иметь знания о языке и правила использования этих знаний и знания о предметной области. Комп может определить какой объект или событие предметной области соответствует отдельным фрагментам текста

4) П-объединение - в базе знаний - знания о языке и мире, правила исп этих знаний. Объединяя все виды знаний комп должен уметь сделать выводы и объяснить почему он пришел к такому выводу.

5) П-объяснение - включает знания о целях, намерениях и проф. компетенции юзера

умение объяснить процесс понимания конкретно для юзера №22 Автомат порождение письм.текста:определение,этапы,общ.структура

.Програмамми порождения текстов с пом ПК исследователи с 70х. до сих пор нет единой теории текстообразования.Находится на стадии становления. Не может быть создана единая теория порождения текста. Осн причина- неоднозначно предел понятия текст. Создатели диалоговых сис-м под текстом понимают любую реплику сост-ю из нескольких слов или предложений. Создатели сис-м генерации метеосводок под текстом понимают некоторую таблицу. Для создающих инстукции текст это цепочка несвяз предлож. Уставлено что процесс текстообраз-я сост из 2х этапов:1)стратегич (решение «что писать»)2)тактического (решение «как писать»). Результатом выполнения 1ого этапа должно стать семантическое представление буд текста. Результатом вып 2ого этапа должен стать сам текст в языковой ф-ме. Несмотря на разногласия исследователи пришли к выводу что в сис-х автопораждения текста должны быть представлены 3 взаимосвяз компонента.1)обложка,2)планировщик3)лингвистич реализатор. Оболочка определ назнач порожд сис-мы. Это м б обуч комп сис-ма, сис-ма генерирующ комменты ПК в виде текста , экспертная сис-ма, сис-ма моделир тесты стихов. В оболочке также сод вся база знаний кот сост из 2х частей: нелингвист(предметной), лингвистич(кот вкл формализ сведения о яз на кот генерир текст)- списки орфем, словарь с лексикой, синтакс структуры предлож, семантико-синтакс. Планировщик вып след действия:1)опред инфо кот должна быть представлена в тексте,2) определен порядок следования абзацев в тексте,3) осущ языковое оформление взаимосв предлож в тексте,4)построение синтаксич структуры предлож,5)выбор соотв лексики. Все эти задачи планировщик реш с опорой на оболочку. Лингвистич реализатор обеспеч грамм правильность порожден-го текста и понимает все окончат синтаксич и морфологич действия.

23.Виды комп сис-м автоматич порождения письмен текста:

1.Понимание узнавания: комп сис-ма должна им знание только о яз. Сис-ма узнает морфологич структуру каждого слова в предл.,проводит синтаксич анализ, может узнавать в исходном тексте ключ сл, сл сочит и предлож;2.Понимание уподобления: ПК им знания о яз и правила исп-я этих правил. Сис-ма понимает текст, если она может отв на ? по тексту. Пк просто находит ответы в своей базе знаний, ранее занесенные челом.3.Прогнозирование: поним текстов достаточно узкой предметной области: комп сети, генная инженерия…ПК им знания о яз, правилах и предметной области. Сис-ма поним объект, если она может определить какой объект или событие предметной области соответствует отдельным фрагментам действий.4.Объединение: все 1ые 3 типа знаний +правила исп-я предметной области. Объединяет все виды знаний комп. Сис-ма делает выводы, умозакл, объясн почему она сделала тот или иной вывод.Сегод проблемы автоматич понимания текста реализованы след комп сис-ми:автоматич индексироание,аннотирование, рефериров, пер текста ,информационные, информац-поисковые сис-мы,экспертные сис-мы, выступ в роли высокопрофесс специалиста какой-то предметной области.

24. автоматич распознавание устной речи

Проблемой распозн устной речи занимаются более 60лет, до сих пор эти проблемы в полном объеме не решены. Распознование речи ПК распознавание, кот. Восприятию речи челом в любых условиях и при обшении с люб челом.Решению проблемы распознав-ие устноц речи мешают след факторы:1) в наст вр не сущ четких теор представлений, кот списывали бы весь комплекс преобраз-й, осущ-х не челом при переработке речи.2)границы слов различны, соседние звуки влияют др на др, изм звук-е харак-ки, знаменательные слова произнос отчетливо в то вр как ф-ции слова могут выговариваться нечетко и даже могут исчезнуть.3)в голосе говорящего чела всегда присутствует экстралигвистич инфо, свидетельств о его особом эмоц-м и психологич сост-ии указ-ая на его пол, возраст, национальность, сост здоровья.4) в процессе реч общения, кроме исп слов большое знач им паралингвистич ср-ва коммуникации (х-ки голоса чела, кинессика: жесты, мимика; проксимика: коммуникация на расстоянии. Автоматич распознавание речи может осущ-тся при наложении определ –х ограничений на процесс распознавания: распознавание изолированного произнесения слов, распозн речи с предварит настройкой голоса конкретн пользователя, распозн речи с опорой на небольшой заранее определённый словарь. Промышленно-реализов сис-мы распознавания устной речи условно делятся на 4 группы:*ср-ва речевого управления(компом)*ср-ва диктовки, позвол-е голосом вводить текстов инфо.*информац-справочн сис-мы, раб-ие в диалоговом режиме в кач автоответчика*ср-ва индентификации чела по образцу речи.

25. синтез устной речи с пом компа

сегодня сущ много синтезир устройств, кот могут озвучить введенные в ПК текст или произнести фразы. Сего сущ 3 осн метода автоматич синтеза речи:1) кодирование (запись в двоичной сис-ме звуковых сигналов с их последующем восстановл; недостаток этого метода ещё сост в том что для хран реч сигналов в их непосредственной ф-ме нужна память значительного объема. Словарь должен был быть слишком велик. 2)фонетич синтез речи или акустич моделирование. Возможность им неогранич словарь. Поскольку реч создается из отдельно синтезируемых звуков, правльно расставить нужные звуки Пк может произнести любое слово.3) математич моделирование. (словарь как и при кодировании создается с учётом говорящего.Но в данном случае в память запис-тся не слова, а производится выделение числовых хар-к звуков речи и интонации фраз.-общее понятие о базе данных-модели представления данных--СУБД (сис-ма упр-я базами данных)-лигвистич информач ресурсы, осн-е понятия.Виды лингвистич ресурсов, фонетические и лингвистич ресурсы.

26.Сравнен принципов обраб инф чел и комп.

Возм совр комп. –Ввод инфо(комп лучше);-память;-скорость обработки инфо(чел 20-30 операций в сек,нетренир чел 3-7);-вывод информ(16-32 стр в мин-комп:120-360 слов в мин-человек).Чел зап инфо и рассладывает ее по полочкам памяти на основе ассоциативного принципа(по схожести, по различию, часть-целое). Машина же зап инфо путем ее последовательного заполнения рядом расположенных свободных байтов. Микропроцессор в ПК явл тем устройством, кот в миллиарды раз превосходит мозг чела по скорости перераб инфо, однако по принципу своей раб, микропроцессор значительно уступает мозгу чела. Комп был изобретён как ср-во вычисления, однако постепенно к его возможностям добавлялись и др ф-ции.Сег уже не возможно сходу перечислить все сферы применения компа. Наиб остроумным определением назначения компа явл следующее: «Комп есть ср-во реш тех задач, кот чел в состоянии ему поручить на данном уровне развития техники».Комп графика сыграла важнейшую роль в развитии вычисл техники, определив 10ки направлений исп-я совр ПК. Благодаря 3Д-графике, археологи смогли воссоздать древнейшие умершие города; палеонтологи увидеть умерших жив; криминалисты создать фотоработы людей, нах в розыске, идентифицир угнанные авто. В наст вр ЭВМ задействована практически во всех отрослях производства, науки и обороны стран.Чел стремиться макс обдегчить себе раб во всем, хочет чтобы ЭВМ делала за ним практически всю раб, а для этого пытается разработать более совершенные машины.ЭВМ нов поколения- это машины недалекого будущего. Осн их качеством должен быть выс интеллект уровень. Это будут компы с искусственным интеллектом.В них будет возм ввод голоса, голосовое общение.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]