Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
prikladnaya.doc
Скачиваний:
270
Добавлен:
31.05.2015
Размер:
347.65 Кб
Скачать

1 Этап: Выбор материала-корпуса языковых данных.

Классический пример корпуса данных для конетент-анализа — газетные публикации за определенный период времени или приемы политических партий в разные периоды существования партий или тексты определенного политического деятеля.

2 Этап: Выбор концептуальной переменной и определение ее значений — языковых репрезентантов в тексте

Например, концептуальная переменная «армия» в выступлениях Иванова

3 Этап: Выбор единицы кодирования

Единицей кодирования может быть текст, фрагмент текста, абзац, предложение, отдельное слово и словосочетания.

Выбор единицы кодирования зависит от объема и характера корпуса данных. Чем больше корпус данных, тем крупнее могут быть единицы кодирования. Если корпус насчитывает тысячи статей, то единицей кодирования может являться статья

4 Этап: Отбор кодировщиков и формулировка инструкций по кодирования

Ручной контент-анализ требует точной формулировки инструкий. Кодировщики должны руководствоваться едиными принципами кодирования. При компьютерном контент-анализе подготовка инструкций почти заменяется перечислением языковых форм выбранной концептуальной переменной.

Перед кодировкой выбирается один из двух видов: жесткий или мягкий

При жестком кодируются только явные языковые значения концептуальной переменной в тексты, то есть когда языковые значения представлены эксплицитно

При мягком варианте кодируются не только явные, но и неявные, имплицитные языковые репрезентанты.

5 Этап. Кодировка данных

Записываются все языковые репрезентанты

6 Этап.

Осуществляется подсчет данных и интерпретирование результатов

Выделяется содержательный и структурный контент-анализ.

Содержательный контент-анализ основан на выделении концептуальной переменной и исследовании ее значений (репрезентантов).

При структурном контент-анализе также выделяется концептуальная переменная, но и ее репрезентанты изучаются с точки зрения формы. Например, сколько места посвящается им в прессе

Структурный контент-анализ по сравнению с содержательным проще в разработке и проведении, однако он дает не окончательный результат, а полуфабрикат, который требует дальнейшего изучение и содержательной интерпретации.

Контент-анализ часто используется в политической лингвистике, политологии, для изучения когнитивных установок автора текста — его отношения к тем или иным событиям, понятиям, ценностным категориям и т.д.

Типичный пример использования контент-анализа, исследования, проведенные Веббером, который изучал приемы республиканской и демократической партий по отношению к концептуальной переменной «свой-чужой». Он сделала вывод, что в примерах чужое преобладает над своим. Это говорит о конфликтности политического дискурса, о существовании проблем в межпартийных отношениях. Даже при отсутствии внешнего конфликта преобладание в примерах чужого указывает на существование внутреннего конфликта.

12. Перевод как прикладная лингвистическая дисциплина. Машинный пе­ревод

Термин перевод многозначен. С одной стороны, он обозначает де­ятельность, заключающуюся в передаче содержания текста (в широком понимании) на одном языке средствами другого языка, а с другой — сами результаты этой деятельности.

Наука о переводе (англ. translation stud­ies; нем. Ubersetzungswissenschaft или Translationswissenschaft) включает не­сколько направлений, среди которых выделяются теория перевода, анализ перевода, методика обучения переводу. Особое место занимает машинный перевод — научная и одновременно технологическая дисциплина, связан­ная и с наукой о переводе и с компьютерной лингвистикой. Как и мно­гие другие дисциплины прикладной лингвистики, перевод по существу междисциплинарен, будучи связан не только с лингвистикой, но и с ли­тературоведением, когнитивными науками и культурной антропологией.

Междисциплинарность теории перевода и ее практических при­ложений указывает на то, что перевод является не чисто языковым, а довольно сложным когнитивным феноменом. Переводя с одного языка на другой, человек использует как свои языковые знания и способности, так и самые разнообразные экстралингвистические знания (о физической природе мира, об обществе и его культуре, о ситуациях, в которых был порожден переводимый текст и будет восприниматься его перевод и т. д.), причем этапы понимания и синтеза текста принципиально различаются.

Перевод по полному пути (сплошные жирные стрелки) предполагает, что в его ходе происходит построение некоторого концептуального (понятийного) представления содержания текста, предположительно не зависящего от особенностей входного и выходного языков и учитывающего всю полноту знаний, которые в связи с конкретным текстом могут быть привлечены перевод­чиком (или переводящим устройством) для максимально более глубокого понимания текста и максимально адекватной передачи его содержания на другом языке. Сокращенная схема перевода (жирные пунктирные стрелки) предполагает установление переводных соответствий между смыслами текстов на язы­ке-источнике и языке-цели; при этом смыслы сохраняют особенности этих языков, и никакого языка-посредника не постулируется. Наконец, при краткой схеме перевода (жирная штрих-пунктирная стрелка) перевод­ные соответствия устанавливаются непосредственно между выражениями языка-источника и языка-цели (скажем, при переводе этикетных формул типа Дамы и господа или Добрый день!). Полную, сокращенную и краткую схему перевода можно назвать когнитивными стратегиями перевода, которые выбираются когнитивной системой человека в зависимости от характера коммуникативной ситуации и ее этапов. Архитектура си­стем машинного перевода в какой-то мере отражает эти когнитивные стратегии — см. ниже «прямой» перевод, перевод через язык-посредник, перевод через универсальный семантический язык.

Виды перевода:

По характеру переводческой деятельности традиционно выделяют­ся устный и письменный перевод. Для устного перевода важ­нейшим параметром является фактор линейного развертывания текста во времени (со столь релевантными последствиями, как невозможность «заглянуть вперед» или «вернуться и исправить»), что неминуемо влечет за собой снижение требований к точности и элегантности. . В рамках устного перевода выделяется синхронный и последовательный перевод. При синхронном переводе звучащий текст переводится практически одновременно с его произнесением максимально допустимое запаздывание порядка 10 секунд). При последовательном переводе переводчик прослушивает довольно значительный фрагмент текста — до 15 минут, — фиксирует его в той или иной форме и переводит на соответствующий язык.

По другому основанию перевод разделяется на односторонний (унивелатеральный) и двусторонний (билатеральный). Односторонний перевод осуществляется только с языка-источника (обычно обозначаемого L1) на язык-цель (L2), в отличие от двустороннего, предполагающего перевод; с L1 L2 и наоборот. В обычном случае двусторонний перевод является последовательным, то есть используется в ситуации переговоров и т. п.

Содержательная сторона перевода включает, однако, множество дру­гих параметров, по которым может проводится классификация. Так, по основанию цели выделяются и другие типы перевода: (а) «по­словный» перевод, в результате которого создается подстрочник, (б) бук­вальный перевод, называемый в англоязычной традиции grammar transla­tion, (в) филологический перевод, называемый также «документальным», и (г) адаптивный (и как частный случай реферативный) перевод [ReiB 1995, S. 21-23].

Машинный перевод, выполняемое на компьютере действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия. Современный машинный, или автоматический перевод осуществляется с помощью человека: пред-редактора, который тем или иным образом предварительно обрабатывает подлежащий переводу текст, интер-редактора, который участвует в процессе перевода, или пост-редактора, который исправляет ошибки и недочеты в переведенном машиной тексте.

Для осуществления машинного перевода в компьютер вводится специальная программа, реализующая алгоритм перевода, под которым понимается последовательность однозначно и строго определенных действий над текстом для нахождения переводных соответствий в данной паре языков L1 – L2 при заданном направлении перевода (с одного конкретного языка на другой). Система машинного перевода включает в себя двуязычные словари, снабженные необходимой грамматической информацией (морфологической, синтаксической и семантической) для обеспечения передачи эквивалентных, вариантных и трансформационных переводных соответствий, а также алгоритмические средства грамматического анализа, реализующие какую-либо из принятых для автоматической переработки текста формальных грамматик. Имеются также отдельные системы машинного перевода, рассчитанные на перевод в рамках трех и более языков, но они в настоящее время являются экспериментальными.

Наиболее распространенной является следующая последовательность формальных операций, обеспечивающих анализ и синтез в системе машинного перевода:

1. На первом этапе осуществляется ввод текста и поиск входных словоформ (слов в конкретной грамматической форме, например дательного падежа множественного числа) во входном словаре (словаре языка, с которого производится перевод) с сопутствующим морфологическим анализом, в ходе которого устанавливается принадлежность данной словоформы к определенной лексеме (слову как единице словаря). В процессе анализа из формы слова могут быть получены также сведения, относящиеся к другим уровням организации языковой системы.

2. Следующий этап включает в себя перевод идиоматических словосочетаний, фразеологических единств или штампов данной предметной области (например, при англо-русском переводе обороты типа in case of, in accordance with получают единый цифровой эквивалент и исключаются из дальнейшего грамматического анализа); определение основных грамматических (морфологических, синтаксических, семантических и лексических) характеристик элементов входного текста (например, числа существительных, времени глагола, синтаксических функций словоформ в данном тексте и пр.), производимое в рамках входного языка; разрешение омографии (конверсионной омонимии словоформ – скажем, англ. round может быть существительным, прилагательным, наречием, глаголом или же предлогом); лексический анализ и перевод лексем.

3. Окончательный грамматический анализ, в ходе которого доопределяется необходимая грамматическая информация с учетом данных выходного языка (например, при русских существительных типа сани, ножницы глагол должен стоять в форме множественного числа, при том что в оригинале может быть и единственное число).

4. Синтез выходных словоформ и предложения в целом на выходном языке.

Исследования по машинному переводу за свою пятидесятилетнюю историю переживали как подъемы, так и спады. В начале 1960-х годов завершился первоначальный эйфорический этап в развитии МП, чему в сильнейшей степени способствовала публикация так называемой «Черной книги машинного перевода» – доклада Специального комитета по прикладной лингвистике (ALPAC) Национальной академии наук США, в котором была констатирована невозможность создания в обозримом будущем универсальных систем высококачественного машинного перевода. Следствием этой публикации было сокращение финансирования и общее снижение интереса к проблематике МП, однако полного сворачивания исследований, в особенности теоретических, не произошло.

Новый подъем исследований в области МП начался в 1970-х годах и был связан с серьезными достижениями в области компьютерного моделирования интеллектуальной деятельности. Соответствующая область исследований, возникшая несколько позже МП (датой ее рождения обычно считают 1956), получила название искусственного интеллекта, а создание систем машинного перевода было осмыслено в 1970-е годы как одна из частных задач этого нового исследовательского направления.

Перспективы развития машинного перевода связаны с дальнейшей разработкой и углублением теории и практики перевода, как машинного, так и «человеческого». Для развития теории важны результаты сопоставительного языкознания, общей теории перевода, теории закономерных соответствий, способов представления знаний, оптимизации и совершенствования лингвистических алгоритмов. Новые и более эффективные словари с необходимой словарной информацией, строгие теории терминологизации лексики, теория и практика работы с подъязыками помогут повысить качество перевода лексических единиц. Формальные грамматики, ориентированные на перевод, дадут возможность оптимизировать алгоритмы нахождения переводных соответствий в данной коммуникативной ситуации, которая может быть описана в рамках соответствующих прикладных теорий представления знаний. Наконец, новые возможности программирования и вычислительной техники также будут вносить свой вклад в совершенствование и дальнейшее развитие теории и практики машинного перевода

Классификация систем АП

1. Системы МП: - программы, осущ-щие полностью автоматиз-ный пер-д. Главным критерием программы явл-ся кач-во пер-да. + для польз-ля важными моментами явл-ся удобство интерфейса, лёгкость интеграции программы с другими ср-вами обработки док-тов, выбор тематики, утилита пополнения словаря. С появлением Internet основные поставщики с-тем МП включили в свои продукты Web-интерфейсы, обеспечив при этом их интеграцию с остальным прогр-ным обеспечением и Эл-ной почтой => примененение мех-мы МП для пер-да Web-страниц, Эл-ных писем и онлайновых разговорных сеансов.

2. Системы с функцией Translation Memory (TM): предоставляют средства для так наз-го Machine Assisted Human Translation (MAHT) – пер-да, выполн-го ч-ком с помощью машины. 1начальное предназначение с-тем ТМ - облегчение работы переводчиков при локализации программных продуктов и создании терминол-ких БД, в дальнейшем с-мы стали развиваться как вспомог-ный инструментарий перев-ка.

3. Контролир-мый яз и МП на основе базы знаний: в с-мах на основе контролир-мого яз реализован переход от свободного входного яз к контролир-му входному яз. Контроль входного яз предусм-ет опред-ные ограничения лексики, грам-ки, сем-ки. Контролир-мый входной яз используется для упрощения выражений исходного т-та, чтобы повысить кач-во пер-да. – с-ма KANT.

4. On-line перев-ки: службы онлайнового пер-да выполняют перевод прямо в окне браузера, не требуя установки программы на компьютер польз-ля. Достаточно большое кол-во ссылок на бесплатные сервисы МП с указаниями направлений пер-дов.

5. Словари on-line - LOGOS ONLINE DICTIONARY (англ, фран, нем, исп, итал, чешский), TRADOS MultiTerm…