Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
доклад по курсовой.doc
Скачиваний:
5
Добавлен:
23.11.2018
Размер:
86.02 Кб
Скачать

2.2. Классификация ошибок

Учебные корпуса особенно полезны, когда они размечены на ошибки, т.е. когда все ошибки в корпусе аннотированы с помощью стандартизированной системой разметки.

Разметка ошибок очень трудоемкая и занимающая много времени задача. В тоже время, аннотированный корпус обеспечивает бесценными средствами в исследовании изучаемого языка.

Для исследования любого учебного корпуса обычно рассматриваются способы классификации ошибок, выбирается методика их кодирования в корпусе для последующей автоматической либо ручной разметки (error tagging), а также методика количественного автоматизированного подсчета ошибок по типам, что позволяет провести их всесторонний лингвистический и лингводидактический анализ.

Единой классификации для анализа учебных корпусов нет. Это можно увидеть на примерах разных учебных корпусов. Например, арабские лингвисты Дулай, Берт и Крашен предлагают две основные описательные таксономии ошибок:

  • ошибки, основанные на языковых категориях (общие, такие как морфологические, лексические и грамматические и более конкретные, такие как вспомогательные средства, пассивные и предлогов);

  • ошибки с упором на изменение поверхностной структуры (например, опущение или нарушение порядка слов).

В таблицах 1 и 2 представлены примеры фонетических и орфографических ошибок на примере учебного корпуса Лонгман.

В приложении 1 представлена классификация ошибок Учебного Переводного Корпуса MeLLANGE. В приложении 2 - классификация ошибок Корпуса Текстов Петербургских Школьников.

Изучив, таким образом, классификацию нескольких корпусов, мы пришли к выводу, что многие авторы корпусов делят ошибки на языковые и содержательные. В группе языковых ошибок можно выделить следующие классы: синтаксические, лексические, морфологические, грамматические, орфографические. В группе содержательных ошибок можно выделить такие классы как порядок слов, тавтология, опущение слова или, наоборот, прибавление ненужного слова и др.

2.3.1 Корпус Текстов Петербургских Школьников

Для полного представления того, из чего и как должен строиться учебный корпус, в качестве примера нами был рассмотрен Корпус Текстов Петербургских Школьников.

Объём корпуса составляет 38.122 словоупотребления Сбор материала проходил в школах Санкт-Петербурга и осуществлялся в рамках педагогической практики студентами 4 курса филологического факультета РГПУ им. А. И. Герцена. В качестве информантов (авторов текстов) выступили 78 учащихся 7, 9-11 классов. Родной язык информантов – русский. Возраст учащихся - от 13 до 17 лет.

На данном слайде представлены основные характеристики корпуса.

На данном сервисе представлены тексты петербургских учащихся, разделенные по типам и жанрам и синтаксически размеченные.

В корпусе есть возможность свободного наполнения, т.е. любой пользователь может разместить в нем свой текст.

Но для того, чтобы разместить свой текст в корпусе, нужно его самостоятельно разметить.

Разметка ошибок в КТПШ была выполнена полуавтоматическим способом с помощью программ Microsoft Word и Advanced Auto Renamer.

Для того, чтобы разместить размеченный вариант текста нужно следовать предложенной в корпусе инструкции.

Практически все уже существующие на данном сервисе тексты размечены на ошибки. На слайде примеры размеченных на ошибки текстов.

Кроме разметки на ошибки, сервис предлагает пользователю разметить текст синтаксически. Для синтаксической разметки текстов корпуса предлагается использовать сервис Machinese Syntax. Для того, чтобы разместить размеченный вариант текста нужно также проследовать предложенной инструкции:

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]