- •Прагматический признак.
- •2) Коммуникация
- •3) Дисциплинарный подход
- •4) Семантика
- •7) Специфика данных и машинная обработка
- •5)Индивидуальные информационные системы
- •6) Массовые информационные системы
- •8)Массивы
- •10) Онлайн тестирования
- •11) Обучающие программы
- •13)Microsoft Word
- •14) Microsoft PowerPoint
- •15) Adobe reader
- •16) Adobe Fine reader
- •17) Структура интернета
- •18) Системы поисков в Интернете
- •19)Сайты предоставляющие филологический интерес
- •20) Пакет цифровой обработки звучащего текста
- •21) Электронные словари
- •22) Контекстные словари
- •23) Promt
- •26) Call
6) Массовые информационные системы
Интернет как фактор информационного обмена включает в себя ряд функций, привлекательных с точки зрения филологического и лингво-филологического взаимодействия. Интернет как источник теоретической информации интересен с точки зрения наличия на серверах сети теоретических данных филологического характера, особенно новейших разработок, статей и монографий отечественных и зарубежных авторов и издательств. Также Интернет может служить полем теоретических дискуссий (через систему электронной почты, телеконференции и форумы). Интернет как источник практических данных представляет интерес в той связи, что может являться поставщиком текстов, а также может служитьполем для диалогического эксперимента (через систему электронной почты). Поисковые пакеты позволяют разыскивать в локальной и глобальной сети необходимые данные как теоретического, так и практического характера. Дисциплинарно ориентированные интернет-источники представляют собой сервера (или объединения серверов, ориентированные на сбор и хранение информации, связанной с филологическими и лингво-филологическими исследованиями).
8)Массивы
Кроме базовых типов, в большинстве алгоритмических языков присутствует конструкция массив. Иногда массив называют также таблицей или вектором. Массив позволяет объединить множество элементов одного типа в единую переменную.
Все элементы массива имеют один и тот же тип. Элементы массива обычно нумеруются индексами от 0 до n-1, где n - число элементов массива. В некоторых языках можно задавать границы изменения индексов, в других нижняя граница значения индекса равна единице, а не нулю. Мы, тем не менее, будем придерживаться языка Си (а также C++, Java, C#), в котором нижней границей индекса всегда является ноль. Это очень удобно, т.к. индекс элемента массива в этом случае равен его смещению относительно начала массива. Длина массива задается при его описании и не может быть изменена в процессе работы программы. Массив - это самая важная конструкция алгоритмического языка. Важность массива определяется тем, что память компьютера логически представляет собой массив (его можно рассматривать как массив байтов или как массив четырехбайтовых машинных слов). Индекс в этом массиве обычно называют адресом. Элементы массива читаются и записываются исключительно быстро, за одно действие, независимо от размера массива и величины индекса. Для программиста конструкция массива как бы дана свыше. Большинство других структур данных, используемых в программировании, моделируются на базе массива.
Суть в том, что достоверные данные о фонетическ, морфологическ, синтактическ и семантической структуре языка и речи могут быть получены путём переработки большого количества текстов. Корпус текста – совокупность текстов для надёжных научных выводов о некотором языке, диалекте или множестве языков. Эти совокупности текстов помогают решить ряд задач:
- в лексиколог. и лексикограф. (для составления различных словарей, определения значений для многозначных слов, выявления ассоциативных связей слов в тексте, выделения терминов)
- в грамматике (для определения частоты употребляемых грамматических морфем в текстах различных типов; выявления наибольшего употребления типов словосочетаний и предложений, определения синонимичных морфологических единиц и.т.д.)
- в лингвистике текста для дифференциации типов текста, выявления связи между предложениями в абзацах и между ними- при автономном переводе текстов для поиска контекстных слов, имеющих несколько переводимых эквивалентов, поиска эквивалентов терминологических и фразеологических и т. д.
- в учебных целях для выбора цитат, фрагментов произвольных примеров, используемых при создании учебников и др.
Существуют различные подходы к классификации корпусов текстов:
- исследовательский – создание с целью изучения различных аспектов функционирования языка. Может содержать несколько десятков миллионов словоупотреблений
- статистический – соц. Тексты какого-то небольшого промежуточного вр;
- иллюстративный – служит для выделения из нескольких лингвистических примеров, подтверждающих те или иные языковые (речевые, текстовые) факты, обнаруженные ранее иными лингвистическими приёмами.
Корпусы параллельных тестов состоят из множества текстов – оригинально написанных на исходном языке и текстовых переводов этих текстов на одном или нескольких языках.
Входящие в корпуса тексты могут быть представлены в виде:
1. В виде текстового архива
2. В виде банка данных
3. В виде базы данных