Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Основы реферирования.doc
Скачиваний:
88
Добавлен:
09.06.2015
Размер:
6.12 Mб
Скачать

8.3. Некоторые характеристики текста с точки зрения его свёртывания

До 60-х годов прошлого столетия для аналитико-синтетической обработки информации был характерен только содержательный, качественный подход к научно-техническому тексту. При таком традиционной подходе важен жанр документа, его целевое и читательское назначение, актуальность проблемы, полнота информации, вид издания и т. п.

Интерес к тексту, как к сложному структурно-многоуровнему и многоплановому явлению, возник, прежде всего, с попытками применения формализованных (машинных) методов обработки информации. Проблема текста выдвинулась на одно из первых мест в языкознании, в рамках которого сформировалось новое направление - лингвистика текста [101, 102, 176]. Основная задача этого направления - поиск текстообразующих закономерностей, присущих всем текстам.

8.3.1. Общая характеристика текста

С несколькими определениями текста мы уже познакомились. Но их столько, сколько авторов. Рассмотрим ещё некоторые из современных дефиниций, чтобы показать, какие разные подходы к формулировке этого понятия существуют.

Текст - это знак, обладающий некоторой внутренней структурой.

Текст - это изложенное в письменной или печатной форме логически стройное и грамматически правильное авторское сочинение или высказывание.

119

Текст - это последовательность из нескольких (или многих) предложений, построенных согласно правилам языка.

Не вдаваясь в анализ вышеприведённых понятий, примем самое правильное:

Текст - это линейная последовательность знаков, обладающая смыслом.

Дня того, чтобы такая последовательность обладала смыслом, она должна содержать в себе суждение-логическое или текстовое.

В качестве элементов линейной последовательности выступают слова и устойчивые словосочетания, предложения.

Одним из исходных понятий текста является так.

Под знаком понимается чувственно воспринимаемый объект, который условно представляет некоторый предмет, явление, свойство, связь или отношение предметов, явлений и свойств. Основная его задача - обозначить нечто за предметами языка и дать этому нечто знаковую жизнь. Таким образом, можно сказать, что так - это форма фиксации содержания знания и средство передачи содержания информации. Элементарным знаком считается наименьшая единица языка, имеющая значение, то есть слово и устойчивой словосочетание. Знаки, составляемые из элементарных знаков по правилам синтаксиса, образуют тексты.

Вербальное [лат. verbalis - устный, словесный] выражение знака в естественном языке называют именем.

С точки зрения семантики знак обозначает денотат (нечто за пределами знака) и выражает концепт (то, что мы знаем об этом нечто). Один и тот же денотат может иметь несколько имён (слов). Это явление синонимии знаков. С другой стороны, один и тот же знак может обозначить несколько денотатов (омонимов). И в каждом из этих случаев он будет иметь своё значение, свой концепт. Итак, знак есть социально признанное единство значения и имени, то есть плана содержания и плана выражения [177].

В структурной лингвистике существует понятие «семантического треугольника», введённого в обиход американскими семантиками. В этом «треугольнике» удачно представлены три главные логико-лингвистические категории (а также их взаимосвязь) [15]:

некий реальный объект действительности, именуемый в логике «денотат», а в лингвистике «референт»;

возникающий в создании мысленный образ о данном объекте, который в логике называется «понятие» или «концепт», а в лингвистике «значение» или «смысл»;

принятое в обществе наименование объекта - «имя» (слово).

120

знак

Значение,

понятие, концепт

План содержания

отражаете

выражается

называете

План выражения

Денотат,

Имя,

референт

слово

Рис. 2. Семантический треугольник.

Семантический треугольник, наглядно демонстрируя единство плана содержания (духовного) и плана выражения (материального), позволяет утверждать, что знак - это единство значения и имени (краеугольное понятие лингвистики).

Структура естественного языка как знаковой системы, изучаемая структурной лингвистикой, формально включает следующие уровни:

фонетический уровень - это совокупность звуков - в устной речи и букв - в письменной; фонема (от гр. phone - звук);

лексический уровень - это словарный запас - лексика (от гр. lexikos словесный) и правила её построения;

синтаксический уровень - это словосочетания и предложения с правилами их построения (от гр. syntaxis составление);

текстовый (суперсинтаксический) уровень - это различные разновидности текстовых образований.

Эти уровни естественного языка функционируют в двух измерениях. Горизонтальная (синтагматическая) ось определяет порядок следования элементов различного уровня (букв, слов, предложений) для получения правильных языковых выражений - синтагм (от гр. syntagma нечто соединённое). Синтагмы одного уровня языка на более высоком уровне выступают как элементы этого более высокого уровня. Например, на фонетическом уровне элементами являются буквы (звуки), а синтагмами -слова. На более высоком лексическом уровне в качестве элементов выступают слова, а в качестве синтагм - предложения и т. д. Функционирует и вертикальная (парадигматическая) ось. Парадигма (от гр. paradeigma пример, образец) - это множество тех или иных элементов языка, объединённых по некоторому признаку. Например, на лексическом уровне парадигмы образуют группы синонимичных слов или группы омонимов. На синтаксическом уровне в качестве парадигм выступают, например, назывные предложения, а на текстовом уровне - тексты, систематизированные по определённой тематике или, например, по читательскому адресу.

121

Таким образом, каждый новый уровень - это новое качество.

Семантический треугольник обычно относят к лексическому уровню, то есть к словам естественного языка, но принцип, заложенный в треугольнике, можно распространить и на текстовый уровень. В этом случае денотатом будет выступать не отдельный предмет, а некая предметная ситуация, отражаемая в голове субъекта и описываемая в каком-то тексте. Тогда семантический треугольник преобразуется в текстовый треугольник [15].

Замысел

Ситуация Речь

К,, К3, К3 - концепты; Д,, Д2, Дз - денотаты; И,, И3, И3 - имена Рис. 3. Текстовый семантический треугольник

8.3.2. Структура текста

Итак, текст представляет собой многоуровневую систему не только в рассмотренном аспекте: знак-слово, знак-предложение, знак- сложное синтаксическое целое. Представляют интерес и другие его характеристики: его синтаксическая структура, коммуникативная, аспектная, семантическая, а также информативная и функционально-смысловая. Анализ текста под углом рассмотрения этих структур помогает во многих случаях выбрать форму свертывания различных структурных составляющих текста.

122

8.3.2.1. Синтаксическая структура текста

Мы уже рассматривали некоторые вопросы «традиционной» лингвистики, а также сложное синтаксическое целое (ССЦ) и сверхфразовое единство (СФЕ).

В настоящее время всё большее внимание уделяется изучению текстов, занимающих промежуточное положение между предложением и целым текстом (главной, разделом, статьёй и т. п.). Получили развитие и перечисленные понятия.

Так ССЦ в настоящее время подразделяются на сверхфразовые единства и линейно-синтаксические цели. ССЦ, обладающее одной микротемой, называют сегментом, а цепочку сегментов, находящуюся иногда в разных иерархических отношениях, суперсегментом (который также имеет тему).

Первое предложение СФЕ всегда авто с ем антично, то есть самостоятельно и имеет твёрдое начало (начинается с существительного-подлежащего или группы подлежащего), другие предложения этого единства синемантичны, несамостоятельны, и характеризуются мягкими началами (сочинительный союз или глагол-сказуемое в начале предложения, наличие указательных, притяжательных или личных местоимений 3-го лица, местоименных наречий). Правой границей СФЕ также служит твёрдое начало, которое впервые появляется после мягких начал (а иногда мягкое начало, которое относится к другому речевому типу).

Линейно-синтаксическая цель (ЛСЦ) представляет собой последовательность предложений, относящихся к разным речевым типам, при условии, что эти предложения связаны мягкими началами. Начинаться такая цель будет там, где закончится супертекстовая единица, поэтому начало её может быть как твёрдым, так и мягким.

Сложные речевые образования (суперсегменты) могут иметь структуру ССЦ. В них иногда первый сегмент выполняет функции автосегмента, а последующие - синсегментов. Однако следует заметить, что сегменты в рамках суперсегмента не всегда следуют один за другим. Они могут пересекаться, проникать один в другой, вкладываться друг в друга.

Напомним, что к числу основных текстообразующих признаков ССЦ обычно относят цельность, тематичность и связность. Так как передача смысла (информации) осуществляется не отдельными предложениями, а связанными текстами, то механизм связности считается основным тексто образующим фактором. Но, несмотря на его ведущее место в общей проблематике лингвистики текста, до сих пор существуют различные взгляды на сам феномен связности, типы текстовых связей и средства, обеспечивающие внутритекстовую связность.

Обычно связность текста рассматривают как функционально-семантическую категорию, которая охватывает содержательный, логический и композиционный аспекты [15].

123

Содержательный аспект связности проявляется через употребление лексико-грамм этических средств связи самостоятельных предложений и абзацев (лексические повторы, указательные и личные местоимения, наречия с причинно-следственными и временными значениями).

Логический аспект связности проявляется через выражение логических отношений между предложениями, абзацами и т. д. посредством функционально синтаксических средств (вводные слова: так, таким образом, следовательно, итак, кроме того, наконец и т. п.; наречия и наречные слова: сюда, отсюда, тогда, здесь, оттого, поэтому, затем, теперь, сейчас, сначала, после, выше, ниже и др.; союзы и, а, да, однако, однако же и др.).

Композиционный аспект связности выражается с помощью так называемых конструкций связи, относящихся также к функционально -синтаксическим средствам (рассмотрим, заменим, что; важно подчеркнуть, что; можно предположить, что; следует иметь в виду, что; ясно, что; понятно, что; как будет показано ниже, согласно сказанному выше, заключается в следующем и др.). Конструкции связи можно считать специфическими именно для научного стиля.

Соответственно функционально-семантическим категориям

выделяют три группы связности:

  1. лексические и семантические повторы;

  2. соотнесённость вид о-временных форм глаголов;

  3. анафорические и логико-смысловые коннекторы.

Э.Ф. Скороходько [178] указывает, что лексические и семантические повторы являются основным средством объединения предложений в единое целое (другие виды связи являются дублирующими).

При этом выделяются следующие критерии связности предложений, принадлежащих одному и тому же тексту:

основные - а) когда предложение включает некоторую словоформу одного и того же имени существительного; б) когда предложения включают имена существительные, находящиеся в парадигматических отношениях типа подчинения (врач-кардиолог); в) когда последующие предложения включают прилагательные или глаголы с той же основной, что и существительное первого предложения (опора-опорный);

расширенные - а) когда предложения включают имена существительные, являющиеся синонимами в рамках данного контекста; б) когда в последующих предложениях имя существительное заменено на личное или притяжательное, или указательное местоимение.

На алгоритмическое построение семантической сети ориентирован лишь основной критерий.

Анафорические и логико-смысловые связи между отдельными предложениями текста отражают коннекторы, представленные ниже в таблице, взятой из монографии Д. И. Блюменау [15].

124

Таблица 12 Разновидности коннекторов

Символ класса

Класс коннекторов

Примеры коннекторов

Примеры употребления коннекторов

Анафорические коннекторы

I

Анафорическая связь с указанием на предмет, схожий с данным

Аналогичный данный, указанный, упомянутый, такой, этот

Совмещение элементов разнородных знаковых систем создаёт специфические проблемы. Аналогичные проблемы возникают и в связи с применением товарных знаков

А

Анафорическая связь с указанием на предмет, отличный от данного

Другой, иной, прочий

Одним из средств стала система препринтов. Другой путь заключается в сокращении объёма первичных публикаций

Логнко-смысловые коннекторы

R

Результат, итог

В итоге, в результате, итак, наконец, таким образом

Обычно центры анализа выписывают и просматривают весьма ограниченное число профильных изданий. Таким образом, центры анализа зависят от реферативных служб

S

Дополнения, с опутству ющн е обстоятельства

Более того, вдобавок, вместе с тем, кроме того, при этом, также

Адресность набора предполагает, что выбирается профильный журнал. Вдобавок следует отметить, что не нужно различать теоретические, научные и уз ко отраслевые журналы

Р

Перифразы

Другими словами, иначе говоря, иными словами

Наука и техника существовала н развивалась и без таких

информационных центров. Иначе говоря, следует уточнить, оправданы ли расходы на содержание

125

центров

Е

Пример, общее - конкретное

В частности, например, примером, так

Ранее публикации издавались в основном на нескольких иностранных языках. Например, в 1909 году достаточно было знать три языка, чтобы читать 92% всей литературы по химии

С

Импликация, причинно-следственные связи

Отсюда, поэтому, сяедоеатеяьно, стаяо быть

Связующим звеном между потребителем н системой служит узкий специалист. Поэтому общение между специалистом и потребителем информации осуществляется на профессиональном уровне

О

Возражения, оговорки

Впрочем, однако, тем не менее

Научная информация обладает свойством ценности. Однако такого свойства не имеет информация,

циркулирующая в неживой природе

Другой перечень внутритекстовых средств связи приводит О.Д. Митрофанова [179]

  1. Вначале, сначала, прежде всего, е первую очередь, предварительно, сейчас, теперь, указывающие на начало рассуждения.

  2. Одновременно, в то же время, наряду с, при этом, вместе с тем, только что, уже, раньше, ранее, опять, ещё раз, снова, вновь, в заключение, в итоге, указывающие на одновременность, присоединение.

  3. Ещё, затем, позже, позднее, впоследствии, дальше, в дальнейшем, в последующем, впредь, указывающие на последующее сообщение.

4. Здесь, тут, там, туда, всюду, выше, ниже, указывающие нанаправленность.

5. Точно так, совершенно так, также, так, таким образом, подобнымобразом, иначе, по-иному, выражающие отношения способов действия.

6. Тогда, в этом (данном, таком) случае, отсюда, тем самым, врезультате, выражающие причинные, условные и следственныеотношения.

7. Местоимения он, та, они, тот, этот, такой, его, её, их, это.

126

В научных текстах в качестве связочных средств широко используются прилагательные и причастия. Они выполняют двоякую роль:

  1. указывают на связь с предыдущим контекстом: данный, искомый, соответствующий, последний, предыдущий, предшествующий, вышеописанный, вышеуказанный, вышеприведённый, указанный, упомянутый, установленный, перечисленный, построенный, приведённый, применённый, рассмотренный, сделанный, сформулированный, описанный, определённый, отмеченный, заданный, доказанный, законченный, изложенный, найденный;

  2. указывают на связь с последующим контекстом: предстоящий, приводимый, разыскиваемый, рассматриваемый, требуемый, следующий, нижеследующий, дальнейший, последующий.

С помощью этих средств соединяются предложения, абзацы, ССЦ.

Ни одна из рассмотренных группировок связочных средств не претендует на строгость классификации. Современная практика анализа текстов чаще всего сводится к обнаружению новых лексических повторов и коннекторов.

При решении задач формализованного свёртывания важно, что многие из рассмотренных лексических единиц являются не только средством внутритекстовой связи, но и средством функциональной идентификации предложений (наряду с уже упоминавшимися индикаторами), средством выражения условности, гипотетичности, дополнительности.

Из всего вышесказанного видно, что средства внутритекстовой связности продолжают изучаться, а связочный аппарат ещё требует серьёзного совершенствования.

8.3.2.2. Коммуникативная структура текста

Коммуникативная структура опирается на смысловое деление высказывания (первоначально это понятие было введено для предложения). Коммуникативная структура всегда двучленна: она состоит из субъекта и предиката. Кратко мы уже касались этого вопроса ранее. Рассмотрим его подробнее, так как в последнее время интерес в этой теме также резко возрос и она получила своё развитие. Во-первых, следует познакомиться с некоторыми обозначениями. Субъект (тема) то есть о чём сообщается в данном предложении (высказывании) обозначается буквой «Т» Тема (Т) -это нечто известное, данное.

Предикат (рема) - это что сообщается в данной теме, то есть рема (R) - это нечто новое.

Текст в целом можно рассматривать, как выражение суждения, субъект которого обычно сформулирован в заглавии, а предикатом является весь отдельный текст. Этот подход позволяет делить целый текст на смысловые фрагменты, которые представляют собой также текстовые суждения, только

127

более низкого уровня имеющие свои темы (Т,, Т2 и т. д. - текстовые субъекты) и ремы (R,, R2 и т. д. - текстовые предикаты).

Следует однако иметь в виду, что предмет текстового субъекта не совпадает с предметом логического субъекта. Не совпадают соответственно, по содержанию текстовый и логический предикаты, так как логические субъекты и предикаты - это понятия, а текстовые субъекты и предикаты - логические суждения (предложения, сегменты и т. п.). Для коммуникативной структуры научного текста в рамках ССЦ характерны, главным образом, четыре вида коммуникативных цепочек (соотношений Т-R).

1. Простая линейная корреляция Т и R (или цепная,последовательная связь). В этом случае каждая рема предшествующегопредложения является темой для ремы следующего предложения. Такой видконтекста иногда называют последовательным строем:

T1-R1

T2(=R1) - R2

T3(=R2) R3 и т. д.

Ни одно звено (T-R) в этой цепочке не может быть удалено без нарушения связности текста. Пример

Образ окружающего мира первоначального фокусируется на сетчатке. Сетчатка содержит 125 млн. се сто чувствительных клеток, которые (называются палочками и колбочками и специализированы таким образом, что в ответ на световые импульсы) генерируют электрические сигналы. Электрические сигналы из сетчатки (по зрительному нерву) передаются в специализированное клеточное скопление. Клеточное скопление (называемое коленчатым телом) расположено в глубине мозга.

Без текста в скобках это пример простой линейной корреляции.

2. Последовательная корреляция Т и R с постоянной темой (связьтипа «нанизывание»). В этом случае при одной повторяющейся теме имеетсянекоторое количество рем:

128

T1-R1