Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лаб работы 2 к ИЯ.doc
Скачиваний:
5
Добавлен:
16.08.2019
Размер:
19.19 Mб
Скачать

Контент-анализ социологических текстов.

1. Теоретическая часть.

Исторически сложилась потребность в создании объективных методов ана­лиза текстов, результаты которых не зависели бы ни от лично­сти исследователя, ни от того, где и когда эти исследования про­водятся.

В связи с этой необходимостью и возник метод называемый контент-анализом, как методика выявления частоты появле­ния в тексте определенных, интересующих исследователя ха­рактеристик, которая позволяет ему делать некоторые выво­ды относительно намерений создателя этого текста или воз­можных реакций адресата.

Как правило метод контент-анализа связан с оценкой боль­ших массивов текстов, что приводит к серьёзным затратам времени и сил исследователя для проведения его в ручном режиме.

В условиях развития современного информационного общества и связанным с этим развитием систем автоматизированной обработки информации представляется наиболее перспективным использование для проведения контент-анализа компьютерной техники. При этом исключается ряд негативных факторов, которые имеют место при ручной обработке текстов, такие как невнимательность исследователя; неоднозначность выводов при принятии определенных критериев оценки; трудоемкость решается за счет быстродействия компьютерной техники. Именно компьютерному методу контент-анализа текстов и посвящена данная работа.

Представим, что перед нами поставлена задача выявления принадлежности произвольного текста к текстам социологической направленности. При­чем требуется, чтобы это делал не человек, а компьютер. Реше­ние довольно очевидно. Текст может быть отнесен к социологическим в том случае, если частота встречаемости социологических терминов в нем близка к частоте встречаемости социологических терминов в классической социологической литературе. В качестве примера классических социологических текстов рассмотрим пять трудов касающихся различных аспектов социологической проблематики:

1. Энтони Гидденс «Социология»

2. Волков Ю.Г. «Социология»

3. Захаров Н.Л. «Специфика социальной системы России»

4. Радаев В.В., Шкаратан О.И. «Социальная стратификация»

5. Федотова В.Г. «Социальные знания и социальные изменения»

Проведём анализ этих текстов с целью подсчёта в них частот встречаемости социологических терминов ai. Для этого воспользуемся терминами социологического словаря позаимствованного из [1], представленными в Таблице 1.

Таблица 1

i

Термин (a)

i

Термин (a)

1

Абсентеизм

148

Методология

2

Абстракция

149

Метод

3

Автократия

150

Методика

4

Автономия

151

Мода

5

Авторитаризм

152

Модель

6

Авторитет

153

Модератор

7

Агрегация

154

Молодежь

8

Агрессия

155

Момент

9

Адаптация

156

Мониторинг

10

Аддитивность

157

Мотивация

11

Адаптивность

158

Мультиколлинеарность

12

Администрация

159

Мультипликативность

13

Адресат

160

Наблюдение

14

Адресант

161

Надежность

15

Адрес

162

Направленность

16

Аккомодация

163

Народность

17

Аккультурация

164

Нарративность

18

Аксиология

165

Насилие

19

Активность

166

Наука

20

Акцентуация

167

Национализм

21

Амальгамизация

168

Нация

22

Анализ

169

Норма

23

Анкета

170

Нормакультурная

24

Анкетер

171

Норма

25

Анкетирование

172

Образование

26

Аномия

173

Объект

27

Антецедентная

174

Общение

28

Арбитраж

175

Общество

29

Ассимиляция

176

Объем

30

Аудитория

177

Омнибус

31

Аутгруппа

178

Операционализация

32

Банк

179

Опрос

33

Барьеры

180

Организация

34

Бета-вес

181

Открытие

35

Бета-коэффициент

182

Ошибка

36

Бланк

183

Панель

37

Блокада

184

Парадокс

38

Брак

185

Параметр

39

Бюрократия

186

Партия

40

Быт

187

Пат-анализ

41

Валентность

188

Переменная

42

Валидность

189

План

43

Верификация

190

Племя

44

Взаимодействие

191

Поведение

45

Взаимоисключаемость

192

Подчинение

46

Взвешенность

193

Показатель

47

Власть

194

Политика

48

Влияние

195

Понятие

49

Вопрос

196

Право

50

Выборка

197

Правонарушение

51

Гайд

198

Правоприменение

52

Гамма-коэффициент

199

Правоспособность

53

Генерализуемость

200

Правотворчество

54

Гетерогенность

201

Предмет

55

Гипотеза

202

Преступление

56

Гистограмма

203

Принцип

57

Гомогенность

204

Приспособление

58

Господство

205

Проактивность

59

Государство

206

Прогноз

60

Группа

207

Программа

61

График

208

Прогресс

62

Данные

209

Проект

63

Движение

210

Переменная

64

Девиация

211

Поведение

65

Дедукция

212

Процедура

66

Действие

213

Процесс

67

Делинквент

214

Рандомизация

68

Демография

215

Расы

69

Деноминация

216

Реактивность

70

Деятельность

217

Революция

71

Диаграмма

218

Регресс

72

Дизайн

219

Резюме

73

Дискриминация

220

Рейтинг

74

Дискриминация

221

Религия

75

Дисперсия

222

Репрезентативность

76

Диспозиция

223

Распределение

77

Дистанция

224

Респондент

78

Дифференциация

225

Реформа

79

Документ

226

Реципиент

80

Достоверность

227

Род

81

Досуг

228

Ряды

82

Единицы

229

Самосознание

83

Зависимость

230

Самооценка

84

Задачи

231

Сектор

85

Закон

232

Семья

86

Знак

233

Сеть

87

Значение

234

Скринер

88

Игра

235

Сила

89

Идентификация

236

Система

90

Идентичность

237

Систематизация

91

Иерархия

238

Случайность

92

Измерение

239

Собственность

93

Изобретение

240

Совокупность

94

Изоляция

241

Семья

95

Имитация

242

Содержание

96

Индекс

243

Соперничество

97

Индикатор

244

Сотрудничество

98

Индукция

245

Социализация

99

Ингруппа

246

Социология

100

Институт

247

Спецификация

101

Институционализация

248

Спираль

102

Инструкция

249

Стандартизовать

103

Инструментарий

250

Стандартное отклонение

104

Интеграция

251

Статистика

105

Интенсивность

252

Статистическая связь

106

Интервью

253

Статус

107

Интервьюер

254

Степень

108

Интерес

255

Стимул

109

Интернет-вопрос

256

Страта

110

Интернет-исследование

257

Структура

111

Интернет-опрос

258

Стратификация

112

Интерпретация

259

Структура

113

Информация

260

Субкультура

114

Исследование

261

Таблица

115

Казуальность

262

Теория

116

Категория

263

Терпимость

117

Квантиль

264

Тест-эффект

118

Квота

265

Техника

119

Кейс-стади

266

Труд

120

Ключ

267

Убеждение

121

Кластер

268

Управление

122

Книга

269

Условиятруда

123

Конфликт

270

Установка

124

Кодирование

271

Фокус-группа

125

Кодировщик

272

Формальнаямодель

126

Коммуникатор

273

Фрустрация

127

Коммуникация

274

Функция

128

Компромисс

275

Хи-квадрат

129

Контент-анализ

276

Холл-тест

130

Контркультура

277

Целедостижение

131

Контроль

278

Цель

132

Конфликт

279

Цивилиация

133

Кооперация

280

Частота

134

Конкуренция

281

Шкала

135

Корреляция

282

Шкала Лайкерта

136

Каузация

283

Шкала интервалов

137

Коэффициент

284

Шкалаотношений

138

Культура

285

Шкальная оценка

139

Лидерство

286

Эволюция

140

Линия

287

Эквивалентность

141

Личность

288

Экосистема

142

Лямбда-коэффициент

289

Эксперимент

143

Матрица

290

Электорат

144

Маргинал

291

Эмпирический

145

Модель

292

Этапы

146

Медиана

293

Этнос

147

Менталитетет

294

Этноцентризм

В Таблице 1 представлен социологически словарь, состоящий из n = 294 социологических терминов. Выделим в нём j = 28 групп, в каждую из которых будут входят социологические термины, начинающиеся с j-той буквы алфавита, представленного в Таблице 2. Данная группировка проводится с целью упрощения дальнейшего построения статистических сводок.

Таблица 2

j

1

2

3

4

5

6

7

8

9

10

11

12

13

14

Буква

А

б

в

г

д

е

ж

з

и

к

л

м

н

о

j

15

16

17

18

19

20

21

22

23

24

25

26

27

28

Буква

П

р

с

т

у

ф

х

ц

ч

ш

щ

э

ю

я

Учитывая неравное количество терминов, входящих в каждую j-ую группу словаря, построим статистическую сводку, отражающую количественное соотношение содержания в словаре социологических терминов на j-тую букву алфавита, что в свою очередь позволит оценить распределение встречи социологических терминов в вышеуказанных текстах, для чего вычислим количество nj терминов словаря на j-тую букву алфавита (простые частоты), согласно формуле (1) и проиллюстрируем полученный результат с помощью диаграммы.

, где mj – число слов на j-тую букву (1)

Так как анализ простых частот не являются оптимальным при оценке текстов, что связано с неоднозначностью оценок возникающих при анализе текстов различной длины, для проведения дальнейшего анализа и построения статистических сводок перейдём к относительным частотам, для чего подсчитаем суммарное количество социологических терминов словаря N согласно формуле (2) и вычислим относительную частоту встречи в словаре социологических терминов Pj на j-ую букву алфавита согласно формуле (3).

(2)

(3)

Для оценки встречаемости социологических терминов словаря и построения статистической сводки, отражающей относительную частоту появления социологических терминов словаря, начинающиеся с j-той буквы алфавита в каждом из указанных выше социологических текстах k, проведём подсчёт встречаемости терминов словаря в каждом k-том тексте, после чего вычислим относительные частоты встречи социологических терминов словаря Pjk на j-ую букву в каждом из анализируемых текстов по следующей формуле

, где k = 1, 2 …, 5 (4)

После этого вычислим δk - отклонение относительной частоты появления терминов словаря в каждом k-том тексте с целью нахождения среднего отклонения δср по формуле (6), попадание, в границы значений которого будет означать, что анализируемый текст относится к социологическим. Для этого воспользуемся следующей формулой

(5)

δср = δk / 5 (6)

Далее проведём анализ произвольно взятого текста на предмет его принадлежности к социологическим текстам. В качестве произвольного текста возьмём произведение Булгакова – «Мастер и Маргарита».

Для проведения анализа и выявления того, относится ли данный текст к социологическим вычислим для этого текста значение δ по аналогии с предыдущими проанализированными нами текстами, и определим, не выходит ли данное значение за границы интервала, характеризуемого следующим неравенством:

(7)

Если значение δ анализируемого текста не выходит за границы неравенства (7), будем считать, что данный текст относится к социологическим. Полученный результат проиллюстрируем с помощью диаграммы.

Реализацию описанного выше алгоритма продемонстрируем на текстах Энтони Гидденса «Социология», Волков Ю.Г. «Социология», Захарова Н.Л. «Специфика социальной системы России», Радаева В.В., Шкаратана О.И. «Социальная стратификация», Федотовой В.Г. «Социальные знания и социальные изменения» с помощью информационных технологий.

Для этого в сети Интернет с помощью поисковой системы Рамблер найдём тексты данных произведения в электронной форме, для чего воспользуемся специализированной программой-браузером Internet Explorer.

После запуска Internet Explorer введём в его адресную строку, следующую запись «www.rambler.ru» и выполним однократное нажатие клавиши Ввод (Enter) на клавиатуре.

В результате этих действий в окне программы Internet Explorer отобразиться Web-страница поисковой системы Рамблер. Далее, на отобразившейся странице, в строке поиска введём запрос «Энтони Гидденс Социология», подведём указатель мыши к кнопке «Поиск» и выполним однократное нажатие левой клавиши мыши.

После этого, поисковая система Рамблер проведёт поиск сайтов, удовлетворяющих условию нашего запроса и отобразит их список в порядке уменьшения популярности.

Выберем один из ресурсов, расположенных вначале полученного списка и перейдём на него, для чего подведём курсор мыши к названию этого ресурса и выполним однократное нажатие левой клавиши мыши.

После перехода на страницы выбранного ресурса, найдём на них ссылку на документ, содержащий текст произведения Энтони Гидденса «Социология» и загрузим его на локальный компьютер, на котором планируется проведение его анализа с помощью вышеуказанного алгоритма. Для этого подведём курсор мыши к найденной ссылке и выполним однократное нажатие правой клавиши мыши. Далее, в появившемся контекстном меню, подведём курсор мыши к команде «Сохранить как» и выполним однократное нажатие левой клавиши мыши. Документ будет сохранён в указанную нами папку на локальном компьютере.

Теперь, имея в наличие электронную версию произведения Энтони Гидденса «Социология» проведём его анализ, используя вышеописанный алгоритм. Для чего, первоначально, проведём подсчёт появления каждого термина словаря в данном тексте.

Для этого воспользуемся редактором Microsoft Word из пакета Microsoft Office. После запуска Microsoft Word откроем в нём документ, содержащий текст анализируемого нами произведения и перейдём во встроенный редактор VBA (Visual Basic for Application), для чего выполним одновременное нажатие клавиш Alt + F11 на клавиатуре. После чего, напишем макрос, который будет проводить подсчёт появления каждого термина словаря в тексте произведения.

После создания макроса, запустим его на выполнение. С этой целью подведём курсор мыши к имени меню «Сервис», которое расположено в строке меню и выполним однократное нажатие левой клавиши мыши. В появившемся каскадном меню подведём курсор мыши к команде «Макрос», после чего, в появившемся меню подведём курсор мыши к команде «Макросы» и выполним однократное нажатие левой клавиши мыши. Далее, в появившемся диалоговом окне «Макрос» подведём курсор мыши к кнопке «Выполнить» и выполним однократное нажатие левой клавиши мыши.

Макрос проведёт замену встретившихся в тексте терминов словаря и на константы вида «$$$Word» + «номер слова из словаря» + «$$$», что необходимо для проведения расчётов с использованием программы Microsoft Excel.

Далее, преобразуем, текст данного произведения таким образом, чтобы на каждой строке документа, содержащего данный текст, находилось лишь одно слово или предлог, для чего подведём курсор мыши к имени меню «Правка» расположенного в строке главное меню Microsoft Word и выполним однократное нажатие левой клавиши мыши. В открывшемся каскадном меню подведём курсор мыши к команде «Заменить» и выполним однократное нажатие левой клавиши мыши. Далее, в появившемся диалоговом окне «Найти и заменить» в текстовое поле «Найти» введём символ пробел, а в текстовое поле «Заменить на» служебный символ «^p». После чего подведём курсор мыши к кнопке «Заменить всё» и выполним однократное нажатие левой клавиши мыши.

В результате проделанных действий, получим документ, содержащий текст произведения Энтони Гидденса «Социология», в котором на каждой строке документа находится лишь одно слово или предлог.

Для проведения дальнейшего анализа по указанному выше алгоритму, перенесём преобразованный текст в программу Microsoft Excel, для чего скопируем его в буфер обмена в программе Microsoft Word, откроем программу Microsoft Excel, активизируем ячейку B1 на Листе 1 рабочей книги Excel и выполним вставку из буфера обмена. После чего перенесём в Microsoft Excel термины словаря, для чего откроем файл, содержащий словарь, скопируем его в буфер обмена, откроем окно программы Microsoft Excel, активизируем ячейку A1 на Листе 1 рабочей книги Excel и выполним вставку из буфера обмена.

Теперь, проведём подсчёт появления каждого термина словаря в анализируемом тексте. Для этого воспользуемся существующей в программе Microsoft Excel статистической функцией «СЧЁТЕСЛИ». В качестве первого аргумента функции будем использовать диапазон ячеек, в которых расположен текст – B:B. В качестве второго аргумента, будем использовать термины словаря, расположенные в столбце A.

В результате проведения расчетов с использованием статистической функции «СЧЁТЕСЛИ» получим ряд значений ai появления каждого термина словаря в тексте произведения Энтони Гидденса «Социология». После чего вычислим с помощью программы Excel количество nj терминов словаря на j-тую букву алфавита, согласно формуле (1) и проиллюстрируем полученный результат с помощью диаграммы.

Для проведения дальнейшего анализа и построения статистических сводок вычислим относительные частоты появления терминов словаря Pj, начинающихся на j-тую букву алфавита по формуле 3, для чего, первоначально, вычислим общее количество социологических терминов словаря N согласно формуле (2).

Далее, проведём подсчёт встречаемости терминов словаря в анализируемом тексте, после чего вычислим относительную частоту появления социологических терминов словаря Pjk на j-ую букву, учитывая, что k – порядковый номер анализируемого текста, равен единице, по формуле 4 и сохраним результат вычислений.

Перейдём к реализации описанного выше алгоритма, для произведения Энтони Гидденса «Социология», для чего напишем программу на языке макрокоманд. Так как любая программа требует отладки, будем проводить её посредствам сравнения получающихся в процессе написания программы результатов с образцами, представленными в виде рисунков.

1 . Включение компьютера и вход в систему. Результат выполнения представлен на рисунке 1.

Рис. 1.

2 . Запуск программы Microsoft Internet Explorer.

Результат выполнения представлен на рисунке 2.

Рис. 2.

3 . Открытие Web-страницы – ввод адреса.

Параметры: - адрес: «http://www.rambler.ru/»

Результат выполнения представлен на рисунке 3.

Рис. 3.

4. Поиск Web-ресурса с помощью поисковой системы Rambler.

Параметры: - запрос: «Энтони Гидденс Социология»

Результат выполнения частично представлен на рисунке 4.

Рис. 4.

5. Открытие Web-страницы – переход по ссылке.

Параметры: - ссылка: «Энтони Гидденс. Социология | socioline.ru»

Результат выполнения представлен на рисунке 5.

Рис. 5.

6. Загрузка файла с помощью программы Microsoft Internet Explorer. Параметры: - ссылка: «скачать doc (5,9 Mb)»; - папка: «Мои документы»; - имя файла: «Энтони Гидденс - Социология.doc»

7. Запустить программу Microsoft Excel. Результат выполнения частично представлен на рисунке 6.

Рис. 6.

8 . Выбор активного листа.

Параметры: - лист: «Лист1». Результат выполнения представлен на рисунке 7.

Рис. 7.

9. Форматирование высоты строк.

П араметры: - диапазон строк: 1295; - высота: 18 мм. Результат выполнения представлен на рисунке 8.

Рис. 8.

1 0. Форматирование ширины столбца.

Параметры: - столбец: A; - ширина: 32 мм. Результат выполнения представлен на рисунке 9.

Рис. 9.

1 1. Выбор языка клавиатуры.

Параметры: - язык: Русский. Результат выполнения представлен на рисунке 10.

Рис. 10.

1 2. Занесение данных в ячейку.

Параметры: - ячейка: A1, B1; - данные: «Словарь», «i». Результат выполнения представлен на рисунке 11.

Рис. 11.

1 3. Занесение данных в ячейку.

Параметры: - ячейка: C2C295; - данные: «данные таблицы 2». Результат выполнения представлен на рисунке 12.

Рис. 12.

1 4. Занесение данных в ячейку.

Параметры: - ячейка: B2; - данные: «=ЛЕВСИМВ(A2:A295;1)». Результат выполнения представлен на рисунке 13. Рис. 13.

1 5. Автозаполнение.

Параметры: - начальная ячейка: B2; - конечная ячейка: B295. Результат выполнения частично представлен в таблице на рисунке 14.

Рис. 14.

1 6. Занесение данных в ячейку.

Параметры: - ячейка: B2; - данные: «=ЛЕВСИМВ(A2:A295;1)». Результат выполнения представлен на рисунке 13. Рис. 13.

1 7. Занесение данных в ячейку.

Параметры: - ячейка: C2C29; - данные: «данные таблицы 2». Результат выполнения представлен на рисунке 14.

Рис. 14.

18. Занесение данных в ячейку.

Параметры: - ячейка: D2; - данные: «=СЧЁТЕСЛИ(B$2:B$295;C2)». Результат выполнения представлен на рисунке 15. Рис. 15.

1 9. Автозаполнение.

Параметры: - начальная ячейка: D2; - конечная ячейка: D29. Результат выполнения частично представлен в таблице на рисунке 16.

Рис. 16.

2 0. Занесение данных в ячейку.

Параметры: - ячейка: E2, E3; - данные: «1», «2». Результат выполнения представлен на рисунке 17.

Рис. 17.

2 1. Активизация диапазона ячеек.

Параметры: - диапазон: E2÷E3. Результат выполнения представлен на рисунке 18.

Рис. 18.

22. Автозаполнение.

Параметры: - начальная ячейка: E2÷E3; - конечная ячейка: E295. Результат выполнения частично представлен в таблице на рисунке 19.

Рис. 19.

2 3. Форматирование ширины столбца.

Параметры: - диапазон столбцов: F÷AG; - ширина: 5 мм. Результат выполнения частично представлен на рисунке 20.

Рис. 20

2 4. Активизация диапазона ячеек.

Параметры: - диапазон: C2÷C29. Результат выполнения частично представлен на рисунке 21.

Рис. 21.

25. Копирование в буфер обмена.

26. Специальная вставка – транспонирование.

Параметры: - ячейка: F1.

Результат выполнения частично представлен на рисунке 22.

Рис. 22.

27. Запуск программы Microsoft Word.

Результат выполнения представлен на рисунке 23.

Рис. 23.

28. Запись макроса.

Параметры: - название макроса: «Анализ».

29. Открытие макроса MS Excel для редактирования.

Параметры: - название макроса: «Анализ».

30. Сохранение файла на диск.

Параметры: - имя файла: «шаблон_анализа.doc».

3 1. Открытие документа Microsoft Word. Параметры: - имя файла: «Энтони Гидденс - Социология.doc». Результат выполнения представлен на рисунке 24.

Рис. 24.

32. Сохранение документа Microsoft Word.

Параметры: - имя файла: «Энтони Гидденс - Социология.txt».

33. Открытие документа Microsoft Word. Параметры: - имя файла: «Энтони Гидденс - Социология.txt». Результат выполнения представлен на рисунке 25.

Рис. 25.

34. Запуск макроса.

Параметры: - название макроса: «Анализ».

35. Замена символов Microsoft Word. Параметры: - заменяемый символ: «пробел»; - заменяющий символ: «^p». Результат выполнения представлен на рисунке 26.

Рис. 26.

36. Копирование в буфер обмена Microsoft Word.

37. Вставка из буфера обмена Microsoft Excel.

Параметры: - ячейка: AH2. Результат выполнения частично представлен на рисунке 27.

Рис. 27.

38. Занесение данных в ячейку.

Параметры: - ячейка: F2; - данные: «=ЕСЛИ($B2=F$1;СЧЁТЕСЛИ($AH:$AL;"$$$Word" & $E2 & "$$$");0)». Результат выполнения представлен на рисунке 28.

Рис. 28.

3 9. Автозаполнение.

Параметры: - начальная ячейка: F2;

- конечная ячейка: F295. Результат выполнения частично представлен в таблице на рисунке 29. Рис. 29.

40. Автозаполнение.

Параметры: - начальная ячейка: F2÷ F295; - конечная ячейка: AG295. Результат выполнения частично представлен в таблице на рисунке 30.

Рис. 30.

4 1. Занесение данных в ячейку.

Параметры: - ячейка: F297; - данные: «=СЧЁТЕСЛИ(F2:F295;">0")». Результат выполнения представлен на рисунке 31.

Рис. 31.

42. Автозаполнение.

Параметры: - начальная ячейка: F297; - конечная ячейка: AG297. Результат выполнения частично представлен в таблице на рисунке 32.

Рис. 32.

4 3. Занесение данных в ячейку.

Параметры: - ячейка: E297; - данные: «=СУММ(F297:AG297)». Результат выполнения представлен на рисунке 33.

Рис. 33.

44. Занесение данных в ячейку.

Параметры: - ячейка: F298; - данные: «=F297/$E297». Результат выполнения представлен на рисунке 34.

Рис. 34.

45. Автозаполнение.

Параметры: - начальная ячейка: F298; - конечная ячейка: AG298. Результат выполнения частично представлен в таблице на рисунке 35.

Рис. 35.

46. Сохранение файла в сетевую папку.

Параметры: - сетевая папка: «//Public»;

- имя файла: «Энтони Гидденс - Социология.xls».

Цель проекта: определение принадлежности произвольно взятого текста к социологическим по средствам сравнения частот появления в нём терминов социологического словаря со средними частотами появления терминов социологического словаря в классических социологических произведениях.

Для этого целесообразно разделить реализацию описанного выше алгоритма, для каждого из перечисленных произведений, между несколькими авторами проекта, согласно таблице 3, каждый из которых будет выполнять анализ одного произведения, после чего, полученные каждым из авторов результаты могут быть объединены и использованы совместно, для формирования сводной таблицы результатов анализа и построения диаграммы, иллюстрирующей взаимосвязь отклонений относительной частоты δk и отклонения относительно частоты δ для анализируемого текста.

Таблица 3

Автор

Произведение

Автор 1

Волков Ю.Г. «Социология»

Автор 2

Захаров Н.Л. «Специфика социальной системы России»

Автор 3

Радаев В.В., Шкаратан О.И. «Социальная стратификация»

Автор 4

Федотова В.Г. «Социальные знания и социальные изменения»

Автор 5

Булгаков «Мастер и Маргарита»

Промежуточные результаты для произведения

Волкова Ю.Г. «Социология» представлены на рисунке 36.

Рис. 36.

Промежуточные результаты для произведения

Захарова Н.Л. «Специфика социальной системы России»

представлены на рисунке 37.

Рис. 37.

Промежуточные результаты для произведения

Радаева В.В., Шкаратан О.И. «Социальная стратификация»

представлены на рисунке 38.

Рис. 38.

Промежуточные результаты для произведения

Федотовой В.Г. «Социальные знания и социальные изменения»

представлены на рисунке 39.

Рис. 39.

Промежуточные результаты для произведения

Булгаков «Мастер и Маргарита» представлены на рисунке 40.

Рис. 40.

Перейдём к формированию сводной таблицы, содержащей значения относительные частоты встречи социологических терминов словаря Pjk на j-ую букву в каждом из анализируемых текстов, вычислению δk - отклонения относительной частоты встречи терминов словаря в каждом k-том тексте, а также нахождению среднего отклонения δср и построению графика, иллюстрирующего схожесть характера поведения частот появления социологических терминов словаря в текстах анализируемых произведений.

Для этого продолжим написание программы на языке макрокоманд. Так как любая программа требует отладки, будем проводить её посредствам сравнения получающихся в процессе написания программы результатов с образцами, представленными в виде рисунков.

47. Запустить программу Microsoft Excel. Результат выполнения представлен на рисунке 42.

Рис. 41.

4 8. Выбор активного листа.

Параметры: - лист: «Лист1». Результат выполнения представлен на рисунке 43.

Рис. 42.

49. Открытие файла Microsoft Excel из сетевой папки.

Параметры: - сетевая папка: «//Public»;

- имя файла: «Энтони Гидденс - Социология.xls».

50. Открытие файла Microsoft Excel из сетевой папки.

Параметры: - сетевая папка: «//Public»;

- имя файла: «Волков Ю.Г. - Социология.xls».

51. Открытие файла Microsoft Excel из сетевой папки.

Параметры: - сетевая папка: «//Public»;

- имя файла: «Захаров Н.Л. - Специфика социальной системы России.xls».

52. Открытие файла Microsoft Excel из сетевой папки.

Параметры: - сетевая папка: «//Public»;

- имя файла: «Радаев В.В. Шкаратан О.И. - Социальная стратификация.xls».

53. Открытие файла Microsoft Excel из сетевой папки.

Параметры: - сетевая папка: «//Public»;

  • имя файла: «Федотова В.Г. - Социальные знания и социальные изменения.xls».

54. Открытие файла Microsoft Excel из сетевой папки.

Параметры: - сетевая папка: «//Public»;

- имя файла: «Булгаков - Мастер и Маргарита.xls».

55. Активизация диапазона ячеек.

Параметры: - диапазон: F298÷AG298. Результат выполнения частично представлен на рисунке 36.

Рис. 43.

56. Копирование в буфер обмена Microsoft Excel.

57. Специальная вставка – транспонирование.

Параметры: - ячейка: A1. Результат выполнения частично представлен на рисунке 44.

Рис. 44.

Повторим шаги 55 – 57 для всех открытых файлов Microsoft Excel. Вставку из буфера будем производить в ячейки B1, C1, D1, E1 и F1 соответственно документа «Книга 1». Результат последовательного выполнения шагов 55 – 57 частично представлен на рисунке 45.

Рис. 45.

5 8. Занесение данных в ячейку.

Параметры: - ячейка: H2; - данные: «=СУММ(B2:F2)/5». Результат выполнения представлен на рисунке 46.

Рис. 46.

5 9. Автозаполнение.

Параметры: - начальный диапазон: H2; - конечная ячейка: H29. Результат выполнения частично представлен в таблице на рисунке 47.

Рис. 47.

60. Открытие файла Microsoft Excel из сетевой папки.

Параметры: - сетевая папка: «//Public»;

- имя файла: «Булгаков - Мастер и Маргарита.xls».

6 1. Активизация диапазона ячеек.

Параметры: - диапазон: D2÷D29. Результат выполнения частично представлен на рисунке 48.

Рис. 48.

62. Копирование в буфер обмена Microsoft Excel.

63. Выбор активного листа.

П араметры: - документ: «Книга 1.xls»; - лист: «Лист1». Результат выполнения представлен на рисунке 49.

Рис. 49.

64. Специальная вставка – значения.

Параметры: - ячейка: I2. Результат выполнения представлен на рисунке 50.

Рис. 50.

6 5. Занесение данных в ячейку.

Параметры: - ячейка: I30; - данные: «=СУММ(I2:I29)». Результат выполнения представлен на рисунке 51.

Рис. 51.

6 6. Занесение данных в ячейку.

Параметры: - ячейка: J2; - данные: «=I2/I$30». Результат выполнения представлен на рисунке 52.

Рис. 52.

67. Автозаполнение.

Параметры: - начальный диапазон: J2; - конечная ячейка: J29. Результат выполнения частично представлен в таблице на рисунке 53.

Рис. 53.

6 8. Занесение данных в ячейку.

Параметры: - ячейка: K2; - данные: «=ABS(B2-$H2)». Результат выполнения представлен на рисунке 54.

Рис. 54.

6 9. Автозаполнение.

Параметры: - начальный диапазон: K2; - конечная ячейка: K29. Результат выполнения частично представлен в таблице на рисунке 55.

Рис. 55.

70. Автозаполнение.

Параметры: - начальный диапазон: K2÷K29; - конечная ячейка: O29. Результат выполнения частично представлен в таблице на рисунке 56.

Рис. 56.

7 1. Занесение данных в ячейку.

Параметры: - ячейка: P2; - данные: «=МАКС(K2:O2)». Результат выполнения представлен на рисунке 57.

Рис. 57.

7 2. Автозаполнение.

Параметры: - начальный диапазон: P2; - конечная ячейка: P29. Результат выполнения частично представлен в таблице на рисунке 58.

Рис. 58.

7 3. Занесение данных в ячейку.

Параметры: - ячейка: P30; - данные: «=СУММ(P2:P29)». Результат выполнения представлен на рисунке 58.

Рис. 58.

74. Занесение данных в ячейку.

Параметры: - ячейка: Q2; - данные: «=ABS(G2-H2)». Результат выполнения представлен на рисунке 59.

Рис. 59.

75. Автозаполнение.

Параметры: - начальный диапазон: Q2; - конечная ячейка: Q29. Результат выполнения частично представлен в таблице на рисунке 60.

Рис. 60.

7 6. Занесение данных в ячейку.

Параметры: - ячейка: Q30; - данные: «=СУММ(Q2-Q29)». Результат выполнения представлен на рисунке 61.

Рис. 61.

74. Построение диаграммы.

Параметры: - тип: «гистограмма»; - вид: «первый»; - название оси Х: «bi»; - название оси Y: « ». Результат выполнения представлен на рисунке 62.

Рис. 62. Иллюстрация схожести характера частот появления социологических терминов словаря в текстах анализируемых произведений.

Итак, мы вычислили отклонения δ относительной частоты встречи социологических терминов словаря в анализируемых текстах от δ словаря, а также определи среднее отклонения δср = 0,18412481.

Мы также определили величины отклонения относительной частоты встречи социологических терминов словаря в тексте произведения Булгакова – «Мастер и Маргарита» δ= 0,365325133. Сравним его с показателем среднего отклонения δср = 0,18412481 и построим диаграмму, отображающую взаимосвязь отклонений относительной частоты δk и отклонения относительно частоты δ для анализируемого текста.

75. Построение диаграммы.

Параметры: - тип: «гистограмма»; - вид: «первый»; - название оси Х: «zk»; - название оси Y: « ». Результат выполнения представлен на рисунке 63.

Рис. 63. Иллюстрация различий характера частот появления социологических терминов словаря в текстах социологических произведений и тексте произведения Булгакова – «Матер и Маргарита».

Из диаграммы представленной на рисунке 63 заметно, что имеются значительные расхождения показателей δк словаря и δ анализируемого текста.

Сравнив величины отклонения относительной частоты встречи социологических терминов словаря в тексте произведения Булгакова – «Мастер и Маргарита» δ = 0,365325133 и показатель среднего отклонения δср = 0,18412481 очевидно, что δ произведения Булгакова – «Мастер и Маргарита» выходит за границы неравенства 7, из чего можно сделать вывод о том, что анализируемый текст не относится к социологическим.

Лабораторная работа №16