- •Компьютерный практикум
- •Макрокоманды программы Microsoft Word 2003
- •Макрокоманда: «Открытие окна программы Microsoft Word 2003»
- •Макрокоманда: «Установка параметров страницы»
- •Макрокоманда: «Переход на русскую раскладку клавиатуры»
- •Макрокоманда: «Переход на английскую раскладку клавиатуры»
- •Макрокоманда: «Установка автоматического переноса слов»
- •Макрокоманда: «Установка гарнитуры шрифта»
- •Макрокоманда: «Установка размера шрифта»
- •Макрокоманда: «Установка начертания шрифта»
- •Макрокоманда: «Выравнивание абзаца»
- •Макрокоманда: «Печать текста»
- •Макрокоманда: «Установка красной строки».
- •Макрокоманда: «Копирование формата»
- •Макрокоманда: «Выделение текста»
- •Макрокоманда: «Гашение выделения текста»
- •Макрокоманда: «Сохранение документа (файла) на диске»
- •Макрокоманда: «Закрытие окна программы Microsoft Word»
- •Макрокоманда: «Вставка таблицы»
- •Макрокоманда: «Выделение строк таблицы»
- •Макрокоманда: «Выделение столбцов таблицы»
- •Макрокоманда: «Выделение ячеек таблицы»
- •Макрокоманда: «Выравнивание текста ячейки таблицы по вертикали»
- •Макрокоманда: «Установка текстового курсора»
- •Макрокоманда: «Вставка пустой строки»
- •Макрокоманда: «Установка текстового курсора в ячейке таблицы»
- •Макрокоманда: «Установка заданной ширины столбцов»
- •Макрокоманда: «Автоматическое создание заголовка таблицы»
- •Макрокоманда: «Оъединение ячеек таблицы»
- •Макрокоманда: «Изменение ширины столбца»
- •М акрокоманда: «Выравнивание ширины столбцов»
- •Макрокоманда: «Создание нового документа»
- •Макрокоманда: «в ставка формулы»
- •Макрокоманда: «Выбор элемента панели инструментов «Формула»»
- •Макрокоманда: «Выбор из меню математических шаблонов и знаков»
- •Макрокоманда: «Увеличение символов формулы»
- •Макрокоманда: «Установка режима отображения сетки»
- •М акрокоманда «Установка линеек»
- •Макрокоманда: «Рисование стрелки»
- •Макрокоманда: «Рисование прямой линии»
- •Макрокоманда: «Вставка надписи»
- •Макрокоманда: «Установка цвета линии»
- •Макрокоманда: «Установка цвета заливки»
- •Макрокоманда: «Выделение объекта (объектов)»
- •Макрокоманда: «Группировка объектов»
- •Макрокоманда: «Копирование объекта»
- •Макрокоманда: «Вставка объекта»
- •Макрокоманда: «Перемещение объекта»
- •Макрокоманда: «Изменение ширины линии»
- •Макрокоманда: «Рисование кривой линии»
- •Макрокоманда: «Рисование автофигуры»
- •Макрокоманда: «Установка обтекания текстом»
- •Макрокоманда: «Замена символов в тексте»
- •Макрокоманды программы Microsoft Excel 2003.
- •1. Макрокоманда: «Включение компьютера и вход в систему».
- •2. Макрокоманда: «Запуск программы Microsoft Excel».
- •3. Макрокоманда: «Выбор активного листа».
- •4. Макрокоманда: «Занесение целых чисел в ячейку».
- •5. Макрокоманда: «Занесение целых чисел в диапазон ячеек».
- •6. Макрокоманда: «Занесение десятичных дробей в ячейку».
- •7. Макрокоманда: «Занесение десятичных дробей в диапазон ячеек».
- •8. Макрокоманда: «Занесение заголовка в ячейку».
- •9. Макрокоманда: «Активизация диапазона ячеек».
- •10. Макрокоманда «Сортировка данных».
- •11. Макрокоманда: «Активизация несвязанного диапазона ячеек».
- •12. Макрокоманда: «Форматирование ширины столбца».
- •13. Макрокоманда: «Форматирование высоты строки».
- •14. Макрокоманда: «Специальная вставка – транспонирование».
- •15. Макрокоманда: «Выбор языка клавиатуры».
- •16. Макрокоманда: «Объединение ячеек».
- •17. Макрокоманда: «Добавление нового листа в рабочую книгу Excel».
- •18. Макрокоманда «Вставка символа».
- •19. Макрокоманда: «Заполнение арифметической прогрессии».
- •20. Макрокоманда: «Закрытие программы Microsoft Excel».
- •21. Макрокоманда «Создание индекса».
- •22. Макрокоманда «Выделение границ ячейки».
- •23. Макрокоманда «Центрирование данных в ячейке».
- •24. Макрокоманда: «Копирование в буфер обмена».
- •25. Макрокоманда: «Построение диаграммы».
- •26. Макрокоманда: «Занесение формул в ячейку».
- •27. Макрокоманда: «Автозаполнение - нумерация».
- •28. Макрокоманда: «Автозаполнение - формула».
- •Технология набора текста Задание. Набрать нижеследующий текст, применяя необходимые операции форматирования, и сохранить текст на жестком диске компьютера.
- •Относительная частота.
- •Переход на русскую раскладку клавиатуры.
- •Установка автоматического переноса слов.
- •Закрытие окна программы Word.
- •Выключение компьютера.
- •Технология создания таблиц
- •Гашение выделения.
- •Переход на английскую раскладку клавиатуры.
- •Переход на русскую раскладку клавиатуры.
- •Закрытие окна программы Microsoft Word.
- •Операции над множествами
- •Последовательность макрокоманд выполнения задания
- •Переход на русскую раскладку клавиатуры.
- •Установка автоматического переноса слов.
- •Гашение выделения.
- •Переход на латинскую раскладку клавиатуры.
- •Гашение выделения.
- •Переход на русскую раскладку клавиатуры.
- •Гашение выделения.
- •Гашение выделения.
- •Гашение выделения.
- •Гашение выделения.
- •Закрытие окна программы Word.
- •Набор математических объектов и формул Задание 1. Набрать предложенную матрицу размером 3*3.
- •Последовательность макрокоманд выполнения задания.
- •Вызов редактора формул.
- •Вызов редактора формул.
- •Переход на английскую раскладку клавиатуры.
- •Вызов редактора формул.
- •Переход на английскую раскладку клавиатуры.
- •Задание 1. Набрать диаграмму Венна множеств (Рис1) .
- •Последовательность макрокоманд выполнения задания
- •Открытие окна программы Microsoft Word.
- •Частотный анализ поэтических текстов по начальной букве
- •Частотный анализ поэтических текстов по всем буквам.
- •Логические задачи в алгебре Буля
- •Где и в каком веке изготовлен сосуд? с помощью Булевой переменной введем обозначения:
- •Формальный анализ исторических явлений.
- •1. Цель проекта
- •2. Теоретическая часть.
- •Промежуточные результаты для первого блока проекта.
- •Промежуточные результаты для второго блока проекта.
- •Промежуточные результаты для третьего блока проекта.
- •Создание иллюстративных материалов к уроку с помощью программы Power Point –2000 с использованием Internet ресурсов.
- •Р Рис. 17 исование в графическом редакторе Paint.
- •Рисование шара в графическом редакторе PhotoShop.
- •Контент-анализ социологических текстов.
- •1. Теоретическая часть.
- •Лабораторная работа № 17 Создание шаблона титульного листа диплома в программе word.
Контент-анализ социологических текстов.
1. Теоретическая часть.
Исторически сложилась потребность в создании объективных методов анализа текстов, результаты которых не зависели бы ни от личности исследователя, ни от того, где и когда эти исследования проводятся.
В связи с этой необходимостью и возник метод называемый контент-анализом, как методика выявления частоты появления в тексте определенных, интересующих исследователя характеристик, которая позволяет ему делать некоторые выводы относительно намерений создателя этого текста или возможных реакций адресата.
Как правило метод контент-анализа связан с оценкой больших массивов текстов, что приводит к серьёзным затратам времени и сил исследователя для проведения его в ручном режиме.
В условиях развития современного информационного общества и связанным с этим развитием систем автоматизированной обработки информации представляется наиболее перспективным использование для проведения контент-анализа компьютерной техники. При этом исключается ряд негативных факторов, которые имеют место при ручной обработке текстов, такие как невнимательность исследователя; неоднозначность выводов при принятии определенных критериев оценки; трудоемкость решается за счет быстродействия компьютерной техники. Именно компьютерному методу контент-анализа текстов и посвящена данная работа.
Представим, что перед нами поставлена задача выявления принадлежности произвольного текста к текстам социологической направленности. Причем требуется, чтобы это делал не человек, а компьютер. Решение довольно очевидно. Текст может быть отнесен к социологическим в том случае, если частота встречаемости социологических терминов в нем близка к частоте встречаемости социологических терминов в классической социологической литературе. В качестве примера классических социологических текстов рассмотрим пять трудов касающихся различных аспектов социологической проблематики:
1. Энтони Гидденс «Социология»
2. Волков Ю.Г. «Социология»
3. Захаров Н.Л. «Специфика социальной системы России»
4. Радаев В.В., Шкаратан О.И. «Социальная стратификация»
5. Федотова В.Г. «Социальные знания и социальные изменения»
Проведём анализ этих текстов с целью подсчёта в них частот встречаемости социологических терминов ai. Для этого воспользуемся терминами социологического словаря позаимствованного из [1], представленными в Таблице 1.
Таблица 1
i |
Термин (a) |
i |
Термин (a) |
1 |
Абсентеизм |
148 |
Методология |
2 |
Абстракция |
149 |
Метод |
3 |
Автократия |
150 |
Методика |
4 |
Автономия |
151 |
Мода |
5 |
Авторитаризм |
152 |
Модель |
6 |
Авторитет |
153 |
Модератор |
7 |
Агрегация |
154 |
Молодежь |
8 |
Агрессия |
155 |
Момент |
9 |
Адаптация |
156 |
Мониторинг |
10 |
Аддитивность |
157 |
Мотивация |
11 |
Адаптивность |
158 |
Мультиколлинеарность |
12 |
Администрация |
159 |
Мультипликативность |
13 |
Адресат |
160 |
Наблюдение |
14 |
Адресант |
161 |
Надежность |
15 |
Адрес |
162 |
Направленность |
16 |
Аккомодация |
163 |
Народность |
17 |
Аккультурация |
164 |
Нарративность |
18 |
Аксиология |
165 |
Насилие |
19 |
Активность |
166 |
Наука |
20 |
Акцентуация |
167 |
Национализм |
21 |
Амальгамизация |
168 |
Нация |
22 |
Анализ |
169 |
Норма |
23 |
Анкета |
170 |
Нормакультурная |
24 |
Анкетер |
171 |
Норма |
25 |
Анкетирование |
172 |
Образование |
26 |
Аномия |
173 |
Объект |
27 |
Антецедентная |
174 |
Общение |
28 |
Арбитраж |
175 |
Общество |
29 |
Ассимиляция |
176 |
Объем |
30 |
Аудитория |
177 |
Омнибус |
31 |
Аутгруппа |
178 |
Операционализация |
32 |
Банк |
179 |
Опрос |
33 |
Барьеры |
180 |
Организация |
34 |
Бета-вес |
181 |
Открытие |
35 |
Бета-коэффициент |
182 |
Ошибка |
36 |
Бланк |
183 |
Панель |
37 |
Блокада |
184 |
Парадокс |
38 |
Брак |
185 |
Параметр |
39 |
Бюрократия |
186 |
Партия |
40 |
Быт |
187 |
Пат-анализ |
41 |
Валентность |
188 |
Переменная |
42 |
Валидность |
189 |
План |
43 |
Верификация |
190 |
Племя |
44 |
Взаимодействие |
191 |
Поведение |
45 |
Взаимоисключаемость |
192 |
Подчинение |
46 |
Взвешенность |
193 |
Показатель |
47 |
Власть |
194 |
Политика |
48 |
Влияние |
195 |
Понятие |
49 |
Вопрос |
196 |
Право |
50 |
Выборка |
197 |
Правонарушение |
51 |
Гайд |
198 |
Правоприменение |
52 |
Гамма-коэффициент |
199 |
Правоспособность |
53 |
Генерализуемость |
200 |
Правотворчество |
54 |
Гетерогенность |
201 |
Предмет |
55 |
Гипотеза |
202 |
Преступление |
56 |
Гистограмма |
203 |
Принцип |
57 |
Гомогенность |
204 |
Приспособление |
58 |
Господство |
205 |
Проактивность |
59 |
Государство |
206 |
Прогноз |
60 |
Группа |
207 |
Программа |
61 |
График |
208 |
Прогресс |
62 |
Данные |
209 |
Проект |
63 |
Движение |
210 |
Переменная |
64 |
Девиация |
211 |
Поведение |
65 |
Дедукция |
212 |
Процедура |
66 |
Действие |
213 |
Процесс |
67 |
Делинквент |
214 |
Рандомизация |
68 |
Демография |
215 |
Расы |
69 |
Деноминация |
216 |
Реактивность |
70 |
Деятельность |
217 |
Революция |
71 |
Диаграмма |
218 |
Регресс |
72 |
Дизайн |
219 |
Резюме |
73 |
Дискриминация |
220 |
Рейтинг |
74 |
Дискриминация |
221 |
Религия |
75 |
Дисперсия |
222 |
Репрезентативность |
76 |
Диспозиция |
223 |
Распределение |
77 |
Дистанция |
224 |
Респондент |
78 |
Дифференциация |
225 |
Реформа |
79 |
Документ |
226 |
Реципиент |
80 |
Достоверность |
227 |
Род |
81 |
Досуг |
228 |
Ряды |
82 |
Единицы |
229 |
Самосознание |
83 |
Зависимость |
230 |
Самооценка |
84 |
Задачи |
231 |
Сектор |
85 |
Закон |
232 |
Семья |
86 |
Знак |
233 |
Сеть |
87 |
Значение |
234 |
Скринер |
88 |
Игра |
235 |
Сила |
89 |
Идентификация |
236 |
Система |
90 |
Идентичность |
237 |
Систематизация |
91 |
Иерархия |
238 |
Случайность |
92 |
Измерение |
239 |
Собственность |
93 |
Изобретение |
240 |
Совокупность |
94 |
Изоляция |
241 |
Семья |
95 |
Имитация |
242 |
Содержание |
96 |
Индекс |
243 |
Соперничество |
97 |
Индикатор |
244 |
Сотрудничество |
98 |
Индукция |
245 |
Социализация |
99 |
Ингруппа |
246 |
Социология |
100 |
Институт |
247 |
Спецификация |
101 |
Институционализация |
248 |
Спираль |
102 |
Инструкция |
249 |
Стандартизовать |
103 |
Инструментарий |
250 |
Стандартное отклонение |
104 |
Интеграция |
251 |
Статистика |
105 |
Интенсивность |
252 |
Статистическая связь |
106 |
Интервью |
253 |
Статус |
107 |
Интервьюер |
254 |
Степень |
108 |
Интерес |
255 |
Стимул |
109 |
Интернет-вопрос |
256 |
Страта |
110 |
Интернет-исследование |
257 |
Структура |
111 |
Интернет-опрос |
258 |
Стратификация |
112 |
Интерпретация |
259 |
Структура |
113 |
Информация |
260 |
Субкультура |
114 |
Исследование |
261 |
Таблица |
115 |
Казуальность |
262 |
Теория |
116 |
Категория |
263 |
Терпимость |
117 |
Квантиль |
264 |
Тест-эффект |
118 |
Квота |
265 |
Техника |
119 |
Кейс-стади |
266 |
Труд |
120 |
Ключ |
267 |
Убеждение |
121 |
Кластер |
268 |
Управление |
122 |
Книга |
269 |
Условиятруда |
123 |
Конфликт |
270 |
Установка |
124 |
Кодирование |
271 |
Фокус-группа |
125 |
Кодировщик |
272 |
Формальнаямодель |
126 |
Коммуникатор |
273 |
Фрустрация |
127 |
Коммуникация |
274 |
Функция |
128 |
Компромисс |
275 |
Хи-квадрат |
129 |
Контент-анализ |
276 |
Холл-тест |
130 |
Контркультура |
277 |
Целедостижение |
131 |
Контроль |
278 |
Цель |
132 |
Конфликт |
279 |
Цивилиация |
133 |
Кооперация |
280 |
Частота |
134 |
Конкуренция |
281 |
Шкала |
135 |
Корреляция |
282 |
Шкала Лайкерта |
136 |
Каузация |
283 |
Шкала интервалов |
137 |
Коэффициент |
284 |
Шкалаотношений |
138 |
Культура |
285 |
Шкальная оценка |
139 |
Лидерство |
286 |
Эволюция |
140 |
Линия |
287 |
Эквивалентность |
141 |
Личность |
288 |
Экосистема |
142 |
Лямбда-коэффициент |
289 |
Эксперимент |
143 |
Матрица |
290 |
Электорат |
144 |
Маргинал |
291 |
Эмпирический |
145 |
Модель |
292 |
Этапы |
146 |
Медиана |
293 |
Этнос |
147 |
Менталитетет |
294 |
Этноцентризм |
В Таблице 1 представлен социологически словарь, состоящий из n = 294 социологических терминов. Выделим в нём j = 28 групп, в каждую из которых будут входят социологические термины, начинающиеся с j-той буквы алфавита, представленного в Таблице 2. Данная группировка проводится с целью упрощения дальнейшего построения статистических сводок.
Таблица 2
j |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
Буква |
А |
б |
в |
г |
д |
е |
ж |
з |
и |
к |
л |
м |
н |
о |
j |
15 |
16 |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
25 |
26 |
27 |
28 |
Буква |
П |
р |
с |
т |
у |
ф |
х |
ц |
ч |
ш |
щ |
э |
ю |
я |
Учитывая неравное количество терминов, входящих в каждую j-ую группу словаря, построим статистическую сводку, отражающую количественное соотношение содержания в словаре социологических терминов на j-тую букву алфавита, что в свою очередь позволит оценить распределение встречи социологических терминов в вышеуказанных текстах, для чего вычислим количество nj терминов словаря на j-тую букву алфавита (простые частоты), согласно формуле (1) и проиллюстрируем полученный результат с помощью диаграммы.
, где mj – число слов на j-тую букву (1)
Так как анализ простых частот не являются оптимальным при оценке текстов, что связано с неоднозначностью оценок возникающих при анализе текстов различной длины, для проведения дальнейшего анализа и построения статистических сводок перейдём к относительным частотам, для чего подсчитаем суммарное количество социологических терминов словаря N согласно формуле (2) и вычислим относительную частоту встречи в словаре социологических терминов Pj на j-ую букву алфавита согласно формуле (3).
(2)
(3)
Для оценки встречаемости социологических терминов словаря и построения статистической сводки, отражающей относительную частоту появления социологических терминов словаря, начинающиеся с j-той буквы алфавита в каждом из указанных выше социологических текстах k, проведём подсчёт встречаемости терминов словаря в каждом k-том тексте, после чего вычислим относительные частоты встречи социологических терминов словаря Pjk на j-ую букву в каждом из анализируемых текстов по следующей формуле
, где k = 1, 2 …, 5 (4)
После этого вычислим δk - отклонение относительной частоты появления терминов словаря в каждом k-том тексте с целью нахождения среднего отклонения δср по формуле (6), попадание, в границы значений которого будет означать, что анализируемый текст относится к социологическим. Для этого воспользуемся следующей формулой
(5)
δср = δk / 5 (6)
Далее проведём анализ произвольно взятого текста на предмет его принадлежности к социологическим текстам. В качестве произвольного текста возьмём произведение Булгакова – «Мастер и Маргарита».
Для проведения анализа и выявления того, относится ли данный текст к социологическим вычислим для этого текста значение δ по аналогии с предыдущими проанализированными нами текстами, и определим, не выходит ли данное значение за границы интервала, характеризуемого следующим неравенством:
(7)
Если значение δ анализируемого текста не выходит за границы неравенства (7), будем считать, что данный текст относится к социологическим. Полученный результат проиллюстрируем с помощью диаграммы.
Реализацию описанного выше алгоритма продемонстрируем на текстах Энтони Гидденса «Социология», Волков Ю.Г. «Социология», Захарова Н.Л. «Специфика социальной системы России», Радаева В.В., Шкаратана О.И. «Социальная стратификация», Федотовой В.Г. «Социальные знания и социальные изменения» с помощью информационных технологий.
Для этого в сети Интернет с помощью поисковой системы Рамблер найдём тексты данных произведения в электронной форме, для чего воспользуемся специализированной программой-браузером Internet Explorer.
После запуска Internet Explorer введём в его адресную строку, следующую запись «www.rambler.ru» и выполним однократное нажатие клавиши Ввод (Enter) на клавиатуре.
В результате этих действий в окне программы Internet Explorer отобразиться Web-страница поисковой системы Рамблер. Далее, на отобразившейся странице, в строке поиска введём запрос «Энтони Гидденс Социология», подведём указатель мыши к кнопке «Поиск» и выполним однократное нажатие левой клавиши мыши.
После этого, поисковая система Рамблер проведёт поиск сайтов, удовлетворяющих условию нашего запроса и отобразит их список в порядке уменьшения популярности.
Выберем один из ресурсов, расположенных вначале полученного списка и перейдём на него, для чего подведём курсор мыши к названию этого ресурса и выполним однократное нажатие левой клавиши мыши.
После перехода на страницы выбранного ресурса, найдём на них ссылку на документ, содержащий текст произведения Энтони Гидденса «Социология» и загрузим его на локальный компьютер, на котором планируется проведение его анализа с помощью вышеуказанного алгоритма. Для этого подведём курсор мыши к найденной ссылке и выполним однократное нажатие правой клавиши мыши. Далее, в появившемся контекстном меню, подведём курсор мыши к команде «Сохранить как» и выполним однократное нажатие левой клавиши мыши. Документ будет сохранён в указанную нами папку на локальном компьютере.
Теперь, имея в наличие электронную версию произведения Энтони Гидденса «Социология» проведём его анализ, используя вышеописанный алгоритм. Для чего, первоначально, проведём подсчёт появления каждого термина словаря в данном тексте.
Для этого воспользуемся редактором Microsoft Word из пакета Microsoft Office. После запуска Microsoft Word откроем в нём документ, содержащий текст анализируемого нами произведения и перейдём во встроенный редактор VBA (Visual Basic for Application), для чего выполним одновременное нажатие клавиш Alt + F11 на клавиатуре. После чего, напишем макрос, который будет проводить подсчёт появления каждого термина словаря в тексте произведения.
После создания макроса, запустим его на выполнение. С этой целью подведём курсор мыши к имени меню «Сервис», которое расположено в строке меню и выполним однократное нажатие левой клавиши мыши. В появившемся каскадном меню подведём курсор мыши к команде «Макрос», после чего, в появившемся меню подведём курсор мыши к команде «Макросы» и выполним однократное нажатие левой клавиши мыши. Далее, в появившемся диалоговом окне «Макрос» подведём курсор мыши к кнопке «Выполнить» и выполним однократное нажатие левой клавиши мыши.
Макрос проведёт замену встретившихся в тексте терминов словаря и на константы вида «$$$Word» + «номер слова из словаря» + «$$$», что необходимо для проведения расчётов с использованием программы Microsoft Excel.
Далее, преобразуем, текст данного произведения таким образом, чтобы на каждой строке документа, содержащего данный текст, находилось лишь одно слово или предлог, для чего подведём курсор мыши к имени меню «Правка» расположенного в строке главное меню Microsoft Word и выполним однократное нажатие левой клавиши мыши. В открывшемся каскадном меню подведём курсор мыши к команде «Заменить» и выполним однократное нажатие левой клавиши мыши. Далее, в появившемся диалоговом окне «Найти и заменить» в текстовое поле «Найти» введём символ пробел, а в текстовое поле «Заменить на» служебный символ «^p». После чего подведём курсор мыши к кнопке «Заменить всё» и выполним однократное нажатие левой клавиши мыши.
В результате проделанных действий, получим документ, содержащий текст произведения Энтони Гидденса «Социология», в котором на каждой строке документа находится лишь одно слово или предлог.
Для проведения дальнейшего анализа по указанному выше алгоритму, перенесём преобразованный текст в программу Microsoft Excel, для чего скопируем его в буфер обмена в программе Microsoft Word, откроем программу Microsoft Excel, активизируем ячейку B1 на Листе 1 рабочей книги Excel и выполним вставку из буфера обмена. После чего перенесём в Microsoft Excel термины словаря, для чего откроем файл, содержащий словарь, скопируем его в буфер обмена, откроем окно программы Microsoft Excel, активизируем ячейку A1 на Листе 1 рабочей книги Excel и выполним вставку из буфера обмена.
Теперь, проведём подсчёт появления каждого термина словаря в анализируемом тексте. Для этого воспользуемся существующей в программе Microsoft Excel статистической функцией «СЧЁТЕСЛИ». В качестве первого аргумента функции будем использовать диапазон ячеек, в которых расположен текст – B:B. В качестве второго аргумента, будем использовать термины словаря, расположенные в столбце A.
В результате проведения расчетов с использованием статистической функции «СЧЁТЕСЛИ» получим ряд значений ai появления каждого термина словаря в тексте произведения Энтони Гидденса «Социология». После чего вычислим с помощью программы Excel количество nj терминов словаря на j-тую букву алфавита, согласно формуле (1) и проиллюстрируем полученный результат с помощью диаграммы.
Для проведения дальнейшего анализа и построения статистических сводок вычислим относительные частоты появления терминов словаря Pj, начинающихся на j-тую букву алфавита по формуле 3, для чего, первоначально, вычислим общее количество социологических терминов словаря N согласно формуле (2).
Далее, проведём подсчёт встречаемости терминов словаря в анализируемом тексте, после чего вычислим относительную частоту появления социологических терминов словаря Pjk на j-ую букву, учитывая, что k – порядковый номер анализируемого текста, равен единице, по формуле 4 и сохраним результат вычислений.
Перейдём к реализации описанного выше алгоритма, для произведения Энтони Гидденса «Социология», для чего напишем программу на языке макрокоманд. Так как любая программа требует отладки, будем проводить её посредствам сравнения получающихся в процессе написания программы результатов с образцами, представленными в виде рисунков.
1 . Включение компьютера и вход в систему. Результат выполнения представлен на рисунке 1.
Рис. 1.
2 . Запуск программы Microsoft Internet Explorer.
Результат выполнения представлен на рисунке 2.
Рис. 2.
3 . Открытие Web-страницы – ввод адреса.
Параметры: - адрес: «http://www.rambler.ru/»
Результат выполнения представлен на рисунке 3.
Рис. 3.
4. Поиск Web-ресурса с помощью поисковой системы Rambler.
Параметры: - запрос: «Энтони Гидденс Социология»
Результат выполнения частично представлен на рисунке 4.
Рис. 4.
5. Открытие Web-страницы – переход по ссылке.
Параметры: - ссылка: «Энтони Гидденс. Социология | socioline.ru»
Результат выполнения представлен на рисунке 5.
Рис. 5.
6. Загрузка файла с помощью программы Microsoft Internet Explorer. Параметры: - ссылка: «скачать doc (5,9 Mb)»; - папка: «Мои документы»; - имя файла: «Энтони Гидденс - Социология.doc»
7. Запустить программу Microsoft Excel. Результат выполнения частично представлен на рисунке 6.
Рис. 6.
8 . Выбор активного листа.
Параметры: - лист: «Лист1». Результат выполнения представлен на рисунке 7.
Рис. 7.
9. Форматирование высоты строк.
П араметры: - диапазон строк: 1295; - высота: 18 мм. Результат выполнения представлен на рисунке 8.
Рис. 8.
1 0. Форматирование ширины столбца.
Параметры: - столбец: A; - ширина: 32 мм. Результат выполнения представлен на рисунке 9.
Рис. 9.
1 1. Выбор языка клавиатуры.
Параметры: - язык: Русский. Результат выполнения представлен на рисунке 10.
Рис. 10.
1 2. Занесение данных в ячейку.
Параметры: - ячейка: A1, B1; - данные: «Словарь», «i». Результат выполнения представлен на рисунке 11.
Рис. 11.
1 3. Занесение данных в ячейку.
Параметры: - ячейка: C2C295; - данные: «данные таблицы 2». Результат выполнения представлен на рисунке 12.
Рис. 12.
1 4. Занесение данных в ячейку.
Параметры: - ячейка: B2; - данные: «=ЛЕВСИМВ(A2:A295;1)». Результат выполнения представлен на рисунке 13. Рис. 13.
1 5. Автозаполнение.
Параметры: - начальная ячейка: B2; - конечная ячейка: B295. Результат выполнения частично представлен в таблице на рисунке 14.
Рис. 14.
1 6. Занесение данных в ячейку.
Параметры: - ячейка: B2; - данные: «=ЛЕВСИМВ(A2:A295;1)». Результат выполнения представлен на рисунке 13. Рис. 13.
1 7. Занесение данных в ячейку.
Параметры: - ячейка: C2C29; - данные: «данные таблицы 2». Результат выполнения представлен на рисунке 14.
Рис. 14.
18. Занесение данных в ячейку.
Параметры: - ячейка: D2; - данные: «=СЧЁТЕСЛИ(B$2:B$295;C2)». Результат выполнения представлен на рисунке 15. Рис. 15.
1 9. Автозаполнение.
Параметры: - начальная ячейка: D2; - конечная ячейка: D29. Результат выполнения частично представлен в таблице на рисунке 16.
Рис. 16.
2 0. Занесение данных в ячейку.
Параметры: - ячейка: E2, E3; - данные: «1», «2». Результат выполнения представлен на рисунке 17.
Рис. 17.
2 1. Активизация диапазона ячеек.
Параметры: - диапазон: E2÷E3. Результат выполнения представлен на рисунке 18.
Рис. 18.
22. Автозаполнение.
Параметры: - начальная ячейка: E2÷E3; - конечная ячейка: E295. Результат выполнения частично представлен в таблице на рисунке 19.
Рис. 19.
2 3. Форматирование ширины столбца.
Параметры: - диапазон столбцов: F÷AG; - ширина: 5 мм. Результат выполнения частично представлен на рисунке 20.
Рис. 20
2 4. Активизация диапазона ячеек.
Параметры: - диапазон: C2÷C29. Результат выполнения частично представлен на рисунке 21.
Рис. 21.
25. Копирование в буфер обмена.
26. Специальная вставка – транспонирование.
Параметры: - ячейка: F1.
Результат выполнения частично представлен на рисунке 22.
Рис. 22.
27. Запуск программы Microsoft Word.
Результат выполнения представлен на рисунке 23.
Рис. 23.
28. Запись макроса.
Параметры: - название макроса: «Анализ».
29. Открытие макроса MS Excel для редактирования.
Параметры: - название макроса: «Анализ».
30. Сохранение файла на диск.
Параметры: - имя файла: «шаблон_анализа.doc».
3 1. Открытие документа Microsoft Word. Параметры: - имя файла: «Энтони Гидденс - Социология.doc». Результат выполнения представлен на рисунке 24.
Рис. 24.
32. Сохранение документа Microsoft Word.
Параметры: - имя файла: «Энтони Гидденс - Социология.txt».
33. Открытие документа Microsoft Word. Параметры: - имя файла: «Энтони Гидденс - Социология.txt». Результат выполнения представлен на рисунке 25.
Рис. 25.
34. Запуск макроса.
Параметры: - название макроса: «Анализ».
35. Замена символов Microsoft Word. Параметры: - заменяемый символ: «пробел»; - заменяющий символ: «^p». Результат выполнения представлен на рисунке 26.
Рис. 26.
36. Копирование в буфер обмена Microsoft Word.
37. Вставка из буфера обмена Microsoft Excel.
Параметры: - ячейка: AH2. Результат выполнения частично представлен на рисунке 27.
Рис. 27.
38. Занесение данных в ячейку.
Параметры: - ячейка: F2; - данные: «=ЕСЛИ($B2=F$1;СЧЁТЕСЛИ($AH:$AL;"$$$Word" & $E2 & "$$$");0)». Результат выполнения представлен на рисунке 28.
Рис. 28.
3 9. Автозаполнение.
Параметры: - начальная ячейка: F2;
- конечная ячейка: F295. Результат выполнения частично представлен в таблице на рисунке 29. Рис. 29.
40. Автозаполнение.
Параметры: - начальная ячейка: F2÷ F295; - конечная ячейка: AG295. Результат выполнения частично представлен в таблице на рисунке 30.
Рис. 30.
4 1. Занесение данных в ячейку.
Параметры: - ячейка: F297; - данные: «=СЧЁТЕСЛИ(F2:F295;">0")». Результат выполнения представлен на рисунке 31.
Рис. 31.
42. Автозаполнение.
Параметры: - начальная ячейка: F297; - конечная ячейка: AG297. Результат выполнения частично представлен в таблице на рисунке 32.
Рис. 32.
4 3. Занесение данных в ячейку.
Параметры: - ячейка: E297; - данные: «=СУММ(F297:AG297)». Результат выполнения представлен на рисунке 33.
Рис. 33.
44. Занесение данных в ячейку.
Параметры: - ячейка: F298; - данные: «=F297/$E297». Результат выполнения представлен на рисунке 34.
Рис. 34.
45. Автозаполнение.
Параметры: - начальная ячейка: F298; - конечная ячейка: AG298. Результат выполнения частично представлен в таблице на рисунке 35.
Рис. 35.
46. Сохранение файла в сетевую папку.
Параметры: - сетевая папка: «//Public»;
- имя файла: «Энтони Гидденс - Социология.xls».
Цель проекта: определение принадлежности произвольно взятого текста к социологическим по средствам сравнения частот появления в нём терминов социологического словаря со средними частотами появления терминов социологического словаря в классических социологических произведениях.
Для этого целесообразно разделить реализацию описанного выше алгоритма, для каждого из перечисленных произведений, между несколькими авторами проекта, согласно таблице 3, каждый из которых будет выполнять анализ одного произведения, после чего, полученные каждым из авторов результаты могут быть объединены и использованы совместно, для формирования сводной таблицы результатов анализа и построения диаграммы, иллюстрирующей взаимосвязь отклонений относительной частоты δk и отклонения относительно частоты δ для анализируемого текста.
Таблица 3
Автор |
Произведение |
Автор 1 |
Волков Ю.Г. «Социология» |
Автор 2 |
Захаров Н.Л. «Специфика социальной системы России» |
Автор 3 |
Радаев В.В., Шкаратан О.И. «Социальная стратификация» |
Автор 4 |
Федотова В.Г. «Социальные знания и социальные изменения» |
Автор 5 |
Булгаков «Мастер и Маргарита» |
Промежуточные результаты для произведения
Волкова Ю.Г. «Социология» представлены на рисунке 36.
Рис. 36.
Промежуточные результаты для произведения
Захарова Н.Л. «Специфика социальной системы России»
представлены на рисунке 37.
Рис. 37.
Промежуточные результаты для произведения
Радаева В.В., Шкаратан О.И. «Социальная стратификация»
представлены на рисунке 38.
Рис. 38.
Промежуточные результаты для произведения
Федотовой В.Г. «Социальные знания и социальные изменения»
представлены на рисунке 39.
Рис. 39.
Промежуточные результаты для произведения
Булгаков «Мастер и Маргарита» представлены на рисунке 40.
Рис. 40.
Перейдём к формированию сводной таблицы, содержащей значения относительные частоты встречи социологических терминов словаря Pjk на j-ую букву в каждом из анализируемых текстов, вычислению δk - отклонения относительной частоты встречи терминов словаря в каждом k-том тексте, а также нахождению среднего отклонения δср и построению графика, иллюстрирующего схожесть характера поведения частот появления социологических терминов словаря в текстах анализируемых произведений.
Для этого продолжим написание программы на языке макрокоманд. Так как любая программа требует отладки, будем проводить её посредствам сравнения получающихся в процессе написания программы результатов с образцами, представленными в виде рисунков.
47. Запустить программу Microsoft Excel. Результат выполнения представлен на рисунке 42.
Рис. 41.
4 8. Выбор активного листа.
Параметры: - лист: «Лист1». Результат выполнения представлен на рисунке 43.
Рис. 42.
49. Открытие файла Microsoft Excel из сетевой папки.
Параметры: - сетевая папка: «//Public»;
- имя файла: «Энтони Гидденс - Социология.xls».
50. Открытие файла Microsoft Excel из сетевой папки.
Параметры: - сетевая папка: «//Public»;
- имя файла: «Волков Ю.Г. - Социология.xls».
51. Открытие файла Microsoft Excel из сетевой папки.
Параметры: - сетевая папка: «//Public»;
- имя файла: «Захаров Н.Л. - Специфика социальной системы России.xls».
52. Открытие файла Microsoft Excel из сетевой папки.
Параметры: - сетевая папка: «//Public»;
- имя файла: «Радаев В.В. Шкаратан О.И. - Социальная стратификация.xls».
53. Открытие файла Microsoft Excel из сетевой папки.
Параметры: - сетевая папка: «//Public»;
имя файла: «Федотова В.Г. - Социальные знания и социальные изменения.xls».
54. Открытие файла Microsoft Excel из сетевой папки.
Параметры: - сетевая папка: «//Public»;
- имя файла: «Булгаков - Мастер и Маргарита.xls».
55. Активизация диапазона ячеек.
Параметры: - диапазон: F298÷AG298. Результат выполнения частично представлен на рисунке 36.
Рис. 43.
56. Копирование в буфер обмена Microsoft Excel.
57. Специальная вставка – транспонирование.
Параметры: - ячейка: A1. Результат выполнения частично представлен на рисунке 44.
Рис. 44.
Повторим шаги 55 – 57 для всех открытых файлов Microsoft Excel. Вставку из буфера будем производить в ячейки B1, C1, D1, E1 и F1 соответственно документа «Книга 1». Результат последовательного выполнения шагов 55 – 57 частично представлен на рисунке 45.
Рис. 45.
5 8. Занесение данных в ячейку.
Параметры: - ячейка: H2; - данные: «=СУММ(B2:F2)/5». Результат выполнения представлен на рисунке 46.
Рис. 46.
5 9. Автозаполнение.
Параметры: - начальный диапазон: H2; - конечная ячейка: H29. Результат выполнения частично представлен в таблице на рисунке 47.
Рис. 47.
60. Открытие файла Microsoft Excel из сетевой папки.
Параметры: - сетевая папка: «//Public»;
- имя файла: «Булгаков - Мастер и Маргарита.xls».
6 1. Активизация диапазона ячеек.
Параметры: - диапазон: D2÷D29. Результат выполнения частично представлен на рисунке 48.
Рис. 48.
62. Копирование в буфер обмена Microsoft Excel.
63. Выбор активного листа.
П араметры: - документ: «Книга 1.xls»; - лист: «Лист1». Результат выполнения представлен на рисунке 49.
Рис. 49.
64. Специальная вставка – значения.
Параметры: - ячейка: I2. Результат выполнения представлен на рисунке 50.
Рис. 50.
6 5. Занесение данных в ячейку.
Параметры: - ячейка: I30; - данные: «=СУММ(I2:I29)». Результат выполнения представлен на рисунке 51.
Рис. 51.
6 6. Занесение данных в ячейку.
Параметры: - ячейка: J2; - данные: «=I2/I$30». Результат выполнения представлен на рисунке 52.
Рис. 52.
67. Автозаполнение.
Параметры: - начальный диапазон: J2; - конечная ячейка: J29. Результат выполнения частично представлен в таблице на рисунке 53.
Рис. 53.
6 8. Занесение данных в ячейку.
Параметры: - ячейка: K2; - данные: «=ABS(B2-$H2)». Результат выполнения представлен на рисунке 54.
Рис. 54.
6 9. Автозаполнение.
Параметры: - начальный диапазон: K2; - конечная ячейка: K29. Результат выполнения частично представлен в таблице на рисунке 55.
Рис. 55.
70. Автозаполнение.
Параметры: - начальный диапазон: K2÷K29; - конечная ячейка: O29. Результат выполнения частично представлен в таблице на рисунке 56.
Рис. 56.
7 1. Занесение данных в ячейку.
Параметры: - ячейка: P2; - данные: «=МАКС(K2:O2)». Результат выполнения представлен на рисунке 57.
Рис. 57.
7 2. Автозаполнение.
Параметры: - начальный диапазон: P2; - конечная ячейка: P29. Результат выполнения частично представлен в таблице на рисунке 58.
Рис. 58.
7 3. Занесение данных в ячейку.
Параметры: - ячейка: P30; - данные: «=СУММ(P2:P29)». Результат выполнения представлен на рисунке 58.
Рис. 58.
74. Занесение данных в ячейку.
Параметры: - ячейка: Q2; - данные: «=ABS(G2-H2)». Результат выполнения представлен на рисунке 59.
Рис. 59.
75. Автозаполнение.
Параметры: - начальный диапазон: Q2; - конечная ячейка: Q29. Результат выполнения частично представлен в таблице на рисунке 60.
Рис. 60.
7 6. Занесение данных в ячейку.
Параметры: - ячейка: Q30; - данные: «=СУММ(Q2-Q29)». Результат выполнения представлен на рисунке 61.
Рис. 61.
74. Построение диаграммы.
Параметры: - тип: «гистограмма»; - вид: «первый»; - название оси Х: «bi»; - название оси Y: « ». Результат выполнения представлен на рисунке 62.
Рис. 62. Иллюстрация схожести характера частот появления социологических терминов словаря в текстах анализируемых произведений.
Итак, мы вычислили отклонения δ относительной частоты встречи социологических терминов словаря в анализируемых текстах от δ словаря, а также определи среднее отклонения δср = 0,18412481.
Мы также определили величины отклонения относительной частоты встречи социологических терминов словаря в тексте произведения Булгакова – «Мастер и Маргарита» δ= 0,365325133. Сравним его с показателем среднего отклонения δср = 0,18412481 и построим диаграмму, отображающую взаимосвязь отклонений относительной частоты δk и отклонения относительно частоты δ для анализируемого текста.
75. Построение диаграммы.
Параметры: - тип: «гистограмма»; - вид: «первый»; - название оси Х: «zk»; - название оси Y: « ». Результат выполнения представлен на рисунке 63.
Рис. 63. Иллюстрация различий характера частот появления социологических терминов словаря в текстах социологических произведений и тексте произведения Булгакова – «Матер и Маргарита».
Из диаграммы представленной на рисунке 63 заметно, что имеются значительные расхождения показателей δк словаря и δ анализируемого текста.
Сравнив величины отклонения относительной частоты встречи социологических терминов словаря в тексте произведения Булгакова – «Мастер и Маргарита» δ = 0,365325133 и показатель среднего отклонения δср = 0,18412481 очевидно, что δ произведения Булгакова – «Мастер и Маргарита» выходит за границы неравенства 7, из чего можно сделать вывод о том, что анализируемый текст не относится к социологическим.
Лабораторная работа №16