Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Tolstova_Analiz_soc_dannyh

.pdf
Скачиваний:
28
Добавлен:
30.05.2015
Размер:
3.73 Mб
Скачать

Описанные модели являются очень полезными для социолога. Для интерпретации полученных с их помощью результатов можно использовать описанные в п. 2.6.4 приемы.

Отличие будет состоять в трактовке того, что стоит в левой части найденного регрессионного уравнения. Эта трактовка определяется тем, что было только что сказано нами. Ясно, что использование упомянутых моделей расширяет круг решаемых с помощью НРА задач.

261

ПРИЛОЖЕНИЯ К ЧАСТИ II

Приложение I

Разные способы расчета медианы и предполагаемые ими модели

Опишем разные способы расчета медианы на примере.

Предположим, что для 10 школьников значения коэффициента IQ, определенные с помощью шкалы интеллекта Стенфорда-Бине, оказались равными:

113, 120, 119, 115, 122, 126, 120, 112, 120, 119.

Известно, что значением коэффициента может быть любое целое число от 0 до 150.

Покажем, каким способами можно рассчитать медиану этого распределения.

Прежде всего необходимо определить тип используемой шкалы. Учитывая, что множество шкальных значений велико и что пороги различимости различий между соседними шкальными значениями для человека (и для респондента, и для социолога) достаточно велики,

будем считать, что равенства типа 128-127=113-112 отражают реальность. Поэтому будем считать шкалу интервальной (полагаем очевидным то, что отношения равенства и порядка между шкальными значениями тоже отражают одноименные эмпирические отношения).

Способ расчета медианы и, как следствие, получаемое значение искомой величины определяется модельными соображениями, интерпретацией исходных данных (связанной в первую очередь с нашими представлениями о порождении данных и о соотнесении выборки и генеральной совокупности). Рассмотрим возможные варианты.

а) Выборка – это и есть генеральная совокупность. Кроме названных чисел у нас в принципе ничего нет. Тогда медиану целесообразно найти с помощью вариационного ряда:

112, 113, 115, 119, 119, 120, 120, 120, 122, 126

Ме = 119,5

В таком случае естественной будет следующая функция распределения.

262

Рис. 1. Вид функции распределения при отождествлении выборки с генеральной совокупности

Однако более отвечающей реальности (хотя и опирающейся на непроверяемые модельные соображения) представляется другая функция распределения. В ее основе лежат два предположения. Первое состоит в том. что, вообще говоря, в качестве значения нашей переменной может служит любое действительное число из рассматриваемого диапазона.

Подчеркнем, что здесь фактически две посылки: первая состоит в том, что в принципе нам могут встретиться любые целочисленные значения; против нее вряд ли кто-либо будет возражать; вторая же – говорит о возможности встретить нецелочисленные значения. Последняя посылка обычно по вполне понятным причинам вызывает сомнения. Принять ее – значит полагать, что в принципе измеряемая переменная непрерывна, что к ее дискретности приводит несовершенство используемого способа измерения и отсутствие более адекватных измерительных алгоритмов. После принятия указанного предположения функцию распределения естественно представлять следующим образом (отрезки построенной ломаной линии соединяют левые концы стрелок с предыдущего рисунка).

Второе предположение есть предположение о постепенности, равномерности накопления объектов в каждом заданном выборкой интервале. Так, если в процессе построения графика накопленных частот (выборочного аналога функции распределения) в точке Х = 115 у нас

“накопилось” 30% объектов, а в точке 119 – уже 50%, то мы считаем, что 20% объектов,

попавших в интервал (115, 119), равномерно распределены в этом интервале и что, вследствие этого, соответствующий фрагмент функции распределения есть отрезок прямой, соединяющий точки (115, 30) и (119, 50). Заметим, что здесь у нас не встает вопрос о том, к какому из двух соседних интервалов относить точку их “стыка”.

Медиана в таком случае находится традиционным способом, отраженном на рисунке.

Заметим, что в рассматриваемой ситуации она равна 119 (а не 119,5, как выше).

263

Рис. 2. Вид функции распределения при предположениях (а) о непрерывности рассматриваемой случайной величины и (б) равномерном накоплении единиц совокупности в каждом заданном выборкой интервале. Ме = 119

На деле социолог обычно пользуется еще более сильным предположением. А именно,

при высказанных выше предположениях он задает некоторое разбиение диапазона изменения рассматриваемого признака на интервалы (о встающих здесь проблемах мы говорили в п. 1.1.2)

и полагает, что в действительности для него при рассмотрении какого-либо конкретного объекта имеет смысл не то, какое именно значение признака этому объекту отвечает, а то, в

какой интервал это значение попадает. При построении выборочного представления функции распределения доля объектов, отвечающих какому-либо интервалу, откладывается, вообще говоря, от любой точки последнего. На следующих двух рисунках отражены наиболее распространенные варианты: на первом – указанная доля откладывается от середины интервала,

на втором – от его правого конца. Значения медиан обозначены на рисунках.

Рис. 3. Вид функции распределения при предположениях (а) о непрерывности рассматриваемой случайной величины и (б) заданном априори разбиении на интервалы диапазона ее изменения; (в) отнесении точки “стыка” двух интервалов направо; (г) равномерном накоплении единиц совокупности в промежутке от середины одного интервала до середины другого. Ме = 117,5.

Рис. 4. Вид функции распределения при предположениях (а) о непрерывности рассматриваемой случайной величины и (б) заданном априори разбиении на интервалы

264

диапазона ее изменения; (в) отнесении точки “стыка” двух интервалов направо; (г) равномерном

накоплении единиц совокупности в каждом интервале. Ме = 119

Приложение 2

Схемы, иллюстрирующие предложенные в п. 2.2.2 и 2.2.3

Схема 1.

Использованная в книге классификация рассмотренных методов анализа связей

 

Вид обобщенного взаимодействия

 

 

 

 

 

 

 

 

 

 

Методы

 

Посылка (независимая

 

Заключение (зависимая

 

 

 

переменная, Х)

 

переменная Y)

 

 

 

 

 

 

 

 

 

 

 

 

Альтернатива

 

Альтернатива

 

 

ДА, Q, Ф

 

 

 

 

 

 

 

 

 

 

 

Группа

альтернатив

из

Группа

альтернатив

из

Анализ

фрагментов

одного

признака

одного

признака

таблицы сопряженности

(конъюнкция)

 

(конъюнкция)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Группа

альтернатив

из

 

 

 

 

 

 

 

разных

признаков

Альтернатива

 

 

ДА, НРА с номинальным Y

(конъюнкция)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

"Поведение" в терминах Y:

 

 

 

 

 

 

- сила связи Х-ов с Y,

 

 

 

То же

 

 

CHAID

 

 

 

 

 

 

 

 

 

- вид

распределения

Y

 

 

 

 

 

 

THAID

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Группа

альтернатив

из

Y-ка

может не

быть.

 

 

 

разных

признаков

"Поведение"

означает

Поиск

логических

(конъюнкция, дизъюнкция

принадлежность

 

к

закономерностей (ТЭМП)

отрицание)

 

некоторому классу

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Группа

альтернатив

из

 

 

 

 

Репрезентационно-

 

 

 

 

 

аксиоматический

подход

разных

признаков (любая

Y отсутствует

 

 

 

 

(РТИ-репрезентационая

логическая функция)

 

 

 

 

 

 

 

 

 

 

теория измерений)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Один Х как целое

 

Один Y как целое

 

 

2, , Q, Ф

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

265

Группа Х

То же

НРА

 

 

 

Схема 2.

Классификация рассмотренных методов на базе предположений о существовании

латентных переменных.

(Рамкой обведено то, что рассматривается в учебнике)

Сокращения: ЛП – латентная переменная, гр. альт. – группа альтернатив, МШ – многомерное шкалирование, ЛСА – латентно-структурный анализ, ДА – детерминационный анализ, НРА – номинальный регрессионный анализ, РТИ – репрезентационная теория измерений, ЛЛА – логлинейный анализ.

266

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ

Приводимая рядом с термином отсылка к другому термину означает одно из следующих обстоятельств: (1) первый термин рассматривается в “гнезде”, озаглавленном вторым термином

(в скобках иногда указывается соответствующий элемент “гнезда”); (2) термины являются синонимами; (3) когда имеется указание “см. также”, то второй термин является родственным первому и в тексте книги, как правило, информация об одном содержит в себе информацию о другом. Указываются не все страницы, где термин употребляется, а по возможности лишь те,

где идет речь о принципиальных сторонах понимания термина.

Алгоритм CHAID, см. “Методы поиска обобщенных взаимодействий”

Алгоритм THAID, см. “Методы поиска обобщенных взаимодействий” Алгоритмы типа “пятна” и “полосы” Альтернатива, см. “Признак (признака значение)”

Анализ соответствий Анализ фрагментов таблицы сопряженности Априорная модель Вариационный ряд Взаимодействия

– обобщенные, см. "Методы поиска обобщенных взаимодействий", "Сравнение (методов поиска взаимодействий)"

Визуализация данных Выборка (выборочная совокупность)

Выборочная оценка вероятности Выборочная оценка параметров, см. "Статистическое оценивание параметров"

Выборочное представление функции плотности распределения вероятностей, см. "Частотное распределение"

Полигон

Гистограмма Гистограмма с неравными интервалами Диаграмма

Выборочное представления функции распределения вероятностей (случайной величины)

267

Гистограмма

Кумулята см. "Частотное распределение"

Генеральная совокупность Гистограмма, см. “Выборочное представление распределения вероятностей” Гомоскедастичность Группировка значений признака

Детерминируемые (объясняемые) положения (выражения)

Детерминирующие (объясняющие) положения (выражения)

Детерминационный анализ Детерминация

Интенсивность (точность)

Емкость (полнота)

Дециль, см. “Квантиль” Дисперсионный анализ Дисперсия, см. “Меры разброса”

Дихотомизация номинальных данных Доверительный интервал (см. Статистическое оценивание параметров)

Допустимое преобразование шкалы Закономерность

динамическая

логическая, см. также “Методы поиска обобщенных взаимодействий”

содержательная

социологическая (в соответствии с которой развивается общество)

статистическая (в среднем)

формальная

Заполнение пропусков, см. "Модели, заложенные в методах (заполнения пропусков)"

Измерение Гуманитарный подход к измерению

Естественно-научный подход к измерению Индекс Интерпретация

– данных (используемых при измерении чисел, значений признака)

268

номинальных данных

результатов применения метода Информация Исчисление высказываний

Исчисление предикатов (узкое, первого порядка)

Канонический анализ Квантиль

Дециль

Квартиль Медиана, см. "Меры средней тенденции"

Процениль Квантильный размах, см. “Меры разброса” Квартиль, см. “Квантиль” Конджойнт-анализ Коэффициент корреляции

Коэффициенты парной связи между номинальными признаками

ассоциации (Юла)

глобальные

локальные

основанные на критерии Хи-квадрат (см.) (Пирсона, Чупрова, Крамера)

основанные на моделях прогноза

сопряженности (контингенции)

энтропийные (информационные)

см. также Сравнение коэффициентов парной связи Коэффициенты связи ранговые (порядковые)

Коэффициенты уравнения регрессии

традиционной (числовой)

номинальной

Кумулята, см. “Выборочное представление функции распределения вероятностей” Латентно-структурный анализ Логические функции Логлинейный анализ Ложная корреляция

269

Маргинальные суммы Математическая социология

Математическое ожидание, см. “Меры средней тенденции” Матрица (таблица) “объект-признак” Медиана, см. "Меры средней тенденции"

Мера (коэффициент) качественной вариации, см. “Меры разброса” Меры разброса

Дисперсия Квантильные размахи

Мера качественной вариации Среднее квадратическое отклонение Энтропийный коэффициент разброса

Меры средней тенденции Математическое ожидание Медиана Мода (модальное значение)

Среднее арифметическое Метод наименьших квадратов Методы

классификации

моделирования социальных процессов

мягкие (качественные)

поиска логических закономерностей, см. "Методы поиска обобщенных взаимодействий"

Методы поиска обобщенных взаимодействий Алгоритм CHAID ,

Алгоритм THAID ,

Номинальный регрессионный анализ, см. “Регрессионный анализ” Методы поиска логических закономерностей

Многомерное шкалирование Мода, см. “Меры средней тенденции” Модели, заложенные в методах

– заполнения пропусков

270

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]