Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Белорусский государственный университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

prikl_stat_konspekt_tereschenko

.pdf

Скачиваний:

Добавлен:

01.03.2016

Размер:

471.26 Кб

Скачать

☆

1 / 31 2 3 > Следующая >>>

МИНИСТЕРСТВО ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ФАКУЛЬТЕТ ФИЛОСОФИИ И СОЦИАЛЬНЫХ НАУК КАФЕДРА СОЦИАЛЬНОЙ КОММУНИКАЦИИ

ПРИКЛАДНАЯ СТАТИСТИКА В СОЦИАЛЬНЫХ НАУКАХ

ОПОРНЫЙ КОНСПЕКТ ЛЕКЦИЙ

О. В. Терещенко к.с.н., доцент

Минск 2011

О.В.Терещенко, 2011

СОДЕРЖАНИЕ
Учебный план курса................................................................................................	3
Раздел 1: Статистические данные..........................................................................	4
Раздел 2: Описательная статистика.......................................................................	7
Раздел 3: Основы статистического вывода.........................................................	10
Раздел 4: Анализ статистических связей

О.В. Терещенко 2011

УЧЕБНЫЙ ПЛАН КУРСА

		Количество часов				№
№	Наименование разделов и тем					зада-
		Лекц.	Практ.	КСР	Всего	ния

	РАЗДЕЛ 1. СТАТИСТИЧЕСКИЕ ДАННЫЕ

1.	Природа статистики. Особенности статистиче-	2			2
	ского подхода в социальном исследовании
2.	Основные этапы эмпирического социального	4	2	2	8	1
	исследования.
3.	Измерение в количественном социальном ис-	4	6	2	12	2
	следовании.
4.	Данные социального исследования.	2	2		4
5.	Подготовка данных к компьютерному стати-		4	2	6	3
	стическому анализу.
	РАЗДЕЛ 2. ОПИСАТЕЛЬНАЯ СТАТИСТИКА

6.	Одномерные частотные распределения.	4	6	2	12	4
7.	Графическое представление одномерных рас-	4	4	2	10	5
	пределений
8.	Меры центральной тенденции.	2	2		4	6
9.	Меры разброса данных.	2	2		4	6
10.	Анализ формы распределения. Стандартизация	2	2	2	6
	переменных.
	РАЗДЕЛ 3. ОСНОВЫ СТАТИСТИЧЕСКОГО ВЫВОДА

11.	Теория вероятностей как методологическая ос-	2			2
	нова статистического вывода.
12.	Основные теоретические распределения.	2	4		6
13.	Оценивание параметров генеральной совокуп-	2	2	2	6	7
	ности. Репрезентативность выборки.
14.	Статистическая проверка гипотез.	4	4	2	10	8
	РАЗДЕЛ 4. АНАЛИЗ СТАТИСТИЧЕСКИХ СВЯЗЕЙ

15.	Понятия статистической связи и независимости	2			2
	в социальных науках.
16.	Исследование связей по таблице сопряженности.	4	4	2	10	9
17.	Меры связи, основанные на рангах.	2	2		4
18.	Линейная статистическая модель парной связи.	4	4	2	10	10
19.	Нелинейные модели парной связи.	2	2	2	6	11
20.	Основы планирования эксперимента.	2			2	12
21.	Дисперсионный анализ.	4	4	2	10

О.В. Терещенко 2011

Р а з д е л 1. СТАТИСТИЧЕСКИЕ ДАННЫЕ

Тема 1. Природа статистики. Особенности статистического подхода в социальных исследованиях

Статистика – наука, имеющая дело со сбором, обработкой, анализом и интерпретацией данных о массовых явлениях и процессах.

Статистические совокупности бывают генеральными и выборочными. Генеральная совокупность (ГС) – полная совокупность объектов, имеющих отношение к изучаемой проблеме, объект статистического обследования. Генеральные совокупности могут быть конечными или бесконечными, конкретными или гипотетическими, однородными или неоднородными.

Статистические обследования могут быть сплошными и выборочными, одноразовыми и повторными.

Повторные исследования могут осуществляться с использованием независимых выборок (мониторинг) или одной и той же выборки (панельное исследование).

Функции статистики: описание, обобщение, объяснение (прогнозирование). Особенности статистического подхода в социальных науках: абстрагиро-

вание от индивидуальности, оценочный характер полученных результатов. Корректное использование специфических статистических методов сбора,

обобщения и анализа данных.

Тема 2. Основные этапы эмпирического социального исследования

Основные этапы позитивного социального исследования:

•выдвижение гипотез (роль теории в прикладном исследовании);

•операционализация гипотез: выбор дизайна, обоснование выборки исследования; определение измеряемых показателей, разработка инструментария исследования;

•полевой этап исследования: сбор данных;

•обработка и анализ данных: ввод данных в компьютер, обработка и подготовка данных к статистическому анализу; анализ данных; проверка гипотез исследования;

•интерпретация полученных результатов, построение моделей исследуемых явлений и процессов.

О.В. Терещенко 2011

Тема 3. Измерение в количественном социальном исследовании

Измерением называется процедура присвоения наблюдаемым объектам определенных символов в соответствии с некоторым правилом. Символы могут быть просто метками, представляющими классы или категории объектов в генеральной совокупности, или числами, характеризующими степень выраженности у объекта измеряемых свойств. Алгоритм (правило) присвоения символа объекту называется измерительной шкалой. Как всякая модель, измерительные шкалы должны правильно отражать изучаемые характеристики объекта и, следовательно, иметь те же свойства, что и измеряемые показатели.

Шкала наименований (номинальная шкала) используется для обозначения принадлежности объекта к одному из нескольких непересекающихся и неупорядоченных классов. Частным случаем шкалы наименований является дихотомическая шкала, с помощью которой фиксируют наличие / отсутствие у объекта определенного качества или соответствие / несоответствие объекта некоторому требованию.

Шкала порядка позволяет не только разбивать объекты на классы, но и упорядочивать классы по возрастанию (убыванию) изучаемого признака. Частными случаями шкалы порядка являются: оценочная шкала, при использовании которой объект получает (или сам выставляет) оценки, исходя из определенного числа баллов; ранговая шкала, которую применяют, когда переменная заведомо не поддается объективному измерению или когда порядок объектов более важен, чем точная величина различий между ними.

Количественные шкалы интервалов и отношений имеют общее свойство, отличающее их от качественных шкал: они предполагают но наличие единицы измерения, позволяющей определять, на сколько значение признака у одного объекта больше или меньше, чем у другого. Шкала отношений имеет абсолютный нуль, не зависящий от произвола наблюдателя и соответствующий полному отсутствию измеряемого признака, на шкале интервалов нуль устанавливается произвольно или в соответствии с некоторыми условными договоренностями.

Количественные шкалы делятся на дискретные и непрерывные. Дискретные шкалы измеряются посредством счета, они могут принимать только целые неотрицательные значения Непрерывные шкалы предполагают, что измеряемое свойство изменяется непрерывно, и при наличии соответствующих приборов и средств, могло бы быть измерено с любой необходимой степенью точности.

В социальных науках для измерения применяются анкеты, тесты, стандартизированные интервью и т.п., получившие общее название измерительного инструментария. Вопросы инструментария могут быть открытыми и закрытыми, альтернативными и неальтернативными.

О.В. Терещенко 2011

Тема 4. Данные социального исследования

Данные социального исследования – формализованная и структурированная информация об объекте исследования.

Этапы формализации информации:

•определение генеральной совокупности (объекта исследования);

•построение выборки (выбор единиц наблюдения);

•операционализация понятий (выбор измеряемых показателей и определение способов их измерения);

•измерение показателей на единицах наблюдения.

Критерии структурирования данных: объект / переменная / время измерения. Структурирование данных в одномоментном исследовании: матрица дан-

ных «объект-признак» («случай–переменная»).

Временнóй ряд – последовательность значений переменной в определенные моменты времени. Структурирование временных рядов: матрицы данных «объект–время» и «переменная–время».

Структурирование данных в панельном исследовании: куб данных «объ- ект–переменная–время». Проблема пропущенных значений. Легальные и нелегальные пропущенные значения.

Подготовка данных к вводу в компьютер: проверка комплектности и полноты и правильности заполнения инструментария; проверка принадлежности объектов к выборке исследования; кодирование открытых вопросов; кодирование пропущенных значений.

ЛИТЕРАТУРА К РАЗДЕЛУ 1

1.Бутенко И.А. Анкетный опрос как искусство общения социолога с респондентом. Учеб. пособие. – М., 1989.

2.Бююль, А., Цефель, П. SPSS: Искусство обработки информации. – СПб, 2002.

3.Кимбл Г. Как правильно пользоваться статистикой. – М., 1982.

4.Крыштановский, А.О. Анализ социологических данных. – М., 2007.

5.Наследов, А. SPSS: Компьютерный анализ данных в психологии и социальных науках.

– СПб, 2007.

6.Паниотто В.И., Максименко В.С. Количественные методы в социологических исследованиях. – Киев, 1982.

7.Пациорковский В.В., Пациорковская В.В. SPSS для социологов. М., 2007.

8.Сатаров Г.А. Математика в социологии: стереотипы, предрассудки, заблуждения // Социологические исследования. 1986. №3.

9.Терещенко О.В. Социолог и ЭВМ. – Минск, 1990.

10.Терещенко О.В. Статистическая обработка и анализ социологической информации // Социология / Под ред. А.Н. Елсукова. – Минск, 2000.

11.Терещенко О.В. Первые шаги в SPSS для Windows. – Минск., 2001.

12.Терещенко О.В. Прикладная статистика для социальных наук. – Минск, 2002.

13.Толстова Ю.Н. Измерение в социологии. – М., 1998.

14.Толстова Ю.Н. Математико-статистические модели в социологии. – М., 2007.

О.В. Терещенко 2011

Р а з д е л 2. ОПИСАТЕЛЬНАЯ СТАТИСТИКА

Тема 6. Одномерные частотные распределения

Дескриптивнаястатистика– инструментописаниявыборочнойсовокупности. Абсолютная частота (frequency fi ) значения переменной – количество

объектов, обладающих данным значением.

Относительная частота ( nfi ×100% , где n – объем выборки)– процент или

доля объектов, обладающих данным значением.

Одномерное частотное распределение (frequency distribution) – таблица,

содержащая значения переменной и их частот.

Накопленная частота (cumulative frequency), используется только для по-

рядковых и количественных переменных. Вычисляется по формуле Fi = ∑i fi

j=1

– количество (процент, доля) объектов, имеющих значения, не превосходящие текущее значение. Распределение накопленных частот.

Необходимость группировки непрерывных переменных. Виды группировок:

•типологическая (интервалы произвольной длины, интерпретируются содержательно);

•аналитическая (интервалы одинаковой длины, содержательная интерпретация не требуется);

•процентильная (интервалы с одинаковыми частотами, длина – какая получится, интерпретация не требуется).

Квантиль – значение переменной, которое делит распределение переменной в заданной пропорции p / (1-p), где 0<p<1. Частные случаи квантилей: дециль, квинтиль, квартиль, медиана. Использование квантилей при построении процентильных группировок.

Тема 7. Графическое представление одномерных распределений

Графики как способ визуализации одномерных распределений. Основные виды графиков: диаграммы, гистограммы, полигоны распределения, кумуляты (графики накопленных частот), статистические карты, пиктограммы, графики временных рядов.

Общие требования к графикам:

•график должен отражать уровень измерения переменной (для количественных и порядковых шкал направление оси должно соответствовать возрастанию значений; дискретность переменной подчеркивается промежутками между столбцами, непрерывность – отсутствием промежутков);

•частоты на графике, в большинстве случаев, изображаются площадями фигур;

О.В. Терещенко 2011

•для оси частот, а также для осей порядковых и количественных переменных обязательно соблюдение масштаба;

•запрещается прерывать оси частот и плотности распределений.

Круговая диаграмма для номинальных переменных: νio = (fi n)×360o .

Дискретные графики: диаграммы полос и столбцов; ленточная диаграмма. Гистограмма и полигон распределения для непрерывных переменных.

Плотность распределения: ρi = fi li . График интерквартильного диапазона.

Графики накопленных частот (кумуляты) для дискретных и непрерывных переменных.

Тема 8. Меры центральной тенденции

Понятие центра распределения как разновидности «нормы», вокруг которой колеблются значения всех наблюдений: «среднее» как «типичное».

Мода ( Mo )– вероятностное среднее. Для дискретной переменной мода – наиболее часто встречающееся значение переменной, т.е. значение, обладающее максимальной частотой. Для непрерывной переменной определяется модальный интервал, которому соответствует максимальная частота (для аналитической группировки) или максимальная плотность.

Медиана ( Me ) – ранговое среднее граница 50%-ного интервала, значение переменной, которое делит вариационный ряд пополам, применяется для порядковых и количественных переменных.

Среднее арифметическое ( x ) – наиболее часто используемый показатель центра распределения для количественных переменных: x = ∑xi n , где xi –

значение переменной x для объекта i ; n – объем выборки.

Другие виды средних, используемые в статистическом анализе: среднее квадратическое, среднее геометрическое, среднее гармоническое.

Примечание: для дихотомической переменной разрешено вычисление среднего арифметического, которое равно доле положительных ответов: x = p .

Тема 9. Меры разброса данных

Диапазон разброса значений переменной является простейшей мерой степени разброса данных: d = xmax − xmin .

Стандартное или среднее квадратическое отклонение (СКО) показывает,

насколько индивидуальные значения переменной в среднем отклоняются от среднего арифметического:

s = ∑(xi − x)2 (n −1),

где xi – значение переменной для объекта с номером i ;

x – среднее арифметическое; n – объем выборки.

О.В. Терещенко 2011

Дисперсия – квадрат стандартного отклонения: s2 = ∑(xi − x)2 (n −1).

Примечание: дисперсия и СКО могут вычисляться для дихотомических переменных: s 2 = p(1 − p); s = p(1 − p).

Тема 10. Анализ формы распределения. Стандартизация переменных

Показатели формы распределения

Коэффициент асимметрии предназначен для проверки симметричности одномодального распределения: β1 = ∑(xi − x)3 ns 3 .

Распределение симметрично, если β1 = 0 ; имеет положительную (левую) асимметрию, если β1 > 0 ; имеет отрицательную (правую) асимметрию, если

β1 <1.

Коэффициент эксцесса характеризует форму одномодального симметричного распределения:

β2 = ∑(xi − x)4 n s 4 .

Распределение имеет форму нормального распределения, если β2 = 3; является островершинным, если β2 > 3; является плосковершинным, если β2 < 3 .

Стандартизированные значения переменной (z-оценки): zi = (xi − x)s .

Свойства z-оценок:

1)z = 0 ;

2)sz2 = sz =1;

3)при переходе к z-оценкам форма распределения не изменяется.

ЛИТЕРАТУРА К РАЗДЕЛУ 2

1.Бююль, А., Цефель, П. SPSS: Искусство обработки информации. – СПб, 2002.

2.Гласс, Дж., Стэнли, Дж. Статистические методы в педагогике и психологии. – М., 1976.

3.Крыштановский, А.О. Анализ социологических данных. – М., 2007.

4.Наследов, А. SPSS: Компьютерный анализ данных в психологии и социальных науках.

– СПб, 2007.

5.Паниотто В.И., Максименко В.С. Количественные методы в социологических исследованиях. – Киев, 1982.

6.Пациорковский В.В., Пациорковская В.В. SPSS для социологов. М., 2007.

7.Рабочая книга социолога / под ред. Г.В. Осипова. Изд. 5-е. – М., 2009.

8.Терещенко О.В. Статистическая обработка и анализ социологической информации // Социология / Под ред. А.Н. Елсукова. – Минск, 2000.

9.Терещенко О.В. Прикладная статистика для социальных наук. – Минск, 2002.

О.В. Терещенко 2011

Р а з д е л 3. ОСНОВЫ СТАТИСТИЧЕСКОГО ВЫВОДА

Тема 11. Теория вероятностей как методологическая основа статистического вывода

Случайная величина – функция X , определенная на генеральной совокупности. Случайные величины могут быть дискретными и непрерывными.

Выборочное пространство S – множество значений, которые может принимать случайная аеличина.

Случайное событие A – для дискретной случайной величины одно или несколько значений; для непрерывной случайной величины – интервал значений.

Вероятность случайного события P(A) – доля объектов из генеральной совокупности, принадлежащих данному событию.

Свойство аддитивности вероятностей: Если случайные события не пере-

секаются, то вероятность наступления одного из этих событий равна сумме их вероятностей: P(A + B)= P(A)+ P(B).

Примечание: В предельном случае, если непересекающиеся события покрывают все выборочное пространство, сумма их вероятностей равна 1:

P(A + B +... + K )= P(A)+ P(B)+... + P(K )=1.

Распределение вероятностей может быть задано тремя способами: законом распределения дискретной случайной величины, функцией плотности распределения непрерывной случайной величины; функцией распределения (универсальное представление).

Функция распределения для любого действительного числа u равна вероятности того, что значение случайной величины Х не превосходит u: F (u)= P(X < u). Свойства функции распределения:

1)определена для дискретных и непрерывных случайных величин на всей действительной оси: F (−∞)= 0 ; F (+ ∞)=1;

2)является неубывающей (для дискретных случайных величин – ступенчатой, для непрерывных – гладкой);

3)P(u ≤ X ≤ v)= F (v)− F (u);

4)для непрерывной случайной величины P(X < u)= P(X ≤ u).

Закон распределения дискретной случайной величины – совокупность ее отдельных значений и соответствующих им вероятностей. Свойства закона распределения:

1) 0 ≤ p(x)≤1 для любого значения x ;

+∞

2) ∑p(x)=1 ;

x =−∞

3) P(u ≤ x ≤ v)= ∑v p(x);

x=u

4) F (u)= ∑p(x).

x≤u

О.В. Терещенко 2011

1 / 31 2 3 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
27.09.2019254.46 Кб7prakt_pr.doc
#
29.02.20161.64 Mб35Pravotvorchesky_protsess_Lektsii.rtf
#
24.12.2018549.38 Кб22Pravovaya_informatika_konspekt.doc
#
16.09.2019948.22 Кб3pravo_33_pechatat_po_8_stranits_na_1_liste.doc
#
26.11.201853.98 Кб1Prekrashenie_td_конспект.docx
#
01.03.2016471.26 Кб30prikl_stat_konspekt_tereschenko.pdf
#
06.09.20192.59 Mб80Prof_lexika_yurista_posobie.doc
#
12.11.2018139.78 Кб0Programa_practiki.doc
#
27.09.201965.54 Кб2Programma praktiki 2 kursa TD.doc
#
02.09.2019384.51 Кб3Programma_praktika_infocom_2010.doc
#
29.09.2019140.8 Кб0Programma_proizvodstvennoy_praktiki_BA-2011-201...doc