- •Содержание
- •Введение
- •Лабораторная работа 1 Дискретные распределения
- •Краткие теоретические сведения
- •Биноминальное распределение и игровые задачи
- •Задача шевалье де Мере
- •Распределение редких событий (Пуассона)
- •Задания для выполнения
- •Лабораторная работа 2 Основные модели теоретических распределений (Statistica 6)
- •Краткие теоретические сведения
- •Вероятностный калькулятор
- •Нормальное распределение
- •Правила 2 и 3 сигма
- •Логарифмически-нормальное распределение
- •Задания для выполнения
- •Лабораторная работа 3 Распределение параметров выборки
- •Краткие теоретические сведения
- •Распределение χ-квадрат (хи-квадрат)
- •Задания для выполнения
- •Лабораторная работа 4 Разнообразие значений признака (ms Excel)
- •Краткие теоретические сведения
- •Подготовительные процедуры
- •Первичный анализ статистических данных
- •Проверка на условие нормальности распределения
- •Гистограмма
- •Первичный анализ статистических данных
- •Задания для выполнения
- •Лабораторная работа 6 Парная корреляция (ms Excel)
- •Краткие теоретические сведения
- •Корреляционный анализ
- •Регрессионный анализ
- •Задания для выполнения
- •Лабораторная работа 8 Частная и множественная линейные корреляции и регрессия (Statistica 6)
- •Краткие теоретические сведения
- •Описание модели
- •Постановка задачи
- •Задания для выполнения
- •Лабораторная работа 9 Криволинейная корреляция и регрессия (ms Excel)
- •Краткие теоретические сведения
- •Проведение анализа
- •Задания для выполнения
- •Лабораторная работа 11 Однофакторный дисперсионный анализ (однофакторный комплекс в ms Excel)
- •Краткие теоретические сведения
- •Проведение анализа
- •Задания для выполнения
- •Лабораторная работа 13 Многофакторный дисперсионный анализ (двухфакторный комплекс в ms Excel)
- •Краткие теоретические сведения
- •Проведение анализа
- •Задания для выполнения
- •Лабораторная работа 15 Классификация (дискриминантный анализ в Statistica 6)
- •Краткие теоретические сведения
- •Классификация цветов ириса
- •Задания для выполнения
- •Лабораторная работа 16 Классификация (кластерный анализ в Statistica 6)
- •Краткие теоретические сведения
- •Кластеризация автомобилей в модуле Cluster Analysis (Кластерный анализ)
- •Классификация населенных пунктов, расположенных в зоне радиоактивного загрязнения
- •Задания для выполнения
- •Литература
- •Приложение а (обязательное)
- •Приложение б (обязательное)
- •Приложение в (обязательное)
- •Приложение г (обязательное)
- •Приложение д (обязательное)
- •Приложение е (обязательное)
- •Приложение ж (обязательное)
- •Приложение и (обязательное)
Распределение χ-квадрат (хи-квадрат)
В списке распределений вероятностного калькулятора выберите Chi ? (χ-квадрат) (рисунок 3.4).
Рисунок 3.4 – Задание χ-квадрат-распределения в вероятностном калькуляторе
В строке df задайте 7 – число степеней свободы.
В поле р задайте 0,95. Нажмите кнопку Compute (Вычислить), в строке Chi ? вы увидите 0,95 – квантиль χ-квадрат-распределения с 7 степенями свободы (14,06714).
Выберите далее опцию Create Graph (Создать график) и вновь щелкните на кнопке Compute (Вычислить) либо просто нажмите Enter на клавиатуре, вы увидите график плотности и функции распределения χ-квадрат с 7 степенями свободы (рисунок 3.5).
Рисунок 3.5 – График плотности и функции распределения случайной величины χ-квадрат с 7 степенями свободы
Обратите внимание на то, что это распределение несимметрично и сосредоточено только на положительной полуоси.
Распределение χ-квадрат играет важную роль при исследовании оценки дисперсии нормальной выборки, а также при проверке зависимостей в таблицах сопряженности и в критериях согласия.
Задания для выполнения
С помощью вероятностного калькулятора вычислите значения распределений F-Фишера, t-Стьюдента и χ-квадрат при различных значениях степеней свободы для уровня надежности 0,95.
Дайте объяснение полученным результатам.
Таблица 3.1 – Варианты заданий
№ задания |
Распределение |
Степени свободы |
|
df1 |
df2 |
||
1 |
F-Фишера |
1 |
10 |
2 |
F-Фишера |
2 |
10 |
3 |
F-Фишера |
3 |
10 |
4 |
F-Фишера |
4 |
10 |
5 |
F-Фишера |
5 |
10 |
6 |
F-Фишера |
10 |
1 |
7 |
F-Фишера |
10 |
2 |
8 |
F-Фишера |
10 |
3 |
9 |
F-Фишера |
10 |
4 |
10 |
F-Фишера |
10 |
5 |
11 |
F-Фишера |
10 |
10 |
12 |
t-Стьюдента |
1 |
|
13 |
t-Стьюдента |
2 |
|
14 |
t-Стьюдента |
3 |
|
15 |
t-Стьюдента |
10 |
|
16 |
t-Стьюдента |
20 |
|
17 |
t-Стьюдента |
50 |
|
18 |
χ-квадрат |
1 |
|
19 |
χ-квадрат |
3 |
|
20 |
χ-квадрат |
5 |
|
21 |
χ-квадрат |
10 |
|
22 |
χ-квадрат |
20 |
|
23 |
χ-квадрат |
100 |
|
Лабораторная работа 4 Разнообразие значений признака (ms Excel)
Цель работы: Научить выполнять первичную обработку данных в табличном редакторе MS Excel.
Краткие теоретические сведения
Всякая группа состоит из особей или объектов, отличающихся друг от друга по каждому из признаков.
Средняя величина какого-нибудь признака определяется для того, чтобы получить характеристику этого признака для всей изучаемой группы в целом:
. (4.1)
Степень разнообразия особей в группе по изучаемому признаку измеряется несколькими показателями, из которых наибольшее значение имеет стандартное отклонение:
. (4.2)
Скошенность кривой называется асимметрией:
. (4.3)
Правосторонняя асимметрия – отрицательна, левосторонняя – положительна.
Отклонение крутизны называют эксцессом:
. (4.4)
Эксцесс положителен при островершинной кривой, отрицателен при плосковершинной.
Ошибка средней арифметической:
. (4.5)
Ошибка стандартного (среднего квадратического) отклонения:
. (4.6)
Ошибка показателя асимметрии:
. (4.7)
Ошибка показателя эксцесса:
. (4.8)
Проверка выбросов (выпадов, артефактов) должна проводиться всегда перед началом обработки полученных первичных данных. Если подтвердится, что резко выделяющееся значение действительно не может относиться к объектам данной группы, и попало в записи вследствие ошибок внимания, следует такой выброс исключить из обработки. Проверка выбросов может производиться по критерию, равному нормированному отклонению выброса:
, (4.9)
где:
Т – критерий выброса;
– выделяющееся значение признака (или очень большое или очень малое);
μ, – средняя и сигма, рассчитанные для группы, включающей артефакт;
Tst – стандартные значения критерия выбросов, определяемых по таблице 4.1.
Таблица 4.1 – Стандартные значения критерия выбросов (Tst)
n |
Tst |
n |
Tst |
n |
Tst |
n |
Tst |
2 |
2,0 |
16 – 20 |
2,4 |
47 – 66 |
2,8 |
125 – 174 |
3,2 |
3 – 4 |
2,1 |
21 – 28 |
2,5 |
67 – 84 |
2,9 |
175 – 349 |
3,3 |
5 – 9 |
2,2 |
29 – 34 |
2,6 |
85 – 104 |
3,0 |
350 – 599 |
3,4 |
10 – 15 |
2,3 |
35 – 46 |
2,7 |
105 – 124 |
3,1 |
600 – 1500 |
3,5 |
Если Т ≥ Tst, то анализируемое значение признака является выбросом. Альтернатива Т < Tst не позволяет исключить из анализа значение признака.
Для того чтобы оценить генеральный параметр для количественных признаков в форме доверительных границ необходимо:
Проверить на нормальность распределения исходных данных.
Установить число степеней свободы по правилам, приведенным при описании оценки каждого параметра.
Установить, исходя из ответственности исследования, порог вероятности безошибочных прогнозов (β1 = 0,95, β2= 0,99, β3= 0,999).
В соответствии с числом степеней свободы найти значение критерия надежности t по таблице стандартных значений критерия Стьюдента. При отсутствии таблицы показатель надежности для данного исследования можно приближенно определить по приведенным формулам. Если объем выборки превышает нижние пределы больших выборок (n > 30, n > 100, n > 200), то показатели надежности берутся постоянные для каждого порога вероятности: t1 = 2,0; t2 = 2,6; t3 = 3,3.
Рассчитать ошибку выборочного показателя.
Определить возможную погрешность оценки генерального параметра, помножив критерий надежности на ошибку репрезентативности: .
Установить доверительные границы генерального параметра; возможный максимум и гарантированный минимум .