- •Элементы теории вероятностей и математической статистики
- •Тверь, 2008
- •§1. Случайные события. Основные определения
- •§2. Классическое определение вероятностей
- •§3. Свойства вероятности
- •§4. Статистическое определение вероятности
- •§ 5. Основные определения математической статистики
- •§ 6. Типы выборок
- •§ 7. Ранжирование. Способы задания выборки
- •§ 8. Выборочные числовые характеристики
- •§ 9. Коэффициент корреляции. Прямая линия регрессии
- •Успеваемость у
- •§ 11. Тетрахорический коэффициент сопряженности качественных признаков Пирсона
- •Список рекомендуемой литературы
§ 7. Ранжирование. Способы задания выборки
Пусть каждый объект в выборке изучается относительно некоторого количественного или качественного признака Х.
Примеры:
X – успеваемость по предмету,
Y – познавательная активность школьника по предмету,
Z – объем оперативной памяти.
Качественные признаки во многих случаях можно условно превратить в количественные с помощью ранжирования, т.е. выделения уровней (рангов) качества. При этом обычно лучшему качеству приписывается меньшее числовое значение.
Для признака Х используются 4 ранга – х1, х2, х3, х4:
х1 = «2», х2 = «3», х3 = «4», х4 = «5».
Для признака Y используются обычно 5 рангов:
y1 = «1» – постоянная увлеченность предметом,
y2 = «2» – постоянный интерес к предмету,
y3 = «3» – периодический интерес к предмету,
y5 = «4» – отсутствие интереса к предмету,
y5 = «5» – отказ учиться, неприязнь к предмету.
Для признака Z можно использовать два ранга z1, z2:
z1 = «1» – относительно большой объем оперативной памяти,
z2 = «2» – относительно маленький объем оперативной памяти.
Выборки по одному признаку можно задавать тремя способами:
а) с помощью простого перечисления значений признака,
б) с помощью вариант и частот,
в) с помощью вариант и относительных частот.
Для того чтобы задать выборку с помощью простого перечисления значений признака, нужно записать значения признака для каждого объекта выборки в порядке появления.
Пример. Пусть Х – успеваемость по предмету (в баллах). (2; 3; 4; 5; 2; 3; 2; 5; 5; 5) – выборка объема n = 10.
При задании выборки с помощью вариант и частот предварительно нужно указать варианты – различные значения признака. Для каждой варианты хi определяют ее частоту ni: ni = число появлений варианты хi в выборке. ( ni = n).
В этом случае, для того чтобы задать выборку, достаточно указать лишь варианты и их частоты. Выборку в последнем примере зададим с помощью вариант и частот:
-
Хi
2
3
4
5
ni =10.
ni
3
2
1
4
Если вместо ni указывать относительные частоты wi = ni/n, то выборку можно задать с помощью вариант и относительных частот:
-
хi
2
3
4
5
wi =1.
wi
0,3
0,2
0,1
0,4
§ 8. Выборочные числовые характеристики
По выборке по признаку Х можно найти выборочные числовые характеристики:
Хв – выборочная средняя,
Дв (Х) – выборочная дисперсия,
в (Х) – выборочное среднее квадратическое отклонение.
Выборочную среднюю Хв можно найти по выборке по формулам:
Хв = (х1+ х2+ х3+…+хn)
в случае задания выборки с помощью простого перечисления значений признака;
Хв = ( х1n1+ х2n2+ х3n3+…+хknk)
в случае задания выборки с помощью вариант и частот;
Хв = ( х1w1+ х2w2+ х3w3+…+хkwk)
в случае задания выборки с помощью вариант и относительных частот.
В нашем примере
Хв = (2+3+4+5+2+3+2+5+5+5)= 3,6
Хв = (23+32+41+54)= 3,6
Хв = 20,3+30,2+40,1+50,4= 3,6
Хв характеризует среднее значение признака Х во всей генеральной совокупности. Таким образом, в нашем примере Хв= 3,6 балла – средняя успеваемость ученика по предмету.
Для нахождения дисперсии Д(Х) также могут использоваться различные формулы в зависимости от способа задания выборки. Обычно используют следующую формулу:
Д(Х) = Хв2 – (Хв)2.
Здесь Хв – выборочная средняя признака Х;
Хв2 – выборочная средняя квадрата признака Х;
Хв2 = (х12 + х22 + х32 + … + хn2) – в случае если выборки заданы с помощью перечисления значений признака;
Хв2 = (х12n1 + х22n2 + х32n3+ … + хк2nк) – в случае, когда выборки заданы с помощью вариант и частот.
Найдем Дв(Х), в(Х) в нашем примере.
Имеем:
Хв2 = (223 + 322 + 421 + 524) = 146 = 14,6 ;
Дв(Х) = Хв2 - Хв2 = 14,6 – 3,62 = 14,6 – 12,96 = 1,64 ;
в(Х) = = ≈ 1,28 (балла).
Выборочные числовые характеристики Дв(Х), в(Х) характеризуют разброс значений признака Х во всей генеральной совокупности: чем больше Дв(Х) (или в(Х)) , тем больше разброс.
При малых объемах выборки (n 30) выборочные Дв(Х), в(Х) «исправляют», т.е. берут исправленные характеристики:
Дв испр.(Х) = Дв(Х) ,
в испр(Х) = .
В нашем примере n < 30, поэтому
Дв испр.(Х) = Дв(Х) = 1,64 1,82,
в испр(Х) = 1,35 (балла).