Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
lection.DOC
Скачиваний:
21
Добавлен:
23.08.2019
Размер:
2.5 Mб
Скачать

4. Меры центральной тенденции

И КВАНТИЛИ РАСПРЕДЕЛЕНИЯ

Меры центральной тенденции являются наиболее часто используемыми мерами при описании совокупностей данных. Наиболее распространенными среди них являются: среднее арифметическое( ), медиана(Me или Md) и мода(Mo).

4.1. Среднее арифметическое. Средним арифметическим является мера, представляющая собой отношение суммы значений случайной величины к количеству значений случайной величины в ее распределении:

Нахождение среднего арифметического является, по сути, заменой индивидуальных варьирующих значений случайной величины на некоторую уравненную величину, которая должна сохранять основные свойства всех остальных значений. Это правило является справедливым для тех случаев, когда распределение случайной величины является равномерным, или, когда значения близкие к среднему встречаются часто, а удаленные от среднего – редко. Среднее арифметическое обладает одним очень важным свойством: сумма разностей среднего арифметического с каждым значением случайной величины в точности равна нулю, т.е. среднее – как бы уравновешивает все значения. Однако, иногда оказывается, что среднее арифметическое не отражает основные свойства совокупности данных и может даже вводить в заблуждение исследователя. Это происходит в том случае, если существует большой разброс значений случайной величины, или в совокупности наблюдений есть такие значения, которые резко отличаются от всех остальных. Например, если в некоторой фирме работают десять сотрудников с заработной платой 100$ в месяц и директор с з/п 1200$/мес., то средняя заработная плата будет составлять 200$/мес., хотя в действительности, десять сотрудников получают в два раза меньше, а один – в шесть раз больше среднего заработка. При определении среднего арифметического в таких совокупностях данных рекомендуется отбрасывать крайнее минимальное и крайнее максимальное значения, либо воспользоваться другой мерой центральной тенденции, называемой медианой.

4.2. Медиана. Это мера, которая делит упорядоченное распределение случайной величины пополам, так, что одна половина оказывается меньше медианы, а другая – больше. В рассмотренном выше примере с заработной платой, медиана будет равна 100$/мес. и более точно отражает свойства совокупности данных, так как показывает какие значения случайная величина принимает чаще, и какие являются наиболее вероятными.

Определение медианы зависит от того, какое количество значений случайная величина принимает в распределении. Если количество значений оказывается нечетным, то медиана является значением, стоящим точно посередине упорядоченного ряда чисел. Если же количество значений четное, то медиана вычисляется как среднее арифметическое двух значений, находящихся в середине распределения.

4.3. Мода. Модой называется такое значение случайной величины, которое встречается наиболее часто. Мода является, возможно самой простой из мер центральной тенденции. Для ее вычисления необходимо просто подсчитать, сколько раз встречается каждое значение случайной величины, и наиболее частое и будет являться модой.

4.4. Соотношение среднего арифметического, медианы и моды и выбор мер центральной тенденции. В рассмотренном выше примере с заработной платой медиана и мода равны между собой, и в два раза меньше среднего арифметического. Эти меры могут оказаться как равными друг другу, так и принимать совершенно разные значения. На выбор мер центральной тенденции оказывает влияние не только желание экспериментатора, многое зависит от характера распределения случайной величины. Необходимо упомянуть о некоторых особенностях всех трех мер:

  1. Среднее арифметическое может принять такое значение, которое вообще не встречается в распределении, как в нашем примере, либо оказаться дробным для дискретной случайной величины (например, среднее количество детей в семье в нашей стране будет выражаться дробным числом, хотя ни в одной семье оно не встречается). Тем не менее, среднее арифметическое остается очень удобной мерой, по крайней мере, для непрерывных случайных величин, поскольку показывает куда ''тяготеют'' все остальные значения.

  2. Медиана очень удобная мера для тех случаев, когда существует очень большой разброс значений случайной величины. Кроме того, медиана – это всегда реальное значение, если количество этих значений нечетное. В то же время, медиана может оказаться не самой удачной мерой, если какое-то одно значение встречается очень часто, и оно расположено либо в начале упорядоченного ряда, либо в конце. В таких случаях лучше воспользоваться модой.

  3. Мода удобна для переменных измеренных в шкале наименований, и в этом случае она является единственной из возможных мер центральной тенденции. Например, если необходимо описать политическую ориентацию депутатов парламента, то эту переменную можно измерить только в шкале наименований, и наиболее часто встречаемая ориентация и будет являться модой, и в то же время единственной возможной и понятной всем мерой центральной тенденции. Мода может оказаться удобной мерой для дискретных случайных величин, особенно если какие-либо значения встречаются очень часто, и особенно, в том случае, когда их частота приближается к частоте всех остальных значений вместе взятых. Если такое значение одно, то говорят об унимодальном распределении, если два – о бимодальном, а если более двух – о полимодальном распределении. Таким образом, в отличии от среднего арифметического и медианы, мода в распределении может оказаться и не одна. Однако, в распределении непрерывной случайной величины моды может и вовсе не оказаться, так как ни одно из значений может не встретиться больше одного раза, и даже в том случае, если таких значений окажется два, для описания совокупности данных лучше использовать среднее арифметическое и медиану.

4.5. Квантили распределения. Квантиль (от лат. quantum – сколько) – это точка на числовой шкале, которая делит совокупность наблюдений на две части с известными пропорциями в каждой из них. Наиболее известный из квантилей – медиана, делящая распределение пополам. Помимо медианы существует еще несколько видов квантилей: квартили(Qi), квинтили (Ki), децили (Di) и процентили (Pi). Квартили делят совокупность наблюдений на четыре части, при этом четвертая часть наблюдений лежит ниже первого квартиля, половина – ниже второго, а три четверти – ниже третьего. Таким образом, три квартиля делят всю совокупность наблюдений на четыре части, четыре квинтиля – на пять частей, девять децилей – на десять частей, а девяносто девять процентилей – на 100 частей. Для определения квантилей, как и для определения медианы, совокупность наблюдений должна быть упорядочена либо по возрастанию значений случайной величины, либо по ее убыванию, в зависимости от исследуемой переменной.

Квантили являются одним из эффективных способов описания совокупности наблюдений. Например, если необходимо установить проходной балл для поступления в университет при конкурсе в три человека на место, то необходимо найти значение 67-го процентиля, который, как раз, и покажет ту границу, отделяющую одну треть высоких значений от двух третей низких.

Пример расчета мер центральной тенденции и квантилей распределения приведен в гл. 5.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]