Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка-анализ ВР.doc
Скачиваний:
8
Добавлен:
08.05.2019
Размер:
846.34 Кб
Скачать

19

Министерство общего и профессионального образования Роcсийской Федерации

Сибирская государственная горно-металлургическая академия

Кафедра высшей математики

Статистический анализ вариационных рядов

Рекомендации к выполнению индивидуальных

заданий по курсу "Высшая математика"

для студентов экономических специальностей

Издание СибГГМА Новокузнецк 1997

УДК 519.2 (075)

Рассмотрены вопросы построения интервального ряда распределения по опытным данным и оценки степени близости эмпирического распреде­ле­ния нормальному закону распределения, даны индивидуальные задания для самостоятельной работы.

Предназначены для студентов экономических специальностей, изучающих раздел "Элементы математической статистики" курса "Высшая математика".

Рецензент - кафедра экономики и управления производством СибГГМА (зав.кафедрой Н.А.Ефимов)

Печатается по решению редакционно-издательского совета СибГГМА

Введение

При решении ряда практических задач оперируют неупорядоченной совокупностью результатов наблюдений над тем или иным признаком. Выявить какие-либо тенденции, а тем более закономерности, по такой совокупности не представляется возможным. Построение интервального ряда является одним из основных приёмов, способствующих выявлению закономерностей в исследуемой статистической совокупности.

В данной работе на конкретном примере рассмотрены следующие вопросы: построение интервального вариационного ряда по опытным данным, определение статистических характеристик вариационного ряда; графическое изображение вариационного ряда, оценка степени близости эмпирического распределения нормальному закону распределения.

Для закрепления данного материала даны индивидуальные задания для самостоятельной работы.

Теоретический минимум

Математическая статистика изучает методы сбора, систематизации и обработки результатов наблюдений массовых случайных явлений с целью выявления существующих закономерностей. Выводы о закономерностях, которым подчиняются явления, изучаемые методами математической статистики, как правило, основываются на ограниченном, выборочном числе наблюдений, которые принято называть статистическими данными.

Статистические данные - это сведения о том, какие значения принял в результате наблюдений интересующий исследователя признак.

Вариация - колеблемость признака, изменчивость величины признака у единиц, входящих в состав совокупности.

Вариационный ряд - совокупность значений варьирующего признака и соответствующих им численностей единиц совокупности. Он может быть дискретным (прерывным) или непрерывным (интервальным). В случае, если варианты расположены в порядке возрастания, вариационный ряд называется ранжированным (упорядоченным).

Частота (mi) - число, показывающее, сколько раз тот или другой вариант встречается в данной совокупности. Например, если в совокупности рабочих бригады 5 человек выполнили задание на 120%, то число 5 является частотой варианта 120%.

Частость (wi) - относительная величина, доля частоты того или иного варианта или интервала (mi) в сумме всех частот (Smi):

Сумма всех частостей равна единице.

Накопленные частоты (или частости) получаются суммированием частоты данного варианта (интервала) с суммой частот всех предшествующих вариантов. Такое суммирование называется кумуляцией.

Интервал - значения варьирующего признака, лежащие в определённых границах. Например, заработная плата рабочих от 1.5 до 1.7 млн. руб., от 1.7 до 1.9 млн. руб. и т. д.

Построение интервального вариационного ряда - распределение непрерывного признака по способу наибольшего и наименьшего значений. Для построения интервального вариационного ряда необходимо определить величину интервала , установить полную шкалу интервалов и в соответствии с ней сгруппировать результаты наблюдений, т. е. подсчитать число вариантов в каждом интервале. Для определения оптимальной величины интервала используется формула Стерджесса:

(1)

где xmax и xmin - соответственно максимальный и минимальный варианты;

n - число наблюдений (объём выборки).

Границы интервалов обозначают ai и bi . За начало первого интервала принимается величина a1@ xmin -h/2 , начало второго интервала совпадает с концом первого и равно: a2=b1=a1+h; a3=a2+h и т. д. Построение интервалов продолжают до тех пор, пока верхняя граница последнего интеграла не будет равна или больше xmax .

После установления полной шкалы интервалов следует определить число вариантов (частоты mi ) в каждом интервале. Результаты сводятся в табл. 1 (см. Образец выполнения индивидуального задания).

Полигон служит для графического изображения вариационного ряда. Для его построения точки (xi;mi) в прямоугольной системе координат соединяют последовательно отрезками прямых. Крайние левую и правую точки соединяют соответственно с точками, изображающими ближайший снизу к наименьшему и ближайший сверху к наибольшему варианты. Полученная ломаная и называется полигоном.

Гистограмма служит для графического изображения только интервального ряда. Для её построения в прямоугольной системе координат по оси абсцисс откладываются отрезки, изображающие интервалы варьирования, и на этих отрезках, как на основаниях, строят прямоугольники с высотами, равными частотам (или частостям) соответствующего интервала. Полученная ступенчатая фигура называется гистограммой.

Кумулята (кумулятивная кривая) в случае дискретного ряда строится в прямоугольной системе координат по точкам с координатами (xi;miнак),где xi - вариант, miнак - соответствующая накопленная частота. Полученные точки соединяют отрезками прямых.

Если вариационный ряд интервальный, то при построении кумуляты по оси абсцисс откладывают интервалы. Верхним границам интервалов соответствуют накопленные частоты. Нижней границей первого интервала соответствует накопленная частота, равная нулю.

Средняя арифметическая взвешенная:

(2)

Медианой (Ме) называют значение признака, приходящееся на середину ранжированного вариационного ряда. Если число наблюдений нечетно, т. е. n=2q-1, то Ме=xq. Если же число наблюдений чётно, т. е. n=2q, то Ме= (xq + xq+1) / 2.

В случае интервального вариационного ряда сначала находят медианный интервал - первый интервал, накопленная частота которого превышает половину всего объёма наблюдений, т. е.

mМе нак > å mi / 2.

Медиана для интервального вариационного ряда с равными интервалами вычисляется по формуле :

, (3)

где аМе - начало медианного интервала; h - ширина интервала, å mi / 2 - полусумма всех частот; mMe-1 нак - накопленная частота интервала, предшествующего медианному; mMe - частота медианного интервала.

Главное свойство медианы состоит в том, что сумма абсолютных величин отклонений вариантов от медианы меньше, чем от любой другой величины.

Модой (Мо) называют значение признака, которое наблюдается наибольшее число раз. Для дискретного вариационного ряда никаких вычислений не требуется, т. к. в этом случае модой является вариант с наибольшей частотой. В случае интервального вариационного ряда сначала определяют модальный интервал - интервал с наибольшей частотой, а затем вычисляют моду по формуле:

(4)

где аМо - начало модального интервала; h - ширина интервала; mMo - частота модального интервала; mMo-1 - частота интервала, предшествующего модальному; mMo+1 - частота интервала, следующего за модальным.

Вариационный размах или просто размах - разность между наибольшим и наименьшим вариантами:

R = xmax - xmin (5)

Выборочная дисперсия - средняя взвешенная из квадратов отклонений вариантов от средней арифметической:

(6)

Выборочное среднее квадратическое отклонение:

(7)

Коэффициенты вариации - безразмерные величины, использующиеся при изучении вариации признака, принимающего только положительные значения, и при средней арифметической, не равной нулю.

Коэффициент вариации по размаху :

(8)

Коэффициент вариации по среднему квадратическому отклонению:

(9)

Начальным моментом вариационного ряда порядка k называется взвешенная средняя арифметическая k-ыx степеней вариантов:

(10)

Очевидно, что n1 = `x.

Центральным моментом вариационного ряда порядка k называется взвешенная средняя арифметическая k-ыx степеней отклонений вариантов от их средней арифметической :

(11)

Очевидно, что m2= S2.

Центральные моменты можно выражать через начальные моменты:

m2= n2 -n12 =

m3= n3 - 3 n1n2 + 2n13

m4= n4 - 4 n1n3 + 6 n12n2 -3 n14

Асимметрией (Ас) вариационного ряда называют отношение центрального момента третьего порядка к кубу среднего квадратического отклонения:

(12)

Если полигон вариационного ряда скошен, т. е. одна из его ветвей, начиная от вершины, длиннее другой, то такой ряд называют асимметричным. Из формулы (12) следует, что если в вариационном ряду преобладают варианты, меньшие , то Ас<0 и имеет место левосторонняя асимметрия. Если же в вариационном ряду преобладают варианты, большие , то Ас>0 и имеет место правосторонняя асимметрия.

Для симметричных распределений Мо = Me = , для умеренно асимметричных .

Эксцессом (Ек) называют уменьшенное на 3 единицы отношение центрального момента четвёртого порядка к четвёртой степени среднего квадратического отклонения:

(13)

За стандартное значение эксцесса принимают нуль - эксцесс так называемой нормальной кривой распределения. Кривые, у которых эксцесс отрицательный, по сравнению с нормальной кривой менее крутые, имеют более плоскую вершину и называются “плосковершинными” (Ек<0). Кривые с положительным эксцессом (Ек>0) называются “островершинными”.