- •1. Ввод исходных данных
- •2. Построение графика динамики цен на нефть (поля рассеивания)
- •3. Определение параметров выборки, описательные статистики
- •4. Построение гистограммы частоты признака
- •5. Построение теоретического закона распределения признака
- •6. Проверка согласия эмпирического и теоретического законов распределения по критерию хи-квадрат Пирсона
Лабораторная работа №1. Проверка гипотезы о нормальном распределении признака.
Лабораторная работа выполняется в Excel 2007.
Цель работы – дать навыки первичной обработки данных, построении гистограммы частот, подборе подходящего закона распределения и вычислении его параметров, проверка согласия между эмпирическим и гипотетическим законом распределения по критерию хи-квадрат Пирсона средствами Excel.
1. Ввод исходных данных
Исходные данные взять на ЯНДЕКС.
В правом нижнем углу выбрать Нефть.
Рис. 1. Страница ЯНДЕКС ……..
В открывшемся окне появится график “Динамика цен на Нефть Brent, USD/баррель”.
На графике установите временной интервал просмотра данных – год.
Данные цен на нефть даны через неделю, следовательно, нужно снять и записать 53 отсчета, что совсем не трудно. Далее эти данные внести в таблицу Excel.
Отсчет времени – массив $A$2: $A$54 (1, 2, … , 53)
Цены на нефть - массив $B$2: $B$54 (рис. 3)
Рис. 2. График динамики цен на нефть за время январь 2012 – январь 2013, период отсчета – через неделю.
Варианты заданий:
№ варианта |
Временной интервал |
№ варианта |
Временной интервал |
1 |
январь 2005 - январь 2006 |
13 |
январь 2011 – январь 2012 |
2 |
январь 2006 - январь 2007 |
14 |
март 2011 – март 2012 |
3 |
январь 2007 - январь 2008 |
15 |
май 2011- май 2012 |
4 |
январь 2008 - январь 2009 |
16 |
июль 2011 – июль 2012 |
5 |
январь 2009 - январь 2010 |
17 |
сентябрь 2011 – сентябрь 2012 |
6 |
март 2009 – март 2010 |
18 |
ноябрь 2011 – ноябрь 2012 |
7 |
январь 2010 – январь 2011 |
19 |
Январь 2012 – январь 2013 |
8 |
март 2010 – март 2011 |
20 |
март 2012 – март 2013 |
9 |
май 2010- май 2011 |
21 |
май 2012- май 2013 |
10 |
июль 2010 – июль 2011 |
22 |
июль 2012 – июль 2013 |
11 |
сентябрь 2010 – сентябрь 2011 |
23 |
сентябрь 2012 – сентябрь 2013 |
12 |
ноябрь 2010 – ноябрь 2011 |
24 |
|
………………………………
Рис. 3. Таблица исходных данных
2. Построение графика динамики цен на нефть (поля рассеивания)
Для построения графика необходимо выделить оба столбца (вместе с названиями столбцов) → Вставка→Точечная (точки соединены прямыми линиями). Оформить график, как показано на рис. 4.
Рис. 4. График динамики цены на нефть
3. Определение параметров выборки, описательные статистики
В главном меню Excel выбрать: Данные → Анализ данных → Описательная статистика → ОК.
В появившемся окне Описательная статистика ввести:
Входной интервал – массив, состоящий из 53 чисел в ячейках $B$2: $B$54;
Группирование - по столбцам;
Выходной интервал – адрес ячейки, с которой начинается таблица Описательная статистика - $C$1(или адрес любой другой ячейки на свободном месте листа Excel);
Итоговая статистика – поставить галочку. ОК.
Рис. 5. Диалоговое окно Описательная статистика с заполненными полями ввода.
На листе Excel появится таблица – Столбец 1
Рис. 6. Таблица Столбец 1 с данными процедуры Описательная статистика.
Таблица содержит описательные статистики, в частности:
Среднее – оценка среднего значения выборки, = 108,9134;
Стандартное отклонение – оценка среднего квадратического отклонения, = 4,494833;
Медиана – = 109,5;
Мода - #н/д, нет данных;
Эксцесс (-0,48275) - оценка эксцесса
Асимметричность (-0,09971) – оценка асимметрии.
Excel не может определить моду - нет данных. Для вычисления моды необходимо сначала построить гистограмму, что будет сделано далее.
Описательные статистики при решении задачи подбора теоретической кривой распределения полезны тем, что приблизительное равенство нулю оценок эксцесса и асимметрии, и приблизительное равенство оценок среднего медианыи модыдает предварительное основание выбрать в качестве основной гипотезыH0 распределения признаков генеральной совокупности - нормальный закон.
Интервал – размах выборки (R = 18,38);
Минимум – минимальное значение признака в выборке ();
Максимум – максимальное значение признака в выборке ().
Результаты процедуры Описательная статистика потребуются в дальнейшем при построении теоретического закона распределения.