Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Архив2 / курсач docx283 / kursach_po_tvms_33__33__33__33

.docx
Скачиваний:
61
Добавлен:
07.08.2013
Размер:
87.12 Кб
Скачать

Международный университет природы, общества и человека «Дубна»

Кафедра высшей и прикладной математики

Курсовая работа

по теории вероятностей и математической статистике

Тема: «ВЫБОРОЧНЫЙ МЕТОД. СТАТИСТИЧЕСКИЕ ОЦЕНКИ. ЛИНЕЙНАЯ РЕГРЕССИЯ»

Выполнила: студентка группы 2131

Федосеева А. А.

Руководитель: доцент Титкова И. В.

Дубна, 2009

Введение

Математическая статистика — наука о математических методах систематизации и использовании статистических данных для научных и практических выводов. Во многих своих разделах математическая статистика опирается на теорию вероятностей, позволяющую оценить надёжность и точность выводов, делаемых на основании ограниченного статистического материала (выборки).

Во время статистических наблюдений для каждого объекта в ряде случаев можно измерить значение нескольких признаков. Таким образом, получается многомерная выборка. Если многомерную выборку обработать по значениям отдельного признака, то получится обычная обработка одномерной выборки.

Смысл обработки многомерных выборок состоит в том, чтобы установить связь между признаками. Связи могу быть функциональными, то есть каждому значению одной величины соответствует определенное значение другой величины.

Связь между случайными величинами часто носит случайный характер и называется стохастической или статистической, если изменение одной величины вызывает изменение распределения другой величины. Если среднее значение одной случайной величины функционально зависит от значения другой случайной величины, то такая статистическая зависимость называется корреляционной.

Постановка задачи

Часть 1. По данной одномерной выборке X:

1) построить полигон, гистограмму, кумуляту и эмпирическую функцию распределения;

2) вычислить числовые характеристики выборки: среднее, моду, медиану, дисперсию, среднее квадратическое отклонение, коэффициенты асимметрии и эксцесса;

3) найти несмещенные оценки для математического ожидания, дисперсии и среднего квадратического отклонения генеральной совокупности;

4) рассчитать доверительные интервалы для математического ожидания и среднего квадратического отклонения, если уровень доверия ;

Часть 2. По данной двумерной выборке (X,Y) построить линейную регрессию Y на X и вычислить коэффициенты регрессии и корреляции.

Часть 1.

Исходные данные и их обработка

А13={114, 105, 103, 122, 118, 113, 107}

Делаем вариационный ряд:

Xi

103

105

107

113

114

118

122

Ni

1

1

1

1

1

1

1

Вариационным рядом называется выборка, расположенная в порядке возрастания.

n=7 – объем выборки.

Полигон частоты

Полигоном частот выборки называется ломаная с вершинами в точках . Полигоном относительных частот выборки называется ломаная с вершинами в точках .Полигон, как правило, служит для изображения дискретного ряда.

Гистограмма

Xi

103

105

107

113

114

118

122

Ni

1

1

1

1

1

1

1

Wi

 1/7

 1/7

1/7 

 1/7

1/7 

 1/7

1/7

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению (плотность частоты). Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны (плотность относительной частоты).

Кумулята и эмпирическая функция распределения

Кумулята - кривая накопленных частот (частостей), соединяющая точки (xi,ni) или (xi,wiнак), i=1,2,…,m.

Накопленная частота.

F(x)=

F(x) =

Вычисление числовых характеристик вариационного ряда

Средней арифметической вариационного ряда называется сумма произведений всех вариантов на соответствующие частоты, деленная на сумму частот:

Модой вариационного ряда называется вариант, которому соответствует наибольшая частота.

Медианой вариационного ряда называется значение признака, приходящееся на середину ранжированного ряда наблюдений.

Дисперсией вариационного ряда называется средняя арифметическая квадратов отклонений вариантов от их средней арифметической:

42.20408413

Среднее квадратическое отклонение s – арифметическое значение корня квадратного из дисперсии:

Коэффициентом асимметрии вариационного ряда называется число:

где – центральный момент k-го порядка вариационного ряда

Если коэффициент асимметрии равен нулю, то распределение имеет симметрическую форму, то есть варианты, равноудаленные от , имеют одинаковую частоту. При 0 говорят о положительной (правосторонней) или отрицательной (левосторонней) асимметрии.

– правосторонняя асимметрия

Коэффициентом эксцесса вариационного ряда называется число:

Эксцесс является показателем «крутости» вариационного ряда по сравнению с нормальным распределением. Эксцесс нормально распределенной величины равен нулю. Если , то полигон вариационного ряда имеет более крутую (пологую) вершину по сравнению с нормальной кривой.

-1.309564658

Несмещенные оценки

Выборочная средняя бесповторной выборки есть несмещенная оценка генеральной средней (математического ожидания).

Выборочная дисперсия повторной и бесповторной выборок есть смещенная оценка генеральной дисперсии. Несмещенная оценка дисперсии – это исправленная выборочная дисперсия.

Несмещенная оценка среднего квадратического отклонения:

Доверительные интервалы

Доверительный интервал для математического ожидания, если - известна

Доверительный интервал для математического ожидания, если – неизвестна

=2.45

Доверительный интервал для среднего квадратического отклонения

Часть 2.

x

y

114

41

105

41

103

34

122

38

118

50

113

45

107

47

Подберём параметры a и b так, чтобы F(a , b) достигала своего минимума, как функция переменных a и b .

Для отыскания минимума функции двух переменных надо удовлетворить необходимому и достаточному условию существования минимума. Необходимым условием экстремума функции нескольких переменных является равенство нулю первого дифференциала. Получаем следующую систему условий:

,

гдеобъём выборки.

;

;

,

Теперь надо проверить, что в полученной точке выполняется достаточное условие минимума, а именно, что второй дифференциал функциив точке представляет собой строго положительную квадратичную форму.

Для этого достаточно, чтобы существовали вторые частные производные функциипо всем переменным и величины в точке.

Вычислим вторые частные производные функции

и .

; ;

> 0, следовательно, в точке минимум функции .

Корреляция — это статистическая зависимость между случайными величинами, не имеющими строго функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой.

Коэффициентом корреляции случайных величин X и Y называют отношение корреляционного момента к произведению средних квадратичных отклонений этих величин: , причем .

, следовательно, случайные величины X и Y некоррелированны (несвязанны).

Коэффициент регрессии:

Выборочное уравнение прямой линии регрессии Y на X

Список литературы

  1. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. — М.: Высшая школа, 1998.

  2. Кремер Н. Ш. Теория вероятностей и математическая статистика – М.: Юнити-Дана, 2006.

Дата

ФИО

Подпись

“____”_________200__г.

Федосеева А. А.

Дата

ФИО

Оценка

Подпись

“____”_________200__г.

Титкова Ирина Викторовна

Соседние файлы в папке курсач docx283