Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Тервер экзамен.docx
Скачиваний:
0
Добавлен:
25.09.2019
Размер:
362.31 Кб
Скачать

Рассмотрим свойства функции f(X).

1. F(-∞)=lim(x→-∞)F(x)=0. Действительно, по определению, F(-∞)=P{X < -∞}. Событие (X < -∞) является невозможным событием: F(-∞)=P{X < - ∞}=p{V}=0.

2. F(∞)=lim(x→∞)F(x)=1, так как по определению, F(∞)=P{X < ∞}. Событие Х < ∞ является достоверным событием. Следовательно, F(∞)=P{X < ∞}=p{U}=1.

3. Вероятность того, что случайная величина примет значение из интервала [Α Β] равна приращению функции распределения вероятностей на этом интервале. P{Α ≤X<Β}=F(Β)-F(Α).

4. F(x2)≥ F(x1 ), если x2, > x1, т.е. функция распределения вероятностей является неубывающей функцией.

5. Функция распределения вероятностей непрерывна слева. FΨ(xo-0)=limFΨ(x)=FΨ(xo) при х→ xo

  1. .Что из себя представляет график функции распределения непрерывной случайной величины?

График функции плотности распределения называется кривой распределения, и площадь, ограниченная кривой распределения и осью абсцисс, равна единице. Тогда геометрически значение функции распределения F(x) в точке х0 есть площадь, ограниченная кривой распределения и осью абсцисс и лежащая левее точки х0.

  1. Плотность вероятности непрерывной случайной величины и ее свойства.

Плотностью распределения вероятностей непрерывной случайной величины Х называется функция f(x) – первая производная от функции распределения F(x).

Плотность распределения также называют дифференциальной функцией. Для описания дискретной случайной величины плотность распределения неприемлема.

Смысл плотности распределения состоит в том, что она показывает как часто появляется случайная величина Х в некоторой окрестности точки х при повторении опытов.

Свойства плотности распределения

1) Плотность распределения – неотрицательная функция.

2) Несобственный интеграл от плотности распределения в пределах от - ¥ до ¥ равен единице.

3) Вероятность попадения случайной величины в (a,b) равна ba f(x)dx.

4) Все свойства матемаического ожидания и дисперсии, верные для дискрентной величины, верны и для непрерывной случайной величины, в частности: D(x) = x^2 f(x)dx-M(x)^2

  1. Геометрический смысл плотности вероятности.

Г еометрический смысл плотности вероятности непрерывной случайной величины, попадающей в (a,b) есть S фигуры, ограниченной с боков прямыми х=а и x=b, сверху кривой распределения f(x), а снизу – осью 0x.

  1. Что из себя представляют числовые характеристики непрерывной случайной величины?

Определение. Модой М0 дискретной случайной величины называется ее наиболее вероятное значение. Для непрерывной случайной величины мода – такое значение случайной величины, при которой плотность распределения имеет максимум.

Если многоугольник распределения для дискретной случайной величины или кривая распределения для непрерывной случайной величины имеет два или несколько максимумов, то такое распределение называется двухмодальным или многомодальным.

Если распределение имеет минимум, но не имеет максимума, то оно называется антимодальным.

Определение. Медианой MD случайной величины Х  называется такое ее значение, относительно которого равновероятно получение большего или меньшего значения случайной величины, P(x<Me(x)) = P(x>Me(x))=1/2

Геометрически медиана – абсцисса точки, в которой площадь, ограниченная кривой распределения делится пополам.

Отметим, что если распределение одномодальное, то мода и медиана совпадают с математическим ожиданием.

Определение. Квантилем уровня q или q-квантилем называется такое значение случайной величины xq, при котором F(xq) = q = P(x< xq)=1/2

Определение. Под процентной точкой подразумевается квантиль X1-q, F(X1-q) = 1-q

Определение. Начальным моментом порядка случайной величины Х называется математическое ожидание величины Хk.

Определение. Центральным моментом k-го порядка случайной величины x называется M(x-M(x))^k.

Центральный момент первого порядка всегда равен нулю, а центральный момент второго порядка равен дисперсии. Центральный момент третьего порядка характеризует асимметрию распределения.

Определение. Отношение центрального момента третьего порядка к среднему квадратическому отклонению в третьей степени называется коэффициентом асимметрии.

Определение. Для характеристики островершинности и плосковершинности распределения используется величина, называемая эксцессом – E=(M44) -3

  1. Основные законы распределения непрерывной случайной величины:

а) равномерное распределение

Непрерывная случайная величина имеет равномерный закон распределения на [a,b] если ее f(x) – постоянна на этом промежутке и равна 0 вне его;

б) нормальное распределение

Непрерывная случайная величина x имеет нормальное распределение (Закон Гаусса) с параметрами а, б, б^2, если f(x) = (1/2πб)*·e(x-a)^2/2б^2

  1. Перечислите свойства непрерывной случайной величины, распределенной по нормальному закону. Что такое правило трех сигм?

  1. P(x1<=x<=x2)=1/2 (Ф(x1-a/б) – Ф(x1-a/б))

  2. Вероятность того, что отклонение случайной величины x распределенного по нормальному закону от математического ожидания не превышает Δ>=0 равно P(|x-a|<= Δ) = Ф(t), где t= Δ/б

Правило трех сигм - вероятность того, что случайная величина отклонится от своего математического ожидание на величину, большую чем утроенное среднее квадратичное отклонение, практически равна 0.

  1. Сформулируйте закон больших чисел и его следствия.

Закон больших чисел в теории вероятностей утверждает, что эмпирическое среднее (среднее арифметическое) конечной выборки из фиксированного распределения близко к теоретическому среднему (математическому ожиданию) этого распределения. 

Формулировка неравенства Маркова

Если среди значений случайной величины Х нет отрицательных, то вероятность того, что она примет какое-нибудь значение, превосходящее положительное число А, не больше дроби  , т.е. ,

а вероятность того, что она примет какое-нибудь значение, не превосходящее положительного числа А, не меньше  , т.е. .

  1. Неравенство Чебышева.

Первая форма неравенства Чебышева

Вероятность того, что отклонение случайной величины Х от ее математического ожидания, а произойдет по абсолютной величине постоянное число Е>0, не больше  , т.е. .

Вторая форма неравенства Чебышева

Вероятность того, что отклонение случайной величины Х от ее математического ожидания, а не произойдет по абсолютной величине постоянного числа Е>0, не меньше  , т.е. .

Формулировка теоремы Чебышева

Если дисперсии независимых случайных величин ограничены одной и той же постоянной С, то, как бы мало не было данное положительное число Е, вероятность того, что отклонение средней арифметической этих случайных величин от средней арифметической их математических ожиданий а1, а2, …, аn не превзойдет по абсолютной величине Е, как угодно близка к единице, если число случайных величин достаточно велико.

  1. В чем заключается особая роль нормального распределения (центральная предельная теорема)?

Пусть   суть бесконечная последовательность независимых одинаково распределённых случайных величин, имеющих конечное математическое ожидание и дисперсию. Обозначим последние μ иσ2 соответственно. Пусть  . Тогда  по распределению при  . Обозначив символом   выборочное среднее первых n величин, то есть  , мы можем переписать результат центральной предельной теоремы в следующем виде:

 по распределению при  .

  1. Что изучает математическая статистика?

Математическая статистика — раздел математики, разрабатывающий методы регистрации, описания и анализа данных наблюдений и экспериментов с целью построения вероятностных моделей массовых случайных явлений. В зависимости от математической природы конкретных результатов наблюдений статистика математическая делится на статистику чисел, многомерный статистический анализ, анализ функций (процессов) и временных рядов, статистику объектов нечисловой природы.

  1. Сформулируйте основные задачи математической статистики.

Первая задача – оценка показателей среднего значения и среднеквадратического отклонения.

Второй задачей, которую решает математическая статистика, является получение законов распределения случайных величин.

Третья задача математической статистики состоит в оценке доверительных интервалов, т.е. в оценке того диапазона, в который попадает случайная величина с определенной степенью достоверности.

  1. История возникновения и развития математической статистики.

Математическая статистика как наука начинается с работ знаменитого немецкого математика Карла Фридриха Гаусса (1777-1855), который на основе теории вероятностей исследовал и обосновал метод наименьших квадратов, созданный им в 1795 г. и примененный для обработки астрономических данных (с целью уточнения орбиты малой планеты Церера). Его именем часто называют одно из наиболее популярных распределений вероятностей – нормальное, а в теории случайных процессов основной объект изучения – гауссовские процессы.

В конце XIX в. – начале ХХ в. крупный вклад в математическую статистику внесли английские исследователи, прежде всего К.Пирсон (1857-1936) и Р.А.Фишер (1890-1962). В частности, Пирсон разработал критерий «хи-квадрат» проверки статистических гипотез, а Фишер – дисперсионный анализ, теорию планирования эксперимента, метод максимального правдоподобия оценки параметров.

В 30-е годы ХХ в. поляк Ежи Нейман (1894-1977) и англичанин Э.Пирсон развили общую теорию проверки статистических гипотез, а советские математики академик А.Н. Колмогоров (1903-1987) и член-корреспондент АН СССР Н.В.Смирнов (1900-1966) заложили основы непараметрической статистики. В сороковые годы ХХ в. румын А. Вальд (1902-1950) построил теорию последовательного статистического анализа.

Математическая статистика бурно развивается и в настоящее время. Так, за последние 40 лет можно выделить четыре принципиально новых направления исследований:

- разработка и внедрение математических методов планирования экспериментов;

- развитие статистики объектов нечисловой природы как самостоятельного направления в прикладной математической статистике;

- развитие статистических методов, устойчивых по отношению к малым отклонениям от используемой вероятностной модели;

- широкое развертывание работ по созданию компьютерных пакетов программ, предназначенных для проведения статистического анализа данных.

  1. Что такое варианты? Дайте понятие ранжированию вариантов.

Различные значения x называются вариантами. Расположение вариантов в порядке их возрастания или убывания называется ранжированием.

  1. Что называют частотами, частостями (или относительными частотами)?

Чилса, показывающие, сколько раз встречаются варианты из данного интервала называются частотами и обозначаются ni, а отношение ni/n к общему количеству называется частостями или относительной частотой и обозначается wi. Частоты и частости называются весами.

  1. Дайте понятие вариационного рада. Назовите виды вариационных рядов.

Ряд вариантов с соответствующими им весами ранжирования в порядке возрастания называется варяционным рядом.

Варяционный ряд называется непрерывным (интервальным), если варианты интервалов могут отличаться друг от друга на сколь угодно малую величину.

Варяционный ряд называется дискретным, если любые его варианты отличаются на постоянную величину.

  1. Перечислите способы графического изображения вариационных рядов. Дайте понятие каждому способу.

Полигон – это графическое изображение дискретного варяционного ряда, который представляет собой ломаную линию.

Гистограмма – служит для изображения интервальных варяционных рядов и представляет собой ступенчатую фигуру из прямоугольников с основаниями равными интервалам значений признака и высотами равными частотам.

Комулятивная кривая – изображает зависимость накопленных частот от xi.

Для дискретного ряда кумулята – ломанная линия, соединяющая точки: (xi, niнакопл) или (xi, wiнакопл)

  1. Сформулируйте определение эмпирической функции распределения.

Эмпирической функцией распределения (функцией распределения выборки) называют функцию  , определяющую для каждого значения x относительную частоту события  .

  1. Дайте понятие сводным характеристикам вариационных рядов:

а) средним аналитическим величинам (средняя арифметическая, средняя степенная k-го порядка, средняя гармоническая, средняя геометрическая и т.д.)

Средняя арифметическая – сумма произведений всех вариантов на соответствующие частоты деленное на сумму частот.

Средняя арифметическая величина является частным случаем, который называется степенной средней.

- для несгруппированных данных;

- для сгруппированных данных.

Средняя гармоническая применяется в тех случаях, когда частоты ряда выражены

в неявном виде.

Средняя геометрическая применяется в тех случаях, когда отдельные варианты

ряда резко отличаются от остальных;

б) средним структурным (порядковым) величинам (медиана, мода)

Медианой (Me) варяционного ряда называется значение признака, приходящегося на середину ранжированного ряда наблюдений.

Мода (Mo) варяционного ряда – это значение признака, имеющего наибольшую частоту;

в) характеристикам изменчивости (среднее линейное отклонение, дисперсия, среднее квадратическое отклонение).

Средним линейным отклонением варяционного ряда называется среднее арифметическое абсолютных величин отклонений от их средних арифметических.

Дисперсией варяционного ряда (S2) называется средняя арифметическая квадрата отклонений вариантов от их средней арифметической.

Средним квадратическим отклонением варяционного ряда

  1. Что называют начальными и центральными моментами?

  1. Что понимают под генеральной совокупностью?

Генеральной совокупностью называется вся подлежащая изучению совокупность всех объектов наблюдения.

  1. Что называется выборочной совокупностью или выборкой?

Выборкой называется та часть объектов, которая отобрана для непосредственного изучения из генеральной совокупности.

  1. Сформулируйте сущность выборочного метола наблюдения.

Сущность выборочного метода наблюдений состоит в том, чтобы по некоторой части генеральной совокупности (по выборке) выносить суждение о ее свойствах в целом.

  1. Отметьте преимущества выборочного метода наблюдения по сравнению со сплошным.

Значение выборочного метода состоит в том, что при минимальной численности обследуемых единиц проведение исследования осуществляется в более короткие сроки и с минимальными затратами труда и средств. Это повышает оперативность статистической информации, уменьшает ошибки регистрации.

По сравнению с другими методами, применяющими не сплошное наблюдение, выборочный метод имеет существенное преимущество. При соблюдении правил научной организации выборочного наблюдения появляется возможность количественной оценки ошибки репрезентативности (представительности).

Более того, способы определения ошибок выборки при различных приемах формирования выборочной совокупности и распространение характеристик выборки на генеральную совокупность составляют основное содержание статистической методологии выборочного метода.

  1. В чем состоит основной недостаток выборочного метода?

Недостатком выборочного метода является сравнительное большое число проверок. Объясняется это тем, что в этом методе при поиске неисправностей не используются функциональные связи отдельных элементов, хотя это делает метод универсальным, так как он не зависит от функциональной схемы прибора.

  1. Какая выборка называется репрезентативной?

Выборка называется репрезентативной, если она достаточно хорошо воспроизводит генеральную сосокупность.

  1. Какие различают виды выборок?

Собственно-случайная выборка заключается в отборе единиц из генеральной совокупности наугад или наудачу без каких-либо элементов системности.

Механическая – элементы из генеральной совокупности отбираются через определенный интервал.

Типический отбор (стратифицированная выборка) - используется в тех случаях, когда все единицы генеральной совокупности можно разбить на несколько типических групп.

Сущность серийной (гнездовой) выборки заключается в собственно-случайном или механическом отборе серий, внутри которых производится сплошное обследование единиц.

  1. Перечислите два способа образования выборки.

  1. Повторный отбор – каждый элемент, случайно отбранный и обследованный, возвращается в генеральную совокупность и может быть повторно отобран.

  2. Бесповторный отбор – отобранный элемент не возвращается в генеральную совокупность.

  1. В чем включается важнейшая задача выборочного метода?

Основная задача выборочного метода заключается в том, чтобы на основе изучения выборочной совокупности получить такие выборочные характеристики, которые как можно более точно отражали бы характеристики генеральной совокупности.

  1. Что называют оценкой параметра?

Итак, статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин.

  1. Почему следует судить о качестве оценки?

  1. Что означает словосочетание "наилучшая оценка?

  1. Сформулируйте основные свойства оценок.

Для установления качества оценки используют три основные свойства и рассматривают несмещенные оценки, состоятельные оценки и эффективные оценки.

Для того, чтобы определить эти свойства, необходимо предварительно ввести понятие статистики. Под статистикой   будем понимать функцию от выборки   случайной величины   . Следует отметить, что функция   сама является случайной величиной. Если статистика   позволяет оценить некоторую характеристику   случайной величины   , то говорят, что статистика   оценивает   . Например, статистика, оценивающая дисперсию случайной величины имеет вид:

.

Статистика   называется несмещенной оценкой параметра  , если математическое ожидание оценки равняется оцениваемому параметру:

Статистика   называется эффективной оценкой параметра  , если среднеквадратическая ошибка данной оценки является наименьшей среди всех возможных оценок:

Статистика   называется состоятельной оценкой параметра параметра   , если с ростом размера выборки оценка стремиться по вероятности к оцениваемому параметру:

 при любом сколь угодно малом 

  1. Как определяется эффективность оценки?

Эффективная оценка – это несмещенная оценка, имеющая наименьшую дисперсию из всех возможных несмещенных оценок данного параметра.

  1. Какая оценка называется асимптотически эффективной?

АСИМПТОТИЧЕСКИ ЭФФЕКТИВНАЯ ОЦЕНКА - понятие, расширяющее идею эффективной оценки на случай больших выборок. Однозначного определения А. э. о. не имеет. Напр., в классич. варианте речь идет об асимптотич. эффективности оценки в подходящим образом выделенном классе оценок  . Именно, пусть Тn - состоятельная оценка одномерного параметра совокупности θ, построенная по повторной выборке объема n. Тогда Тn ∈  , если существует дисперсия σ2 (√nTn), и в пределе при n → ∞ она ограничена снизу величиной, обратной Фишера информационному количеству, приходящемуся на одно наблюдение. Асимптотически эффективной будет оценка T*n ∈  , на к-рой указанная нижняя грань достигается. При известных условиях этим свойством обладает оценка максимального правдоподобия для θ, что и придает значимость классическому определению. Если А. э. о. Тn существует, то величина

определяет асимптотич. эффективность оценки Тn .

  1. Перечислите методы оценивания параметров.

1) метод моментов

2) метод максимального правдоподобия

3) мегод наименьших квадратов

4) интервальная оценка параметров

  1. Что из себя представляет метод моментов?

Метод предложен К. Пирсоном в 1894 г. Сущность метода: выбирается столько эмпирических моментов, сколько требуется оценить неизвестных параметров распределения. Желательно применять моменты младших порядков, так как погрешности вычисления оценок резко возрастают с увеличением порядка момента; вычисленные по ЭД оценки моментов приравниваются к теоретическим моментам; параметры распределения определяются через моменты, и составляются уравнения, выражающие зависимость параметров от моментов, в результате получается система уравнений. Решение этой системы дает оценки параметров распределения генеральной совокупности.