- •Классификация случайных событий. Классическое определение вероятности. Свойства вероятности события, непосредственный подсчет вероятности. Примеры.
- •Свойства вероятности события:
- •Статистическое определение вероятности события и условия его применимости. Пример.
- •Несовместные и совместные события. Сумма событий. Теорема сложения вероятностей (с доказательством).
- •Полная группа событий. Противоположные события. Соотношение между вероятностями противоположных событий (с выводом).
- •Зависимые и независимые события. Произведение событий. Понятие условной вероятности. Теорема умножения вероятностей (с доказательством).
- •Формулы полной вероятности и Байеса (с доказательством). Примеры.
- •Повторные независимые испытания. Формула Бернулли (с выводом). Примеры.
- •Локальная теорема Муавра-Лапласа, условия ее применимости. Свойства функции Дх). Пример.
- •Асимптотическая формула Пуассона и условия ее применимости. Пример.
- •Интегральная теорема Муавра-Лапласа и условия ее применимости. Функция Лапласа ф(х) и ее свойства. Пример.
- •Следствия из интегральной теоремы Муавра-Лапласа (с выводом). Примеры.
- •Математическое ожидание дискретной случайной величины и его свойства (с выводом). Примеры.
- •Дисперсия дискретной случайной величины и ее свойства (с выводом). Примеры.
- •Функция распределения случайной величины, ее определение, свойства и график.
- •Непрерывная случайная величина (нов). Вероятность отдельно взятого значения нсв. Математическое ожидание и дисперсия нсв.
- •Плотность вероятности непрерывной случайной величины, ее определение, свойства и график.
- •Случайная величина, распределенная по биномиальному закону, ее математическое ожидание и дисперсия. Закон распределения Пуассона.
- •Математическое ожидание и дисперсия числа и частости наступлений события в п повторных независимых испытаниях (с выводом).
- •Определение нормального закона распределения. Теоретико-вероятностный смысл его параметров. Нормальная кривая и зависимость ее положения и формы от параметров.
- •Функция распределения нормально распределенной случайной величины и ее выражение через функцию Лапласа.
- •Формулы для определения вероятности: а) попадания нормально распределенной случайной величины в заданный интервал; б) ее отклонения от математического ожидания. Правило «трехсигм».
- •Понятие двумерной (/7-мерной) случайной величины. Примеры. Таблица ее распределения. Одномерные распределения ее составляющих. Условные распределения и их нахождение по таблице распределения.
- •Ковариация и коэффициент корреляции случайных величин. Связь между екоррелированностью и независимостью случайных величин.
- •Понятие о двумерном нормальном законе распределения. Условные математические ожидания и дисперсии.
- •Неравенство Маркова (лемма Чебышева) (с выводом). Пример.
- •Неравенство Чебышева (с выводом) и его частные случаидля случайной величины, распределенной по биномиальному закону, и для частости события.
- •Теорема Чебышева (с доказательством), ее значение и следствие. Пример.
- •Закон больших чисел. Теорема Бернулли (с доказательством) и ее значение. Пример.
- •Неравенство Чебышева для средней арифметической случайных величин (с выводом).
- •Центральная предельная теорема. Понятие о теореме Ляпунова и ее значение. Пример.
- •Вариационный ряд, его разновидности. Средняя арифметическая и дисперсия ряда. Упрощенный способ их расчета.
- •Понятие об оценке параметров генеральной совокупности. Свойства оценок: несмещенность, состоятельность, эффективность.
- •Оценка генеральной доли по собственно-случайной выборке. Несмещенность и состоятельность выборочной доли.
- •Оценка генеральной средней по собственно-случайной выборке. Несмещенность и состоятельность выборочной средней.
- •Оценка генеральной дисперсии по собственно-случайной выборке. Смещенность и состоятельность выборочной дисперсии (без вывода). Исправленная выборочная дисперсия.
- •Понятие об интервальном оценивании. Доверительная вероятность и доверительный интервал. Предельная ошибка выборки. Ошибки репрезентативности выборки (случайные и систематические).
- •Формула доверительной вероятности при оценке генеральной средней. Средняя квадратическая ошибка повторной и бесповторной выборок и построение доверительного интервала для генеральной средней.
- •Определение необходимого объема повторной и бесповторной выборок при оценке генеральной средней и доли.
- •Статистическая гипотеза и статистический критерий. Ошибки 1-го и 2-го рода. Уровень значимости и мощность критерия. Принцип практической уверенности.
- •Построение теоретического закона распределения по опытным данным. Понятие о критериях согласия.
- •Критерий согласия х2-Пирсона и схема его применения.
- •Функциональная, статистическая и корреляционная зависимости. Различия между ними. Основные задачи теории корреляции.
- •Линейная парная регрессия. Система нормальных уравнений для определения параметров прямых регрессии. Выборочная ковариация. Формулы для расчета коэффициентов регрессии.
- •Упрощенный способ:
- •Оценка тесноты связи. Коэффициент корреляции (выборочный), его свойства и оценка достоверности.
Вариационный ряд, его разновидности. Средняя арифметическая и дисперсия ряда. Упрощенный способ их расчета.
Вариационным рядом называется ранжированный в порядке возрастания (или убывания) ряд вариантов с соответствующими им весами (частотами или частостями).
При изучении вариационных рядов наряду с понятием частоты используется понятие накопленной частоты (обозначаем ). Накопленная частота показывает, ск-ко наблюдалось вариантов со значением признака, меньшим х. Отношение на копленной частоты к общему числу наблюдений n назовемнакопленной частостью .
Накопленные частоты (частости) для каждого интервала находятся последовательным суммированием частот (частостей) всех предшествующих интервалов, включая данный.
Для задания вариационного ряда достаточно указать варианты и соответствующие им частоты (частости) или накопленные частоты (частости).
Вариационный ряд называется дискретным, если любые его варианты отличаются на постоянную величину, и - непрерывным (интервальными), если варианты могут отличаться один от другого на сколь угодно малую величину.
Для графического изображения вариационных рядов наиболее часто используются полигон, гистограмма, кумулятивная кривая:
Полигон, как правило, служит для изображения дискретного вариационного ряда и представляет собой ломаную, в которой концы отрезков прямой имеют координаты (), i = 1, 2,..., m.
Гистограмма служит только для изображения интервальных вариационных рядов и представляет собой ступенчатую фигуру из прямоугольников с основаниями, равными интервалам значений признака , i = 1, 2, ...,m, и высотами, равными частотам (частостям) () интервалов. Если соединить середины верхних оснований прямоугольников отрезками прямой, то можно получить полигон того же распределения.
Кумулятивная кривая (кумулята) - кривая накопленных частот (частостей). Для дискретного ряда кумулята представляет ломаную, соединяющую точки (,) или (,), i = 1, 2, ..., m. Для интервального вариационного ряда ломаная начинается с точки, абсцисса к-ой равна началу первого интервала, а ордината - накопленной частоте (частости), равной нулю. Другие точки этой ломаной соответствуют концам интервалов.
Эмпирической функцией pacпpeдeлeнuя называется относительная частота (частость) того, что признак (случайная величина х) примет значение, меньшее заданного х, т.е.
Другими словами, для данного х эмпирическая функция распределения представляет накопленную частость: .
Вариационный ряд является статистическим аналогом (реализацией) распределения признака (случайной величины Х).
Вариационный ряд содержит достаточно полную информацию об изменчивости (вариации) признака. Однако обилие числовых данных, с помощью которых он задается, усложняет их использование. В то же время на практике часто оказывается достаточным знание лишь сводных характеристик вариационных рядов: средних или характеристик центральной тенденции; характеристик изменчивости (вариации) и др.
Средней арифметической вариационного ряда называется сумма произведений всех вариантов на соответствующие частоты, деленная на сумму частот:
где - варианты дискретного ряда или середины интервалов интервального вариационного ряда;- соответствующие им частоты;m - число неповторяющихся вариантов или число интервалов; .
Очевидно, что , где- частости вариантов или интервалов.
Основные свойства средней арифметической.
1. Средняя арифметическая постоянной равна самой постоянной.
2. Если все варианты увеличить (уменьшить) в одно и то же число раз, то средняя арифметическая увеличится (уменьшится) во столько же раз:
.
3. Если все варианты увеличить (уменьшить) на одно и то же число, то средняя арифметическая увеличится (уменьшится) на то же число:
.
4. Средняя арифметическая отклонений вариантов от средней арифметической равна нулю:
.
5. Средняя арифметическая алгебраической суммы нескольких признаков равна такой же сумме средних арифметических этих признаков:
.
6. Если ряд состоит из нескольких групп, общая средняя равна средней арифметической групповых средних, причем весами являются объемы групп:
где - общая средняя (средняя арифметическая всего ряда);- групповая средняя i-й группы, объем которой равен;l - число групп.
Дисперсией вариационного ряда называется средняя арифметическая квадратов отклонений вариантов от их средней арифметической:
.
Формулу для дисперсии вариационного ряда можно записать в виде:
где .
Для несгруппированного ряда :.
Дисперсию часто называют эмпирической или выборочной, подчеркивая, что она (в отличие от дисперсии СВ) находится по опытным или статистическим данным.
Вычисление средней арифметической и дисперсиивариационного ряда можно упростить, если использовать не первоначальные варианты(i = 1, 2, ..., m), а новые варианты:
, (1)
где с и k - специально подобранные постоянные.
Согласно свойствам 2 и 3 средней арифметической и дисперсии:
, (2)
, (3)
Откуда
(4)
. (5)
Затем, получим (6)
Теперь, заменяя в (4) и (5) иих выражениямиичерез варианты, получим
, (7)
, (8)
где определяются по (1).
Формулы (7) и (8) дадут заметное упрощение расчетов, если в качестве постоянной k взять величину (ширину) интервала по x, а в качестве с - середину серединного интервала. Если серединных интервалов два (при четном числе интервалов), то в качестве с рекомендуется взять середину одного из этих интервалов, например, имеющего большую частоту.
Генеральная и выборочная совокупности. Принцип образования выборки. Собственно-случайная выборка с повторным и бесповторным отбором членов. Репрезентативная выборка. Основная задача выборочного метода.
Вся подлежащая изучению совокупность объектов (наблюдений) называется генеральной совокупностью. В матем-кой статистике понятие генеральной совокупности трактуется как совокупность всех мыслимых наблюдений, к-ые могли бы быть произведены при данном реальном комплексе условий, и в этом смысле его не следует смешивать с реальными совокупностями, подлежащими статистическому изучению. Так, обследовав даже все пр-тия подотрасли по определенным технико-эк-ким показателям, мы можем рассматривать обследованную совокупность лишь как представителя гипотетически возможной более широкой совокупности пр-тий, к-е могли бы функционировать в рамках того же реального комплекса условий.
Понятие генеральной совокупности в определенном смысле аналогично понятию случайной величины (закону распределения вер-тей, вероятностному пространству), т.к. полностью обусловлено определенным комплексом условий.
Та часть объектов, к-ая отобрана для непосредственного изучения из генеральной совокупности, называется выборочной совокупностью, или выборкой. Числа объектов (наблюдений) в генеральной или выборочной совокупности называются их объёмами. Генеральная совокупность может иметь как конечный, так и бесконечный объем.
Выборку можно рассматривать как некий эмпирический аналог генеральной совокупности. Сущность выборочного метода состоит в том, чтобы по некоторой части генеральной совокупности (по выборке) выносить суждение о ее свойствах в целом.
Преимущества выборочного метода наблюдения по сравнению со сплошным:
1) позволяет существенно экономить затраты ресурсов (материальных, трудовых, временных);
2) является единственно возможным в случае бесконечной генеральной совокупности или в случае, когда исследование связано с уничтожением наблюдаемых объектов (напр, исследование долговечности электрических лампочек, предельных режимов работы приборов и т.п.);
3) при тех же затратах ресурсов дает возможность проведения углубленного исследования за счет расширения программы исследования;
4) позволяет снизить ошибки регистрации, т.е. расхождения между истинным и зарегистрированным значениями признака.
Основной недостаток выборочною метода - ошибки исследования, называемые ошибками репрезентативности (представительства).
Однако неизбежные ошибки, возникающие при выборочном методе исследования в связи с изучением только части объектов, могут быть заранее оценены и посредством правильной организации выборки сведены к практически незначимым величинам. Между тем использование сплошного наблюдения даже там, где это принципиально возможно, не говоря уже о росте трудоемкости, стоимости и увеличении необходимого времени, часто приводит к тому, что каждое отдельное наблюдение поневоле проводится с меньшей точностью. А это уже сопряжено с неустранимыми ошибками и в конечном счете может привести к снижению точности сплошного наблюдения по сравнению с выборочным.
Чтобы по данным выборки иметь возможность судить о генеральной совокупности, она д.б. отобрана случайно. Случайность отбора элементов в выборку достигается соблюдением принципа равной возможности всем элементам генеральной совокупности быть отобранными в выборку. На практике это достигается тем, что извлечение элементов в выборку проводится путем жеребьевки (лотереи) или с помощью случайных чисел, имеющихся в специальных таблицах или вырабатываемых ЭВМ с помощью датчика случайных чисел.
Выборка называется репрезентативной (представительной), если она достаточно хорошо воспроизводит генеральную совокупность.
Различают следующие виды выборок:
1) собственно-случайная выборка, образованная случайным выбором элементов без расчленения на части или группы;
2) механическая выборка, в к-ую элементы из генеральной совокупности отбираются через определенный интервал. На пример, если объем выборки должен составлять 10% (10%-ная выборка), то отбирается каждый l0-й ее элемент и т.д.;
3) типическая (стратифицированная) выборка, в к-ую случайным образом отбираются элементы из типических групп, на к-ые по нек-му признаку разбивается генеральная совокупность;
4) серийная (гнездовая) выборка, в к-ую случайным образом отбираются не элементы, а целые группы совокупности (серии), а сами серии подвергаются сплошному наблюдению.
Используют два способа образования выборки:
1) повторный отбор (по схеме возвращенного шара), когда каждый элемент, случайно отобранный и обследованный, возвращается в общую совокупность и м.б. повторно отобран;
2) бесповторный отбор (по схеме невозвращенного шара), когда отобранный элемент не возвращается в общую совокупность.
Мат-кая теория выборочного метода основывается на анализе собственно-случайной выборки.
Обозначим:
- значения признака (случайной величины Х);
N и n - объемы генеральной и выборочной совокупностей;
- число элементов генеральной и выборочной совокупностей со значением признака ;
М и m - число элементов генеральной и выборочной совокупностей, обладающих данным признаком.
Средние арифметические распределения признака в генеральной и выборочной совокупностях называются соответственно генеральной и выборочной средними, а дисперсии этих распределений - генеральной и выборочной дисперсиями. Отношение числа элементов генеральной и выборочной совокупностей, обладающих нек-ым признаком А, к их объемам, называются соответственно генеральной и выборочной долями. Все формулы сведем в таблицу.
Замечание. В случае бесконечной генеральной совокупности (N = ∞) под генеральными средней и дисперсией понимается соответственно математическое ожидание и дисперсияраспределения признака Х (генеральной совокупности), а под генеральной долей р - вероятность данного события.
Важнейшей задачей выборочного метода является оценка параметров (характеристик) генеральной совокупности по данным выборки.
Теоретическую основу применимости выборочного метода составляет закон больших чисел, согласно к-му при неограниченном увеличении объема выборки практически достоверно, что случайные выборочные характеристики как угодно близко приближаются (сходятся по вероятности) к определенным параметрам генеральной совокупности.