- •Основные условные обозначения в математической статистике
- •Содержание
- •Введение
- •Основы теории вероятностей
- •1Предмет и метод математической статистики
- •2Понятие случайного события
- •3Вероятность случайного события
- •4Основные теоремы теории вероятностей
- •4.1Сложение вероятностей
- •4.2Умножение вероятностей
- •4.3Вычисление вероятностей
- •Случайные переменные
- •5Понятие случайной переменной
- •5.1Дискретные случайные переменные
- •5.2Непрерывные случайные переменные
- •6Математическое ожидание и дисперсия
- •7Моменты
- •Дискретные распределения
- •8Биномиальное распределение и измерение вероятностей
- •9Распределение редких событий (Пуассона)
- •Основные модели теоретических распределений
- •10Прямоугольное (равномерное) распределение
- •11Нормальное распределение
- •12Логарифмически нормальное распределение
- •Распределения параметров выборки
- •13.1Проблема Беренса–Фишера
- •15Χ2–распределение
- •Основы математической статистики
- •16Средние величины
- •16.1Общие свойства средних величин
- •17Средняя арифметическая
- •17.1Средний ранг (непараметрическая средняя)
- •17.2Взвешенная средняя арифметическая
- •17.3Средняя квадратическая
- •17.4Мода
- •17.5Медиана
- •18Средняя геометрическая
- •19Средняя гармоническая
- •Разнообразие значений признака
- •20Стандартное (среднеквадратическое) отклонение
- •20.1Число степеней свободы
- •20.2Коэффициент вариации
- •20.3Лимиты и размах
- •20.4Приближенные значения μ и
- •20.5Нормированное отклонение
- •21Проверка выпадов (артефактов)
- •22Средняя и сигма суммарной группы
- •23Скошенность (асимметрия) и крутизна (эксцесс) кривой распределения
- •Графическое представление распределений
- •24Вариационный ряд
- •25Гистограмма и вариационная кривая
- •26Кумулята
- •27Достоверность различия распределений
- •27.1Критерий χ2 (хи квадрат)
- •27.2Критерий λ (лямбда)
- •27.3Критерий по асимметрии и эксцессу
- •Нормальное распределение
- •28Генеральная совокупность и выборка
- •29Репрезентативность
- •30Ошибки репрезентативности и другие ошибки исследований
- •31Доверительные границы
- •Оценка генеральных параметров
- •32Общий порядок оценки
- •32.1Оценка средней арифметической
- •32.2Оценка средней разности
- •32.3Недостоверная и достоверная оценка средней разности
- •32.4Оценка разности генеральных средних
- •33Критерий достоверности разности
- •34Репрезентативность при изучении качественных признаков
- •35Достоверность разности долей
- •Парная корреляция
- •36Коэффициент корреляции
- •37Ошибка коэффициента корреляции
- •37.1Достоверность выборочного коэффициента корреляции
- •37.2Доверительные границы коэффициента корреляции
- •37.3Достоверность разности двух коэффициентов корреляции
- •38Уравнение прямолинейной регрессии
- •39Ошибки элементов уравнения прямолинейной регрессии
- •Частная и множественная линейные корреляции и регрессии
- •40Частный коэффициент корреляции
- •41Множественный коэффициент корреляции
- •42Линейное уравнение множественной регрессии
- •Криволинейная корреляция и регрессия
- •43Корреляционное отношение
- •44Свойства корреляционного отношения
- •45Ошибка репрезентативности корреляционного отношения
- •46Критерий линейности корреляции
- •Однофакторный дисперсионный анализ
- •47Сущность и метод дисперсионного анализа
- •47.1Результативный признак
- •47.2Фактор
- •47.3Градации факторов
- •47.4Градации комплекса
- •47.5Дисперсионный комплекс
- •47.6Статистические влияния
- •47.7Факториальное влияние
- •47.8Случайное влияние
- •47.9Общее влияние
- •48Однофакторный дисперсионный комплекс
- •Многофакторный дисперсионный анализ
- •49Многофакторный дисперсионный комплекс
- •50Преобразования
- •51Универсальное использование дисперсий
- •51.1Показатели силы влияний
- •51.2Ошибка репрезентативности основного показателя силы влияния
- •51.3Предельные значения показателей силы влияния
- •51.4Достоверность влияний
- •Классификация
- •52Дискриминантный анализ
- •52.1Постановка задачи, методы решения, ограничения
- •52.2Предположения и ограничения
- •52.3Алгоритм дискриминантного анализа
- •53Кластерный анализ
- •53.1Методы кластерного анализа
- •53.2Алгоритм кластерного анализа
- •Литература
- •Приложение. Основные формулы и определения
- •2 46019, Г. Гомель, ул. Советская, 104
2Понятие случайного события
Статистическая индукция или статистические заключения, как главная составная часть метода исследования массовых явлений, имеют свои отличительные черты. Статистические заключения делают с численно выраженной определенностью. Теоретической основой для их построения является раздел математики, изучающий закономерности случайных событий и называемый теорией вероятностей. Предпосылка, что результаты статистического наблюдения отобраны в случайном порядке из соответствующих генеральных совокупностей, дает возможность в соответствии с теорией вероятностей оценить степень отклонения результатов наблюдения от соответствующих показателей генеральной совокупности. Таким образом, вероятностная основа вариационной статистики позволяет оценить степень точности получаемых результатов опыта.
Основу изучения природных процессов составляет выявление причинно-следственных связей между явлениями экспериментальным путем.
Осуществив по своему желанию одно или несколько первоначальных явлений (в дальнейшем они называются факторами), экспериментатор получает возможность изучать появляющиеся явления-следствия. Иногда в процессе эксперимента удается сделать случайное открытие, т. е. обнаружить явление-следствие, о котором ранее ничего не было известно. Но, как правило, экспериментатор заранее намечает явления-следствия, появление которых он ожидает. При этом самое сложное явление можно разбить на частные, мелкие явления, относительно которых остается выяснить: произошли они или не произошли.
Например, обрабатывая семена на всхожесть определенным препаратом, экспериментатор мог поставить задачу оценить эффект различных его доз. В качестве эффекта могло быть принято число всхожих и невсхожих семян. Измеряя массу какого-либо вещества, в качестве отдельных частных явлений можно рассматривать всевозможные априорные значения этой массы. Задача экспериментатора, таким образом, сводится к наблюдению того, какие из значений массы осуществились.
Явления, рассматриваемые с той точки зрения, осуществились они или не осуществились, называются событиями. Применительно к событиям ставится основная задача: предсказать, появится ли изучаемое событие при осуществлении некоторого наперед заданного комплекса факторов (явлений-причин). Событие, которое при заданном комплексе факторов обязательно произойдет, называется достоверным. Событие, которое при заданном комплексе факторов не может произойти, называется невозможным событием. Суждения о достоверности или невозможности некоторого события являются категорическими суждениями. Такие суждения принято, считать окончательным результатом исследования. Отсюда возникает интерес к обратной задаче: указать комплексы факторов, при которых о заданном событии можно сделать категорические суждения.
Однако каждое событие – результат действия многих факторов, часть из которых иногда нельзя предсказать или организовать в опыте. В этом случае категорическое суждение о событии невозможно. Получается ситуация: заданные факторы благоприятствуют событию, и, следовательно, оно может произойти. С другой стороны, действия этих факторов недостаточно, чтобы гарантировать появление события, и, значит, оно может и не произойти.
Событие, которое при заданном комплексе факторов может либо произойти, либо не произойти, называется случайным событием. Случайные события связаны с действием не вошедших в организованный комплекс факторов, называемых случайными факторами в отличие от другой группы факторов, включаемых в комплекс и называемых основными, или неслучайными.
Предположим, исследуется урожайность культур. Такие факторы, как технология возделывания, внесение различных доз удобрений и т.д. можно организовать в опыте, т. е. учесть. Эти факторы являются основными. Другая группа факторов является неизвестной, или не поддающейся учету. Эти факторы при статистическом анализе получили название случайных.
Для того чтобы выяснить, произойдет или не произойдет событие при заданном комплексе факторов, нужно осуществить этот комплекс, т. е. провести испытание. Испытанием является любой эксперимент, в результате которого производят наблюдения.
Предсказать результат единичного испытания можно только для достоверных или невозможных событий. Случайность же события не видна из единичного испытания. Любое случайное событие по единичному испытанию было бы оценено как достоверное, если оно произошло, и как невозможное – если не произошло. Такие оценки, однако, были бы сами случайными, как и результат единичного испытания. Теория оценки случайных событий строится на большом числе испытаний, т. е. для массовых событий.
Важным условием при этом является неизменность комплекса основных факторов. События, происходящие при одном и том же комплексе факторов, называются однородными. Установлено, что однородные случайные события в большой их массе подчиняются некоторым закономерностям. Эти закономерности получили название вероятностных.
Характер вероятностных закономерностей можно уяснить на следующих примерах.
Предположим, мы подбрасываем монету. При этом событием будем считать выпадение герба. Никто не может предсказать определенно, произойдет или не произойдет событие при одном подбрасывании: одинаково возможно как его наступление, так и ненаступление.
События с одинаковыми возможностями осуществления называются равновозможными. Так, при симметричной монете выпадение герба и цифры – равновозможны.
Однако, если бы было произведено, например, 1000 бросаний, и из них 600 раз выпал герб, то для следующей серии испытаний можно было бы предсказывать, что герб появится в 60% случаев. Причем такое отклонение от ожидаемых 600 появлений герба из 1000 бросаний можно было бы считать связанным с несимметричностью монеты.
Установленное в результате опыта отношение числа появления события к общему числу всех испытаний называется частотой события. В указанном примере с монетой частота выпадения герба равна 0,6.
Из примера можно заключить, что частота события, выступающая как некоторая статистическая закономерность, связана с внутренними характеристиками события. Частота является мерой этих внутренних характеристик события. Она тем надежнее, чем большее число испытаний было произведено. При очень большом числе испытаний частота почти перестает изменяться, приближаясь к некоторой величине. Эту величину и можно принять за интересующую нас числовую характеристику.