Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистические методы в психологии.doc
Скачиваний:
515
Добавлен:
14.04.2015
Размер:
2.29 Mб
Скачать

2. Вероятностный формализм описательной статистики. Случайность и вероятность. Событие. Вероятность событий.

Теория вероятностей– математический фундамент современной статистики. Известен целый ряд умозрительных опытов и задач, а также их экспериментальные аналоги, которые приводят к классическим вероятностным схемам. Таковыми являются подбрасывание однородной симметричной монеты, игральной кости, карточные игры, игры с урнами, содержащими различные объекты. В результате решения этих задач были заложены формальные основы теории вероятности, которые кратко обсуждаются ниже.

Случайное событие и вероятность.В статистических исследованиях фигурируют сложные природные, технологические или социальные механизмы, результаты проявления которых невозможно достоверно предсказать. В качестве примера можно представить многоэтапный технологический процесс производства некоего продукта. Поэтому статистика, как и теория вероятностей, рассматривает изучаемые явления как случайные. В экспериментах случайные явления представлены случайными событиями. Для примера с производством продукта сформулировать статистический эксперимент по оценке качества производственного процесса. Тогда в качестве случайного события может, например, выступать появление в контрольной партии продукции некоторого количества дефектных изделий. Чтобы адекватно описать исследуемое случайное явление, необходимо сопоставить представляющему его случайному событию некую количественную меру, которая отражала бы частоту появления этого события (например, как часто в партии из 100 изделий встречается 5 дефектных). Такая мера в теории получила названиевероятностии понимается как некая функция пространства элементарных случайных событий. Это положительное вещественное число в интервале от 0 до 1. Вероятность невозможного события считается равной 0, вероятность достоверного события – 1.

Случайная величина и ее описание.При проведении экспериментов случайные события, как правило, формально соотносят с некоторой величиной, которую принято называтьслучайной. В зависимости от природы исследуемого явления соответствующие случайные величины могут бытьдискретными(например, количество дефектных изделий в партии) илинепрерывными(как значение артериального давления). Исчерпывающее описание случайной величины дает еефункция распределения. Функция распределения для некоторого конкретного значенияопределяется вероятностью того события, что случайная величинапримет значение, меньшее этого конкретного:

Рис. 1. Функция распределения случайной величины.

Функция распределения – положительная неубывающая функция, принимающая значения от 0 до 1 (рис.1). Для дискретных случайных величин можно указать вероятность появления конкретного значения. Для непрерывных случайных величин такого рода описанием является первая производная функции распределения, которая получила названиеплотности вероятностизначений случайной величины(иногда ее называют просто распределением случайной величины):

Чтобы понять смысл плотности вероятности, можно воспользоваться аналогией с массой и плотностью тела, представив в качестве массы тела функцию распределения, объема тела – интервал значений случайной величины, плотности тела – плотность вероятности. Это положительная функция, площадь под кривой которой относительно оси значений случайной величины равна единице (рис. 2). Таким образом, случайную величину полностью характеризуют ее функция распределения (для дискретных и непрерывных величин) или плотность вероятности (для непрерывных величин).

Рис. 2. Плотность вероятности случайной величины.

Для более компактного (частичного) описания случайной величины служат числовые характеристики (или статистики) случайных величин. Важнейшие из них – среднее значениеидисперсия ,или жесреднеквадратичное(стандартное)отклонение , равное корню квадратному из дисперсии. Среднее значение – это некоторое центральное значение случайной величины, которое определяет положение кривой плотности вероятности вдоль осизначений случайной величины. В частности, при увеличении среднего значениякривая плотности вероятности сдвигается вправо (рис.3). Среднеквадратичное отклонение характеризует разброс основной массы значений случайной величины относительно среднего. При увеличении дисперсии (или среднеквадратичного отклонения ) кривая плотности вероятности «размазывается» вдоль осизначений случайной величины (рис. 3).

Рис. 3. Изменение кривой плотности вероятности при увеличении среднего и дисперсии.

Результаты наблюдений трактуются как реализациисоответствующейслучайной величины. Все возможные (реально или умозрительно) реализации случайной величины составляют ее т.н.генеральную совокупность (популяцию). Генеральная совокупность редко наблюдаема в опыте главным образом по причине ограниченности ресурсов (времени, стоимости обследования, емкости устройств хранения информации и т.п.).

Статистический опыт (эксперимент).Совокупность наблюдений с точки зрения практической статистики есть данные. Известно, что с классическими функциями можно производить арифметические действия как с функциями. С вероятностями как с функциями также можно оперировать, и в теории вероятности формализованы законы сложения и умножения вероятностей. Эти формализации, в свою очередь, являются основой статистических вычислений. Получение конкретной реализации случайной величины называется статистическим опытом. При многократном повторении опыта – получении множества реализаций – предполагается (но зачастую явно не оговаривается) неизменность условий опыта. Абсолютную неизменность условий любого опыта, понятно, нельзя обеспечить, поэтому на практике речь идет лишь об обеспечении относительно стабильных условий. Обеспечение стабильности условий эксперимента в значительной степени искусство. Выполнение требований стабильности опыта – предмет методологии сбора данных. Чаще, статистик призван обрабатывать уже кем-то собранные данные. Необходимо, однако, учитывать возможность того, что данные были получены в условиях непостоянства условий опыта; для последующей обработки и анализа таких данных следует использовать адекватные методы.

Центральная предельная теорема.Наиболее распространенной вероятностной моделью в статистике является нормальная (гауссова) модель. К ней сводится большое количество практических задач теории вероятности и математической статистики. Генеральной совокупностью данной модели является множество исходов статистического опыта, отражающего аддитивное взаимодействие большого количества независимых случайных явлений (процессов).

Данная вероятностная модель относится к классу т.н. параметрических моделей, т.е. моделей, аналитический вид которых однозначно задается с помощью конечного числа параметров. В гауссовом случае параметрами модели являются математическое ожиданиеμ(среднее значение генеральной совокупности) и дисперсия – мера разброса значений случайной величины относительно математического ожидания.

Распространенность гауссовой модели объясняется фундаментальным свойством природы, характеризующим распределение вероятности суммы большого числа независимых случайных явлений (процессов). Это свойство, формулируемое как центральная предельная теорема, проявляется в том, что, суммаnодинаково распределенных случайных величин, стремится к нормальному (гауссову) распределению при бесконечном увеличенииn. (На практике оказывается достаточным эффект аддитивного взаимодействия порядкаn=30 независимых случайных величин.)

Наряду с параметрическими, в статистике используются также непараметрические модели. В непараметрических моделях закон распределения вероятностей генеральной совокупности полагается неизвестным.