Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебник Математики и информатики.doc
Скачиваний:
79
Добавлен:
03.05.2019
Размер:
24.89 Mб
Скачать

6. Формула Бернулли

Предположим, что проводится опыт с двумя исходами («успех», «неудача») n раз. Испытания идут независимо друг от друга.

Р(1) = р, Р(2) = q, р+q = 1.

Требуется определить вероятность того, что «успех» появится k-раз, при n-испытаниях Рn(ξ = k). ξ – число успехов.

      1. пусть n=2

 = {(1,1), (1,0), (0,1), (0,0)}.

    вес точек

р² рq qp q²

р² + рq + qp + q² = (p + q)² = 1²= 1.

Р2(ξ=0) = q², Р2(ξ=1) = 2рq, Р2(ξ=2) = р².

      1. пусть n=3

 = {(1,1,1), (1,1,0), (1,0,1), (0,1,1), (1,0,0), (0,1,0), (0,0,1), (0,0,0)}.

       

р³ р²q p²q p²q pq² pq² pq² q³

р³ + 3р²q + 3pq²+ q³ = (p + q) ³ = 1³ = 1.

Р3(ξ=0) = q³, Р3(ξ=1) = 3рq², Р3(ξ=2) = 3р²q, Р3(ξ=3) = р³.

k k (n-k)

Рn(ξ = k) = Cn. p q

Формула Бернулли

n

Замечания: 1) Вероятность Рn(ξ=n) = p .

n

2) Вероятность Рn(ξ=0) = q .

k2 i i (n-i)

3) Вероятность Рn(k1  ξ  k2) = Cn. p q .

i=k1

4)Пусть А – появление успеха, хотя бы один раз при n – испытаниях. Тогда

n

Р(А) = 1 – q

Пример: n=6, k=3.

p = q = ½.

3 3 3 6 5 4 6

Р6(ξ=3) = C6 (½) (½) = (½) = 5/16.

1 2 3

3 6 4 6 5 6 6

Р(А) = C6 (½) + C6 (½) + C6 (½) + (½) = 0,3125 + 0,234375 + 0,09375 + 0,015625 = 0,65625.

§ 3.5. Математический аппарат регрессионного и корреляционного анализа

Любой закон природы или общественного развития может быть выражен в конечном счете в виде описания характера или струк­туры взаимосвязей (зависимостей), существующих между изу­чаемыми -явлениями или показателями (переменными величи­нами или просто переменными). Если эти зависимости: а) стохастичны по своей природе, т. е. позволяют устанавливать лишь вероятностные логические соотношения между изучае­мыми событиями А и В, а именно соотношения типа «из факта осуществления события А следует, что событие В должно произойти, но не обязательно, а лишь с некоторой (как пра­вило, близкой к единице) вероятностью Р»; б) выявляются на основании статистического наблюдения за анализируемыми событиями или переменными, осуществляемого по выборке из интересующей нас генеральной совокупности, то мы оказываемся в рамках проблемы статистического ис­следования зависимостей. Соответствующий математический аппарат, будучи, таким образом, нацеленным в первую очередь на решение основной проблемы естествознания: как по отдель­ным, частным наблюдениям выявить и описать интересующую нас общую закономерность? — занимает, бесспорно, централь­ное место во всем прикладном математическом анализе.

Перед тем как перейти к формулировке общей и частных задач статистического исследования зависимостей, условим­ся описывать функционирование изучаемого реального объек­та (системы, процесса, явления) набором переменных (рис. 3.11), среди которых:

х'(1), х(2), ..., х(р) — так называемые «входные» переменные, описывающие условия функционирования (часть из них, как правило, поддается регулированию или частичному управле­нию); в соответствующих математических моделях их назы­вают независимыми, факторами-аргументами, экзогенными, предикторными (или просто предикторами, т. е. предсказателя­ми), объясняющими;

y(1), y(2), ..., y(m) выходные переменные, характеризующие поведение или результат, (эффективность) функционирования, в математических моделях их называют зависи­мыми, откликами, эндогенными, результирующими или объяс­няемыми;

ε(1), ε(2), ..., ε(m) — латентные (т. е. скрытые, не под­дающиеся непосредственному измерению) случайные достаточ­ные» компоненты, отражающие влияние (соответственно на y(1), y(2), ..., y(m) неучтенных «на входе» факторов, а также случайные ошибки в измерении анализируемых показателей (в математических .моделях их, как правило, именуют просто «остатками»).

х'(1), х(2), ..., х(р) «входные» переменные, описывающие условия функционирования

Анализируемая реальная система

y(1), y(2), ..., y(m) выходные зависимые переменные характеризующие результат

(эффективность) функционирования.

ε(1), ε(2), ..., ε(m) латентные (т. е. скрытые, не под­дающиеся непосредственному измерению) случайные достаточ­ные компоненты, отражающие влияние на y(1), y(2), ..., y(m) неучтенных «на входе» факторов

Рис. 3.11. Общая схема взаимодействия переменных при статистическом исследовании зависимостей

Таким образом, аппарат статистического исследования зависимостей — со­ставная часть многомерного статистического анализа — наце­лен на решение основной проблемы естествознания: как на основании частных результатов статистического наблюдения за анализируемыми событиями или показателями выявить и описать существующие между ними стохастические взаимосвязи.

Анализируемые переменные величины по своей роли в ис­следовании подразделяются на результирующие (прогнози­руемые) Y и объясняющие (предсказывающие, или предикторные) X. Среди компонент векторов Y и X могут быть и коли­чественные, и порядковые (ординальные), и классификацион­ные (номинальные). Центральным математическим объектом в процессе стати­стического исследования зависимостей является функция f (X), называемая функцией регрессии Y по X и описываю­щая, как правило, изменение условного среднего значения Ycр (X) результирующего показателя Y (вычисленного при фиксированных на уровне X значениях объясняющих пере­менных) в зависимости от изменения значений объясняющих переменных X. Конечные прикладные цели статистического исследования зависимостей: могут быть в основном трех типов:

  1. Установ­ление самого факта наличия (или отсутствия) статистически значимой связи между Y и X, исследование структуры этих связей.

  2. Прогноз (восстановление) неизвестных значений индивидуальных или средних значений результирующего показателя по заданным значениям соответствующих объясняющих (предикторных) переменных.

  3. Выявление причинных связей между объясняющими переменными X и резуль­тирующими показателями Y, частичное управление значениями путем регулирования величин объясняющих перемен­ных X.

По своей природе исследуемые зависимости могут быть разделены на:

1)детерминированные (тип А), когда исследу­ется функциональная зависимость между неслучайными пере­менными;

2)регрессионные (тип В), когда исследуется за­висимость случайного результирующего показателя от не­случайных объясняющих переменных параметров систе­мы;

3) корреляционные (тип С), когда исследуется зависимость между случайными переменными, причем объясняющие пе­ременные могут быть измерены без искажений;

4) конфлюэнтные (типы D1, и D2), когда исследуется функциональная зависимость между случайными или неслучайными переменны­ми в ситуации, когда те и другие могут быть измерены только с некоторой случайной ошибкой.

Весь процесс статистического исследования зависимостей может быть разбит на семь последовательно реализуемых ос­новных этапов: этап 1 (постановочный); этап 2 (информацион­ный); этап 3 (корреляционный анализ); этап 4 (определение класса допустимых решений); этап 5 (анализ мультиколлинарности предсказывающих переменных и отбор наиболее информативных из них); этап 6 (вычисление оценок неизвестных параметров, входящих в исследуемое уравнение статистиче­ской связи); этап 7 (анализ точности полученных уравнений связи).

К основным типовым задачам практики, в которых исполь­зование аппарата статистического исследования зависимостей оказывается наиболее уместным и эффективным, следует от­нести задачи: 1) нормирования; 2) прогноза, планирования и диагностики; 3) оценки труднодоступных (для непосредст­венного наблюдения и измерения) характеристик исследуемой системы; 4) оценки эффективности функционирования (или качества) анализируемой системы; 5) регулирования пара­метров функционирования анализируемой системы. Все эти задачи являются основными составными частями центральной проблемы кибернетики — проблемы «управления, связи и пе­реработки информации».