Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

шпоры математика

.docx
Скачиваний:
3
Добавлен:
06.07.2018
Размер:
379.96 Кб
Скачать

36. Генеральная и выборочная совокупности. Способы отбора. Вся подлежащая изучению совокупность предметов называется генеральной совокупностью. В статистике различают два вида наблюдений: сплошное, когда изучаются все объекты совокупности и несплошное (выборочное), когда изучается только часть объектов.Та часть объектов, которая отобрана для непосредственного изучения из генер. совокупности, называется выборочной совокупностью или выборкой. Кол-во объектов генер. или выбор. совокуп-ти называют объемом. Сплошное набл. применяют когда объем генер. совок. небольшой. Результаты исследования некот. признака генер. совок-ти будут более достоверными, если выборка образовано случайно (элементы берутся наугад и каждый из них может быть отобран с одинаковой вероятностью. Бесповторная выборка – из генер. совок-ти элементы извлекаются и не возвращаются обратно. Если после извлечения элементов из совок-ти они фиксируются и возвращаются обратно – повторный отбор.

37. Постр-е дискретного вар. ряда. Эмпир. функция распр-я и ее св-ва. Пусть из генер. совок. извлечена выборка v, причем значения раз.. Тогда наблюдаемые случ. значения xi наз. вариантами, mi – частотами. - относ. частотами. А последов-ть вариант (xi),запис. в возрастающем порядке, наз. вариац. рядом. Стат. распред-ем наз. перечень вариант и соотв. им частот, или относит. частот. Стат. распред. можно изобр. графически. Для этого на Ох наносят xi, а на Оу – частоты mi. Соединив точки частот, получим ломаную, кот. наз-ся полигоном распред-я. В завис-ти от того, какие знач. принимает признак стат. распред., вариац. ряды дел. на Дискретные (варианты приним. конкр. значения) и Интервальные (варианты изменяются непрерывно в некот.интервале). Эмпир.функция распр-я.Пусть известно стат. распр-е колич. признака А; nx – число наблюдений, при кот-х наблюдалось знач-е признака, меньшее x , т.е. А< x; n – общее число наблюдений (объём выборки). Тогда относ. частота события А< x есть nx/n. При изм-и x меняется и nx/n, т.е. относительная част. nx/n является функцией x . Так как эта функция находится эмпир. (т.е. опытным) путём, то её наз. эмпирической. Эмпир. функцией распр-я (функцией распр-я выборки) наз. функция опред. для каждого знач-я xR относ. частоту события Аx. В этой ф-ле nx – число вариант, меньших x, поэтому для расчетов удобна ф-ла вида .

38. Построение интерв. вариац. ряда. Гистограмма частот и относ. частот. При большом объеме выборки ее элементы объед. в группы (разряды, интервалы), представляя р-ты опытов в виде интерв. стат. ряда. Для этого весь диапазон значений СВ (от xmin до xmax ) разбивают на k интервалов одинак. длины h (обычно k меняется от 5 до 20). Число интервалов рекомендуют брать согласно формуле Стерджеса k 13,93ln n Затем подсчит. частоты ni (или относит. частоты i ) знач-й выборки, попавших в выдел. интервалы. Величина ni/h наз. плотностью частоты, а i/h – плотностью относ. частоты. Пусть xi* – середина i -го интервала, ni – число эл-тов выборки, попавших в i -й интервал. Таким образом, получим группиров. стат. ряд, в верхней строке которого записаны середины соотв. интервалов xi*: xix1x2…xkni n1 n2 … nk.

Для граф. представления интерв. стат. распределений принято использовать гистограмму относ. частот. Гистограммой относ. частот интервального стат. ряда наз. ступенчатая фигура, составл. из прямоугольников, постр. на интервалах группировки длины h и высоты i/h так, что площадь каждого прямоугольника равна относительной частоте i.Для построения гистограммы относительных частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки длиной i/h параллельно оси ординат. Очевидно, площадь i -го частичного прямоугольника равна i – относительной частоте вариант, попавших в i -ый интервал. Следовательно, площадь гистограммы относительных частот равна сумме всех относительных частот (т.е. равна 1), а площадь гистограммы частот равна объему выборки n .

39. Выборочная средняя, выборочная дисперсия и их свойства Выборочная средняя. Пусть для изучения генеральной совокупности относительно количественного признака Х извлечена выборка объема n. Выборочной средней называют среднее арифметическое значение признака выборочной совокупности. Если все значения признака выборки различны, то если же все значения имеют частоты n1, n2,…,nk, то Выборочная средняя является несмещенной и состоятельной  оценкой генеральной средней. Замечание: Если выборка представлена интервальным вариационным рядом, то за xi принимают середины частичных интервалов. Выборочная дисперсия. Для того, чтобы наблюдать рассеяние количественного признака значений выборки вокруг своего среднего значения, вводят сводную характеристику- выборочную дисперсию. Выборочной дисперсией называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения . Если все значения признака выборки различны, то  если же все значения имеют частоты n1, n2,…,nk, то

ух ух=ах+в

ах+в ухi

х

41. Интервальные оценки числовых характеристик случайной величины. Доверительная вероятность. Доверительный интервал. Пусть сделана выборка объема n. Для оценки распределения СВ Х генеральной совокупности применяются точечные оценки параметров распределения генеральной совокупности и интервальные оценки. Интервальной оценкой (доверительным интервалом) для оценки некоторого параметра  (тэта), например МО, называется угловой интервал, в котором с заранее заданной вероятностью Р=1- содержится оцениваемый параметр. Опр.: Доверительным интервалом для оценки параметра  назыв. интервал для которого . Вероятность Р=1- - называется доверительной вероятностью.

Выбор доверительной вероятности Р=1- производится исходя из конкретных условий задачи.

42. Основные понятия регрессионного и корреляционного анализа. Функцион. зависимость м-ду величинами X и Y - каждому значению одной переменной соответствует вполне опред. значение другой. Статистической наз.т зависимость, при которой изменение одной из величин влечет изменение распределения другой. Статистическая зависимость проявляется в том, что при изменении одной из величин изменяется среднее значение другой. Корреляционной (или регрессионной) зависимостью между двумя переменными величинами называется функциональная зависимость между значениями одной из них и условным математическим ожиданием другой. Условное мат. ожидание Mx (Y) СВ Y есть функция от x : Mx (Y) f (x) , которую называют функцией регрессии Y на X . Корреляц. зависимостью Y от X называется функц. зависимость условной средней x от x . Уравнение y f xназ. уравн-ем регрессии Y на X . Функция f xназ. регрессией Y на X , а ее график – линией регрессии СВ Y на СВ X . Осн. задачи теории корреляции: 1. Установл. формы корреляционной связи; 2. Оценка тесноты корреляционной связи Y от X , кот. оценивается величиной рассеяния значений Y около Yx. Большое рассеяние означает слабую зависимость Y от X либо вообще отсутствие таковой. Малое рассеяние указывает на существование достаточно сильной зависимости Y от X . Важной с точки зрения приложений является ситуация, когда обе функции регрессии f (x),yявляются линейными. Тогда говорят, что СВ X и Y связаны линейной корреляц. зав-стью (линейной корреляцией).

40. Точечное оцен-е числ. хар-к СВ. Состоят-сть, эффективность, несмещенность оценки. Исправл. выбор. дисперсия. Точ. оценкой хар-ки θ наз. некот. ф-цию  р-тов наблюд-й, знач-я кот-ой близки к неизв. хар-ке θ генер. совок-сти. Для постр-я оценки нужны критерии.1. Оценка  наз. несмещ., если её мат. ожид-е равно оцениваемой хар-ке СВ: ,  (1.1) т. е. если она не дает системат. ошибки. 2. Оценка наз. состоят., если при увел-и числа набл-й оценка сходится по вероятности к искомой вел-не, т. е. для любого сколь угодно малого   . (1.2) Состоят-сть означ., что оценка, постр. по большому числу наблюд-й, имеет меньший разброс (дисперсию), т. е. . Желательно иметь оценки, кот-е имеют наим. дисперсию среди всех оценок, постр. по n набл-ям. Такие оценки наз. эффективн.. Точечная оценка мат. ожидания.  Задана СВ Х: х1, х2, …, хn, так как М(Х) не найти, то для мат. ожид-я СВ Х естественно предложить ср. ариф-кое      (1.3) её наблюд. значений.1. По методу произведений ,т. к. . Это и означ., что оценка  несмещ.. 2. Если исслед. СВ Х имеет конечную дисперсию, то эта оценка будет состоят., т. к.. Если иссл. в-на имеет норм. закон распр-я, то можно показать, что предл. оценка эффективна, т. е. оценки для мат. ожид-я с меньшей дисперсией не сущ. для нормально распр. вел-н. Точечная оценка для дисперсии.  Т к. дисп-я опр-ся через мат. ожид-е, а для него оценка уже выбрана, то для Д естественно предложить оценку:  или ; (1.4),(1.5) что соотв. записи Д в виде .Оказ-ся, что предл. оценка Д (1.4) состоятельна и (1.5) не явл. несмещ.. Для получ-я несмещ. оценки введем поправку и получ. оценку обозн. через S2:или .- исправл. выбор. Д.

43.Нахождение параметров линейного уравнения регрессии методом наименьших квадратов. Составив таблицу зависимости ух(сверху черточка) от х построим точки с координатами (хi,yxi). По расположение точек и исходя из существа величин х,у выбираем вид уравнения регрессии: прямая линия или параболическая зависимость или показательная и т.д. Пусть выбрана для представления уравнения регрессии прямая линия, т.е. корреляционная зависимость линейная.

Ищем уравнение прямой линии регрессии в виде ух=ах+в. Чтобы прямая проходила как можно ближе к точкам выбираем следующее условие: Сумма квадратов разностей между экспериментальными ординатами yi и теоретическими аxi+в должна быть наименьшей. В этом суть метода наименьших квадратов. При этом помним, что хi yxi (c черточкой над у) известные нам числа. Неизвестными явл. а и в.

44. Коэффициент линейной корреляции и его свойства. - корреляционный момент (ковариация), где K(X ,Y ) M{[X M(X )][Y M(Y)]} Две случайные величины X и Y называются коррелированными, если их коэф-т корреляции отличен от нуля. СВ X и Y называются некоррелированными, если их корреляционный момент равен нулю. выборочный коэф. коррел. Свойства коэф-та корреляции: 1. Коэф-т корреляции принимает значения на отрезке [1;1], т.е. 1 1 в 1r 1; 2.Если все значения переменных увеличить (уменьшить) на одно и то же число или в одно и то же число раз, то величина выборочного коэф-та корреляции не изменится. 3.При 1 r = ±1 корреляц. связь представл. линейную функц. зависимость. При этом линии регрессии Y на X и X на Y совпадают, все наблюдаемые значения располагаются на общей прямой. 4.Если с ростом значений одной СВ значения второй возрастают, то 0 в r > , если убывают, то 0 в r < . 5.При 0 в r = линейная корреляц. связь отсутствует, групповые средние переменных совпадают с их общими средними, а линии регрессии Y на X и X на Y параллельны осям координат. Выборочный коэф-т корреляции r является оценкой генерального коэф-та корреляции

45. Стат. гипотеза. Стат. критерий проверки гипотез. Ошибки 1 и 2 рода. Критич. область. Стат. гипотеза – любое предпол. относит. генер. сов-ти, кот. проверяется путем анализа данных выборки. Выдвинутую гипотезу наз. основной или нулевой Но. наряду с Но рассм. противоречащую ей гипотезу Н1, кот. наз-ся альтернативной или конкурирующей. Выдвинутая гипотеза должна быть проверена стат. методами. По итогам проверки гипотеза либо принимается, либо отклоняется. При этом могут быть допущены ошибки 2 родов: ошибки 1 рода сост. в том, что будет принята гипотеза Н1, в то время как верной явл. гипотеза Но. Вер-ть ошибки 1 рода обозн. и ее наз. уровнем . Ошибка 2 рода сост. в том, что будет принята гипотеза Но, в то время как верной явл. гипотеза Н1. Вероятность ош. 2 рода обозн. . Стат. критерием наз. СВ К, кот. служит для проверки нулевой гипотезы. Множ-во всех возм. значений критерия К разбивается на 2 непересек. подмнож-ва – критич. область (мн-во значений критерия, при кот. нулевую гипотезу отвергают) и обл. принятия гипотезы (мн-во значений критерия, при кот. нулевую принимают). По данным выб-ки выч-ся значение К наблюдаемое, кот. наз. наблюдаемым знач-ем. Правило проверки стат. гипот.:если значение К набл. попадает в обл. принятия, то Но приним-ся; если значен. К набл. попадает в критич. обл., то гип. Но отверг-ся. Мощностью критерия наз. вер-ть того, что будет принята конкурир. гипотеза Н1 если она явл. верной. Если - вер-ть ошибки 2 рода, то мощн-ть критерия = 1-

46. Проверка гипотезы о математическом ожидании нормально распределенной случайной величины. Пусть имеется нормально распр. СВ ,, опред. на мн-стве объектов некот. генер.сов-сти. Известно, что D =  2. Мат. ожидание M неизвестно. Допустим, что M = a, где a – некот. число. Будем считать также, что имеется другая информация, что M = a1, где a1 > a. I. Выдвиг. нулевую гипотезу H0: M = a при конкур. гипотезе H1: M = a1. Делаем выборку объема n: x1, x2,..., xn . В основе проверки лежит тот факт, что случ. вел-на (выбор. средняя) распр-на по норм. закону с дисперсией  2/n и мат.ож-ем, равным a в случае справ-сти H0, и равным a1 в случае справ-сти H1.Очевидно, что если вел-на оказ. достаточно малой, то это дает основ-е предпочесть г-зу H0 г-зе H1. При дост-но большом знач-и более вероятна справ-сть гипотезы H1. В кач. стат. критерия выбир. СВ. Z = (x с чертой – а)*(корень из n)/(ср. кв. откл-е), распр. по норм. закону, причем Mz = 0 и Dz = 1 в случае справ-сти гипотезы H0. Если справедл. гипотеза H1, то Mz = a* = ( a1a )/, Dz = 1.Если вел-на , получ. из вы­бор. данных, относ-но велика, то и вел-на z велика, что явл. свид-вом в пользу г-зы H1. Относ-но малые знач-я приводят к малым знач-ям z, что свид-вует в пользу г-зы H0. Отсюда следует, что д. б. выбрана правостор. крит. область. По принятому уровню знач-сти (напр., = 0,05), используя то, что СВ z распр-на по норм. закону, опр. знач-е Kкр из ф-лы  = P(Kкр < z <) = () – (Kкр) = 0,5 – (Kкр).Отсюда Ф(Ккр)=(1-2альфа)/2. Если в-на z, получ. при выбор. знач-и , попад. в область принятия г-зы (z < Kкр), то г-за H0 приним. Если в-на z попад. в крит. область, то г-за H0 отверг. II. Если в предыд. задаче поставить др. условие: H0: M = a; H1: M = a1 , a1 < a, то здесь придется рассм. левостор. крит. область. Здесь a* = ( a1 – a )/, а вел-на Kкр опр. из ф-лы  = P(– <z< Kкр) = ( Kкр) – (–) = ( Kкр) + 1/2.Используя формулу –( Kкр) = ( –Kкр), получаем: ( –Kкр)=(1-2альфа)/2. Знач-я z, вычисл. по выбор. данным, превыш. Kкр, согласуются с г-зой H0. Если в-на z попад. в крит. область (z < Kкр), то г-зу H0 следует отвергнуть, считая предпочт. г-зу H1.III. Рассмотрим теперь такую задачу: H0: M = a; H1: M  a. В данном случае следует рассм. двустор. крит. область. Крит. знач-е Kкр опр-ся с пом. соотн-я P(–Kкр < z < Kкр) = 1 – = ( Kкр) – ( – Kкр) = 2( Kкр) .Из этого соотн-я следует: ( Kкр) = )=(1-альфа)/2.

47. Проверка гипотезы о равенстве математических ожиданий двух нормально распределенных случайных величин. Предполож., что имеются случ. выборки х1, х2, ..., хп и y1y2, ..., ym знач-й двух независ. нормально распред. СВ  и  и требуется проверить гипотезу  о рав-ве мат. ожиданий этих СВ. (а) Если известно, что дисперсии случайных величин  и  равны,  (значение  неизвестно), то можно получить след. объедин.несмещ. оценку для В этом сл. s2/n и s2/m будут несмещ. оценками для дисперсии выборочных средних  и, а сумма s2/n+s2/m – несмещ. оценкой для дисперсии разности средних . Соотв-но, статистика как можно показать, будет иметь t-распред-е с n+m-2 степенями свободы. Крит. область уровня  для проверки гипотезы  против двустор. альтернативы  будет состоять из двух бесконечных полуинтервалов  и , против одностор. альтернативы  - из полуинтервала  и против альтернативы  - из полуинт-ла , где  обознач. соотв. квантили t-распред-я с n+m-2 степенями свободы.

(б) Если нет оснований считать, что дисперсии СВ  и   равны, то для каждой из дисперсий  и  вычисл. своя оценкаи соотв-нно модифиц. статистика критериякоторая, как можно показать, имеет t-распред-е с числом степеней свободы, равным целой части от 1/k, где k выражается след. формулой

48. Критерий согласия Пирсона о предполагаемом законе распределения случайной величины. 1.) Исходя из теоретического (предполагаемого закона распределения), находим вероятности р­i попадания СВ в каждый из заданных интервалов таблицы, например в случае нормального распределения .

2.) Вычисляем значение 2 соответствующее опытным данным по формуле:

3.) По табл. критических точек 2, учитывая число степеней свободы k=m-r-1, где m – число интервалов, r – число оцениваемых параметров в распределении (для нормального распределения r=2) – находим по таблице 2крит.

4.) Если 2вычисленное<2крит., то гипотеза о нормальном распределении принимается. Если же 2вычисленное>2крит., гипотеза отвергается.

Замечание: При нахождении 2крит. учитывается уровень значимости критерия, который обозначается (q). Уровень значимости критерия для технических задач обычно принимается =0,05. Он означает вероятность того, что событие не наступит при данных условиях.

49. Критерий согласия Колмогорова о предполагаемом законе распределения случайной величины. 1.) По результатам n – независимых опытов найти эмпирическую функцию распределения: F*(x)

2.) Определить максимум модуля: |F*(x)-F(x)| во всех точках.

3.) Вычислить выборочную статистику .

4.) Сравниваем значения выборочн. с критическим значением , определенным по табл. 5.) Если выборочн<крит. – гипотеза принимается, если выборочн>крит. – гипотеза отвергается.

50. Основные понятия дисперсионного анализа. Однофакторный и двухфакторный дисперсионный анализ Дисперсионный анализ примен.для исслед-я влияния 1 или неск.кач. переменных на 1 завис.колич.пер-ную . В основе дисперс. анализа лежит предпол-е о том, что одни переменные могут рассматриваться как причины (независ. переменные): , а другие как следствия (завис.переменные). Независ. переменные наз. иногда регулир. ф-рами именно потому, что в эксперименте иссл-ль имеет возм-сть варьировать ими и анализ-ть получающийся рез-т.Осн. целью дисперс. анализа явл. исслед-е значимости различия между средними с пом. сравнения (анализа) дисперсий. Раздел-е общей дисперсии на несколько источников, позволяет сравнить дисперсию, вызванную различием между группами, с дисперсией, вызванной внутригрупп. изменчивостью. При истинности нулевой гипотезы (о равенстве средних в неск. группах наблюдений, выбранных из генер. совок-сти), оценка дисперсии, связанной с внутригруп. изменчивостью, д. б. близкой к оценке межгрупп. дисперсии. Сущность дисп. анализа закл. в расчленении общей дисперсии изуч. признака на отд. компоненты, обусловл. влиянием конкр. ф-ров, и проверке гипотез о значимости влияния этих ф-ров на исслед. признак. Сравнивая комп-ты дисперсии друг с другом посредством F—критерия Фишера, можно определить, какая доля общей вариативности результат. признака обусловлена действием регулир. ф-ров. Исходным мат-лом для дисп.анализа служат данные исслед-я 3 и более выборок: , которые могут быть как равными, так и неравными по численности, как связными, так и несвязными. По кол-ву выявляемых регулир. ф-ров дисп. анализ м. б. однофакт. (при этом изуч. влияние 1 фактора на рез-ты эксперимента), двухфакт. (при изучении влияния двух факторов) и многофакт. (позволяет оценить не только влияние каждого из факторов в отдельности, но и их взаимодействие). Дисп. анализ относится к группе параметрич. методов и поэтому его следует применять только тогда, когда доказано, что распред-е явл. нормальным. Дисп. анализ исп., если зависимая переменная измер. в шкале отношений, интервалов или порядка, а влияющие переменные имеют нечисловую природу (шкала наименований).

Соседние файлы в предмете Высшая математика