Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1-27.doc
Скачиваний:
8
Добавлен:
20.09.2019
Размер:
224.77 Кб
Скачать

17.Диспресійний аналіз

В будь-якому експерименті середні значення досліджуваних величин

змінюються у зв’язку зі зміною основних факторів (кількісних та якісних), що визначають умови досліду, а також і випадкових факторів. Дослідження впливу тих чи інших факторів на мінливість середніх є задачею дисперсійного аналізу .

Дисперсійний аналіз використовує властивість адитивності дисперсії

випадкової величини, що обумовлено дією незалежних факторів. В

залежності від числа джерел дисперсії розрізняють однофакторний та

багатофакторний дисперсійний аналіз.

Дисперсійний аналіз особливо ефективний при вивченні кількох

факторів. При класичному методі вивчення змінюють тільки один фактор, а решту залишають постійними. При цьому для кожного фактору проводиться своя серія спостережень, що не використовується при вивченні інших факторів. Крім того, при такому методі досліджень не вдається визначити взаємодію факторів при одночасній їх зміні. При дисперсійному аналізі кожне спостереження служить для одночасної оцінки всіх факторів та їх взаємодії.

Дисперсійний аналіз полягає у виділенні і оцінці окремих факторів,

що викликають зміну досліджуваної випадкової величини. При цьому

проводиться розклад сумарної вибіркової дисперсії на складові, обумовлені незалежними факторами. Кожна з цих складових є оцінкою дисперсії генеральної сукупності. Щоб вирішити, чи дієвий вплив даного фактору, необхідно оцінити значимість відповідної вибіркової дисперсії у порівнянні з дисперсією відтворення, обумовленою випадковими факторами. Перевірка значимості оцінок дисперсії проводять по критерію Фішера. Коли розрахункове значення критерію Фішера виявиться меншим табличного, то вплив досліджуваного фактору немає підстав вважатизначимим. Коли ж розрахункове значення критерію Фішера виявиться більшим табличного, то цей фактор впливає на зміни середніх. В подальшому ми вважаємо, що виконуються наступні припущення:

1) випадкові помилки спостережень мають нормальний розподіл;

2) фактори впливають тільки на зміну середніх значень, а дисперсія

спостережень залишається постійною.

Фактори, що розглядаються в дисперсійному аналізі, бувають двох

родів: 1) з випадковими рівнями та 2) з фіксованими. В першому випадку

мається на увазі, що вибір рівнів проходить з безмежної сукупності можливих рівнів та супроводжується рандомізацією. Якщо рівні вибираються випадковим чином, математична модель експерименту називається модель з випадковими рівнями факторів (випадкова модель). Коли всі рівні фіксовані – модель з фіксованими рівнями факторів. Коли частина факторів розглядається на фіксованих рівнях, рівні решти вибираються випадковим чином – модель змішаного типу.

Дисперсійний аналіз застосовується в різних формах в залежності від

структури об’єкту, що досліджується; вибір відповідної форми є однією з головних трудностей в практичному застосуванні аналізу.

18. В теорії ймовірностей та математичній статистиці, кореляція є залежністю двох випадкових величин. При цьому, зміна однієї або кількох цих величин призводить до систематичної зміни іншої або інших величин. Математичною мірою кореляції двох випадкових величин слугує коефіцієнт кореляції.

Кореляція може бути позитивною та негативною (можлива також ситуація відсутності статистичного зв'язку - наприклад, для незалежних випадкових величин). Від'ємна кореляція – кореляція, при якій збільшення однієї змінної пов'язане зі зменшенням іншої, при цьому коефіцієнт кореляції від'ємний. Додатна кореляція – кореляція, при якій збільшення однієї змінної пов'язане зі збільшенням іншої, при цьому коефіцієнт кореляції додатній.

Нехай   та   — випадкові величини з математичним сподіванням μX та μY. Їх коефіцієнт кореляції позначається як   і дорівнює:

де:

 — коваріація величин   та  ,

 — стандартне відхилення величин   та  .

19. Коефіцієнт детермінації (- R-квадрат) - це частка дисперсії залежної змінної, яка пояснюється розглянутої моделлю залежності, тобто пояснюють змінними. Більш точно - це одиниця мінус частка непоясненої дисперсії (дисперсії випадкової помилки моделі, або умовної по факторам дисперсії залежної змінної) в дисперсії залежної змінної. Його розглядають як універсальну міру зв'язку однієї випадкової величини від безлічі інших. В окремому випадку лінійної залежності є квадратом так званого множинного коефіцієнта кореляції між залежною змінною і пояснюють змінними. Зокрема, для моделі парної лінійної регресії коефіцієнт детермінації дорівнює квадрату звичайного коефіцієнта кореляції між y і x.

Істинний коефіцієнт детермінації моделі залежності випадкової величини y від факторів x визначається таким чином:

де   - умовна (за факторами x) дисперсія залежної змінної або дисперсія випадкової помилки моделі.

У даному визначенні використовуються справжні параметри, що характеризують розподіл випадкових величин. Якщо використовувати вибіркову оцінку значень відповідних дисперсій, то отримаємо формулу для вибіркового коефіцієнта детермінації (який зазвичай і мається на увазі під коефіцієнтом детермінації):

де  -сума квадратів залишків регресії,   - фактичні та розрахункові значення пояснюється змінної.

  - Загальна сума квадратів.

27.Автокореляція або автокореляційна функція — це кореляція функції з самою собою зміщеною на певну величину незалежної змінної. Автокореляція використовується для знаходження закономірностей в ряді даних, таких як періодичність. Часто застосовується у статистиці таобробці сигналів для аналізу функцій або серій даних.

Математично автокореляційна функція визначається як:

,

де функція   інтегрується у добутку з комплексно спряженою та зміщеною на певну величину   (часто   це час) функцією.

Графік автокореляційної функції можна отримати, відклавши по осі ординат коефіцієнт кореляції двох функцій (базової та функції зсунуті на величину ) а по осі абсцис величину  . Якщо вихідна функція строго періодична, то на графіку автокореляційної функції теж буде строго періодична функція. Таким чином з цього графіку можна судити про періодичність базової функції, а отже і про її частотні характеристики. Це застосовується для аналізу складних коливань, наприклад електроенцефалограми людини.

26.Гетероскедастичність — властивість послідовності випадкових величин. Гетероскедастичність вивчається в курсі економетрики.

У статистиці, послідовність випадкових величин називається гетероскедастичною, якщо випадкові величини мають різну дисперсію. Термін означає «різна дисперсія» і походить від грецького слова «гетеро» («інший») і «skedasis» («дисперсії»).

На відміну, послідовність випадкових величин називається гомоскедастичною, якщо вона має постійну дисперсію.

Нехай є послідовність випадкових величин {Yt}t=1n, і послідовність векторів випадкових величин {Xt}, t = 1 до n. Маючи справу з умовним очікуванням Yt за даного Xt, послідовність {Уt}, t = 1 до n, називається гетероскедастичною, якщо умовна дисперсія Yt за даного Xt, змінюється з t.

При використанні деяких статистичних методів, таких, як метод найменших квадратів (МНК), як правило, робиться ряд припущень. Одним з них є те, що залишковий член має незмінну дисперсію. Це може бути не так, навіть якщо залишковий член отримується з однакових розподілів.

Наприклад, залишковий член може змінюватися (збільшуватися) з кожним спостереженням, як це часто буває з перехресними або часовими даними.

З появою надійних/стійких середньоквадратичних помилок, які дозволили робити висновки без посилання на умовний другий момент залишкового члена, тестування умовної гомоскедастичності стало не таким важливим, як в минулому.

Мультиколінеарність  25.ПОНЯТТЯ МУЛЬТИКОЛІНЕAРНОСТІ  Однією з чотирьох умов, які необхідні для оцінювання параметрів загальної лінійної моделі 1МНК, є умова (4.5), яка стосується матриці вихідних даних X. Ця матриця має розміри і повинна мати ранг m, тобто серед пояснюваль-них змінних моделі не повинно бути лінійно залежних. Проте оскільки економічні показники, які входять до економетричної моделі як пояснювальні змінні, на практиці дуже часто пов’язані між собою, то це може стати переш-кодою для оцінювання параметрів моделі 1МНК та істотно вплинути на якість економетричного моделювання.  Тому в економетричних дослідженнях вельми важливо з’ясувати, чи існують між пояснювальними змінними взаємозв’язки, які називають мультиколінеарністю.  Означення 6.1. Мультиколінеарність означає існування тісної лінійної залежності, або кореляції, між двома чи більше пояснювальними змінними.  Вона негативно впливає на кількісні характеристики економетричної моделі або робить її побудову взагалі неможливою.  Так, мультиколінеарність пояснювальних змінних призводить до зміщення оцінок параметрів моделі, через що з їх допомогою не можна зробити коректні висновки про результати взаємозв’язку залежної і пояснювальних змінних. У крайньому разі, коли між пояснювальними змінними існує функціональний зв’язок, оцінити вплив цих змінних на залежну взагалі неможливо. Тоді для оцінювання параметрів моделі метод найменших квадратів не придатний, оскільки матриця буде виродженою.  Нехай зв’язок між пояснювальними змінними не функціональний, проте стати-стично істотний. Тоді попри те, що оцінити параметри методом найменших квадратів теоретично можливо, знайдена оцінка може призвести до таких помил-кових значень параметрів, що сама модель стане беззмістовною.  Основні наслідки мультиколінеарності.  1. Падає точність оцінювання, яка виявляється так:  а) помилки деяких конкретних оцінок стають занадто великими;  б) ці помилки досить корельовані одна з одною;  в) дисперсії оцінок параметрів різко збільшуються.  2. Оцінки параметрів деяких змінних моделі можуть бути незначущими че-рез наявність їх взаємозв’язку з іншими змінними, а не тому, що вони не впли-вають на залежну змінну. У такому разі множина вибіркових даних не дає змо-ги цей вплив виявити.  3. Оцінки параметрів стають досить чутливими до обсягів сукупності спо-стережень. Збільшення сукупності спостережень іноді може спричинитися до істотних змін в оцінках параметрів.  З огляду на перелічені наслідки мультиколінеарності при побудові економетричної моделі потрібно мати інформацію про те, що між пояснюваль-ними змінними не існує мультиколінеарністі.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]