22.3 Критерій хі-квадрат однорідності
При застосуванні критерія узгодження теоретичні значення ймовірностейподійвідомі точно.
Часто виникає ситуація, коли необхідно на основі даних двох незалежних серий випробувань преревірити, що кожна з серій є реалізацією однієї випадкової величини з невідомими ймовірностями , тобто, чи не змінився закон розподілу ймовірностей при переході від першої до другої серії випробувань.
Нехай здійснено послідовних незалежних серій випробувань звипробувань відповідно.
Нехай, крім того, у кожному окремому випробуванні серії з номером подіяможе реалізуватися з (невідомою) ймовірністю.
Для поясненя критерія розташуємо частоти зустрічаємості подій у кожній серіі випробовувань в окремий стовбчик таблиці (таб. 22.1).
Елемент таблиці дорівнюї кількості спостережень подіїу серії випробовувань з номером
Покладемо і введемо традиційне позначення.
Таблиця 22.1 Розташування частот зустрічаємості випробовувань
|
1 |
по рядках | ||||
|
| |||||
|
| |||||
по стовб- чиках |
Необхідно перевірити гіпотезу , за якою.
Виявляється, що це можна зробити за статистикою ,
яка асимптотично має розподіл ,.
22.4 Універсальний статистичний тест Маурера
Для даного тесту - це припущення, що двійкова послідовність є чисто випадковою.
Нехай відрізок сгенерованої двійкової послідовності представлено у пам’яті комп’ютера як послідовність фрагментівпобітів на фрагмент. Наприклад, при, фрагменти являються байтами. Рекомендовано вибиративід 8 до 16.
Накладемо деяки умови на . А саме, припустимо, щодозволяє розбити послідовністьза допомогою індексана дві частини, де,- параметри теста:-кількість початкових даних теста, а- кількість кроків алгоритму обчислення вибіркових даних. Рекомендовано вибирати,.
Для кожного з фрагментів послідовно знайдемо значення деякої відповідної випадкової величини.
Неформально, , девідстань у послідовностіміж фрагментомта його найближчим повторенням зліва (якщо таке існує). У випадку, коли повторення не існює, покладаємо.
Наприклад, , якщо послідовнністьмає наступні особливості:.
Таким чином, для ,
, за умови, що відповідне існує. Інакше,.
Тест Маурера оснований на статистиці виду .
Для критерія необхідно знати математичне сподівання та дисперсіюпри істиннійі.
; , де
-, а дляіснує апроксимація:
.
Гіпотеза оцінюється на рівні значимостінормального розподілу, залежно від значень,та інтервалувиду
, . Тут,- квантіль нормального розподілу.
Якщо , топриймається, інакше, приймається.