Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по МатСтату.doc
Скачиваний:
18
Добавлен:
18.11.2018
Размер:
1.08 Mб
Скачать

Выборочные характеристики

Следующие функции от выборки называются выборочными характеристиками. Это

  1. Выборочное среднее

  2. Выборочная дисперсия

  3. Несмещенная выборочная дисперсия

  4. Минимальная порядковая статистика

  5. Максимальная порядковая статистика

  6. -тая порядковая статистика

  7. Медиана

  8. Вариационный ряд выборки

Эти характеристики позволяют компактно представить часть информации, содержащейся в выборке, и часто естественным образом возникают при решении статистических задач.

Свойства выборочных характеристик

Пользуясь методами теории вероятностей (свойства математического ожидания и дисперсии, закон больших чисел и центральная предельная теорема), нетрудно получить (в априорном предположении о существовании достаточного числа моментов у случайной величины ) следующие свойства выборочных характеристик.

  1. Если функция распределения данных непрерывна, то при где - так называемая - квантиль, т. е. корень уравнения

Моделирование выборок на компьютере

Моделирование числовых выборок на компьютере позволяет проиллюстрировать основные теоремы и методы классической статистики и рассчитать те характеристики статистических процедур, теоретический расчет которых затруднителен или невозможен.

Основная задача моделирования в этом случае – моделирование последовательности независимых значений некоторой числовой случайной величины (моделирование конкретного распределения). Обычно эту задачу разбивают на два этапа. Сначала моделируют последовательность значений базовой случайной величины, обычно равномерно распределенной на отрезке , затем преобразуют эту последовательность.

Датчик случайных чисел

Датчиком случайных чисел обычно называют программу, подпрограмму или функцию, которая обеспечивает построение последовательности чисел, моделирующих выборку из равномерного распределения на отрезке. В языках программирования эти функции обычно называются так: rand(), random() и т.п. Теория построения таких функций изложена, например, в книге Кнута «Искусство программирования для ЭВМ», том 2.

Последовательность независимых равномерно распределенных чисел на отрезке будем обозначать

Моделирование дискретных распределений

Моделирование конкретного распределения можно производить различными способами. Если распределение дискретно, то можно использовать, например, следующий прием.

Пусть - разбиение отрезка, тогда последовательность

является последовательностью независимых дискретных случайных величин, принимающих значения с вероятностями .

Например, для моделирования распределения достаточно разбить отрезок на две части длиной и , соответственно. Для моделирования распределения применять предложенный метод нерационально, так как придется вычислять вероятности вида

.

Гораздо проще для моделирования сложить смоделированных величин . Заметим, что для моделирования одной величины в этом случае потребуется членов последовательности

Моделирование непрерывных распределений

Моделирование конкретного распределения можно производить различными способами. Если распределение непрерывно, то можно использовать, например, следующий прием.

Пусть - непрерывная функция распределения, тогда последовательность

является последовательностью независимых случайных величин, принимающих значения с функцией распределения.

Для доказательства достаточно вычислить функцию распределения случайной величины .

Например, для моделирования распределения достаточно положить

Для моделирования распределения применять предложенный метод нерационально, так как придется вычислять обратную функцию к функции вида.

Гораздо проще для моделирования сложить смоделированных величин . Заметим, что для моделирования одной величины в этом случае потребуется членов последовательности

Моделирование нормального распределения.

Для моделирования стандартного нормального распределения можно использовать следующее утверждение.

Утверждение.

Случайные величины

независимы и стандартно нормально распределены.

Доказательство этого утверждения представляет собой упражнение из математического анализа на замену переменных в двумерном интеграле (переход к полярным координатам).

Теория оценивания

В данном и следующих разделах по умолчанию предполагается существование необходимого числа моментов у случайных величин.

Если в утверждениях появляется параметр , то это означает, что рассматривается выборка размера .

Определение оценки и критерии качества оценок

Определение.

Статистика называется оценкой параметра , если она принимает свои значения в параметрическом множестве .

Разумными требованиями к оценкам являются

  1. Несмещенность

  2. Состоятельность

  3. Минимальность дисперсии

Общие методы построения оценок

Идеальная или оптимальная оценка должна удовлетворять всем требованиям 1)-3). Однако нет гарантии, что такая оценка существует. Поэтому интересными являются также методы, позволяющие строить оценки, удовлетворяющие, например, требованию 2) или требованиям 2) и 1)

Метод подстановки и метод моментов

Метод подстановки заключается в использовании идеи подстановки и применяется в случае, когда данные представляют собой выборку. Пусть существуют такие измеримые функции и , что

тогда оценкой по методу постановки называется величина

Теорема.

Если функция линейна, то оценка по методу подстановки несмещена и состоятельна, если непрерывна, то состоятельна.

Метод моментов.

Суть метода моментов заключается в следующем. Очевидно, выборочные среднее и дисперсия являются несмещенными оценками своих математических ожиданий, являющихся в параметрическом случае некоторыми функциями от параметра.

Если функции и непрерывны и монотонны, то существуют обратные к ним функции и, применяя метод подстановки, получим оценки

Очевидно, что подобным образом можно использовать другие выборочные характеристики.