Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
statistika_otvety (1).doc
Скачиваний:
53
Добавлен:
27.02.2016
Размер:
1.19 Mб
Скачать
  1. Выборочное наблюдение. Его преимущества и недостатки

Выборочное наблюдение– метод получения данных, при котором информация собирается не со всех элементов объекта исследования (генеральной совокупности), а только с его относительно малой части. Что это дает? Какие здесь плюсы и минусы? Для ответов на эти и другие вопросы создана отдельная рубрика о выборочном наблюдении и проверке статистических гипотез. Данная статья является вводной, где читатель в основных чертах познакомится с выборочным наблюдением, его преимуществами и недостатками.

Вкратце суть метода такова. Из объекта анализа случайным образом отбираются некоторые элементы (делают выборку), по которым производят необходимые измерения (обмеры, опросы, тестирования и проч.). Полученные таким образом данные анализируют и результаты затем распространяют на всю генеральную совокупность. Например, соцопрос населения – типичный анализ выборки. Опросили 1000 человек и вот уже готова сенсационная новость о падении или взлете рейтинга какого-нибудь политика. Анализ выборок проводят и в сугубо приземленных практических целях. Например, случайная выборка из партии изделий позволяет судить о качестве всей партии (доля брака всего 30% - отличное качество!). Пробы воды дают характеристику всему водоему (типа «купаться не рекомендуется»). Сфера применения выборок очень широка и на то есть свои причины.

Главная причина – это доступность, что выражается в относительно небольших затратах на проведение (по сравнению со сплошным наблюдением). Нет необходимости задействовать большое количество людей. На свод и обработку данных также не требуется много времени (опять же относительно сплошного наблюдения). Такой расклад делает выборочное наблюдение весьма привлекательным методом для многих исследователей (социологов, маркетологов, экономистов, контролеров качества, ньюсмейкеров и т.д и т.п.).

Второй причиной широкого использования выборок я бы назвал тот факт, что выборка часто являться единственным способом сбора данных, т.к. сплошное наблюдение в некоторых ситуациях вообще недоступно. Например, невозможно проверить эффективность лекарства на всех пациентах, которые будут его принимать в будущем. Невозможно также подсчитать количество животных или растений в лесу путем их тотального пересчета или количество проросших семян на поле в несколько гектар. Поэтому к выборочному методу прибегают еще и вынуждено, а не только из-за экономии. Есть и другие причины, но это были основные. Я считаю.

Теперь обозначим главные недостатки выборочного метода. Недостаток, по сути один. Он заключается в том, что показатели, рассчитанные по выборке, всегда ошибочны. Вот так, немного и немало – они всегда неверны относительно истинного (неявного) показателя из генеральной совокупности данных. Чтобы мы не рассчитали по выборке, это всегда неправда, точнее сказать – не совсем правда. Если показатель, рассчитанный по генеральной совокупности, отражает истинное состояние дел (при точных замерах, разумеется), то выборка всегда дает погрешность. Такова цена за все те возможности, которые она дает.

Почему же выборка дает ошибку? Потому что структура данных выборки всегда хоть немного, но отличается от структуры генеральной совокупности. Отсюда все значения показателей, рассчитанных по выборке, будут хоть немного, но отличаться от аналогичных показателей, рассчитанных по генеральной совокупности. В этом легко убедиться, если несколько раз подбросить монетку и подсчитать количество выпавших орлов и решек. Маловероятно, что их соотношение будет 50/50. Хотя в генеральной совокупности (бесконечно большого количества подбрасываний) соотношение именно 50/50.

Почему тогда используют выборку, если она всегда дает ошибочные результаты? Да потому что лучше иметь неточные данные, чем не иметь вообще никаких. При этом правильное проведение выборочного наблюдения может дать довольно таки приемлемые по точности результаты. Допустим, мы не знаем истинное соотношение выпадения орлов и решек (настоящей вероятности). Но, сделав 100 подбрасываний и получив, к примеру, соотношение 55/45 у нас уже будет неплохой ориентир. То есть 55/45 гораздо ближе к 50/50, чем, скажем, 10/90, если сделать такое предположение наугад. Далее эти результаты можно уточнить или сделать определенные допуски на разброс. Для анализа выборочных данных разработана специальная технология, которая выдвигает ряд требований и правил для того, чтобы результаты были насколько это возможно точными и трактовались насколько возможно корректно.

Самое первое требование относится к исходным данным. Они должны быть репрезентативными, то есть содержать в себе всю информацию о качестве генеральной совокупности. Внутренняя структура выборки должна соответствовать структуре данных в генеральной совокупности. Образно выражаясь, выборка должна быть максимально точной уменьшенной копией оригинального объекта исследования. Имея в наличии такую уменьшенную модель, можно проводить различные опыты и результаты распространять на оригинал. Как, например, перед строительством корабля вначале делают уменьшенную копию и проверяют в специальном бассейне с волнами и штормами. Если модель при испытаниях не переворачивается, тогда есть надежда, что и корабль не потонет.

Теория вероятностей утверждает, что для сохранения исходной структуры данных отбор следует производить в случайном порядке из всей генеральной совокупности. Ключевое слово – в случайном порядке. Это значит, что любой элемент может быть отобран с одинаковой вероятностью.

Далее по выборочным данным рассчитывают различные показатели, которые на самом деле называются оценками. Исследователь пытается оценитьзначение показателя по выборочным данным и получает что-то близкое к истинному значению, но всегда с некоторым отклонением (что-то вроде соотношения 55/45 вместо реального 50/50 при подбрасывании монеты). Совпадение может произойти исключительно по чистой случайности. Это первое важное понятие, которое нужно зазубрить на всю жизнь. Оценка показателя – это всего лишь оценка и при повторном проведении эксперимента (выборки) обязательно будет другой.

И быть беде, если бы ошибка выборки была абсолютно непредсказуема и не имела пределов. Результаты выборочных измерений были бы равносильны методу «пальцем в небо». К всеобщему счастью это не так. Оценки, рассчитанные по репрезентативной выборке, обладают рядом полезных свойств, которые с той или иной вероятностью определяют границы их возможных изменений, то есть интервал, в пределах которого находится истинный показатель по генеральной совокупности. Хорошее понимание таких свойств позволяет исследователю делать достаточно правдивые заключения обо всей генеральной совокупности. Естественно, делая поправку на погрешность.

Оценка показателя не всегда рассчитывается по той же формуле, что и сам показатель. Например, средняя арифметическая, будучи оценкой математического ожидания, имеет по сути ту же формулу – сумма произведений отдельных значений на их вероятности (частоты). Это хорошо видно по формуле средней арифметической взвешенной, если все слагаемые в числителе разделить на знаменатель (сумму весов). А вотформула дисперсии по выборке немного отличается от формулы дисперсии по генеральной совокупности. Если этот момент проигнорировать, то дисперсия по малой выборке получится слегка заниженной. В общем формулы показателей и их оценок лучше не путать. Хотя при выборке размером более 50 наблюдений, разница практически исчезает.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]