Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эконометрика_СибГАУ.docx
Скачиваний:
150
Добавлен:
17.03.2015
Размер:
1.51 Mб
Скачать

Глава 1. Элементы статистики и теории вероятностей

В самых разнообразных областях практической и научной деятельности встречаются случаи, когда некоторые эксперименты могут быть проведены большое количество раз при одинаковых условиях.

Например:

  1. Бросание игральной кости;

  2. Измерение длины и веса некоторых предметов;

  3. Наблюдение за ценами на различные товары.

Наших знания недостаточно, чтобы предсказать результаты отдельных наблюдений, поэтому в примерах 1-3 можно говорить о случайных экспериментах.

Рассмотрим случайные эксперименты по бросанию монеты. Если мы подбросим монету n раз и m раз выпадет герб, то частота выпадения герба будет равна m/n. При неограниченном продолжении эксперимента частота выпадений герба становится близкой к ½ - значению, которое мы принимаем за вероятность выпадения герба.

Пусть результаты случайного эксперимента. Для изучения этого ряда часто удобно результаты эксперимента ранжировать, т.е. упорядочит, например по возрастанию. В результате получим новый ряд

, где ,

Поскольку в новом ряду некоторые значения повторяются, то их группируют и в результате каждому ставят в соответствие, которое равно частоте появления данного числа. Имеем

Где Полученный ряд называется сгруппированным. Кроме дискретных рядов часто используются интервальные вариационные ряды. Они строятся в том случае, когда.

При определении количества групп необходимо стремиться к тому, чтобы были учтены особенности изучаемого явления. Поэтому количество групп должно быть оптимальным, в каждую группу должно входить достаточно большое число единиц совокупности, что отвечает требованию закона больших чисел. Однако, в отдельных случаях представляют интерес и малочисленные группы: новое, передовое, пока не оно станет массовым, проявляется в незначительном числе фактов; поэтому задача статистики - выделить эти факты, изучить их.

Таким образом, при решении вопроса о численности единиц в группах нужно руководствоваться не формальными признаками, а знанием сущности изучаемого явления.

На количество выделяемых групп существенное влияние оказывает степень колеблемости группировочного признака: чем она больше, тем больше следует образовывать групп.

Ориентировочно определить оптимальное количество групп с равными интервалами можно по формуле Стерджесса:

k=1+3,322 lgn,

где n - число единиц совокупности.

Замечание. Герберт Стерджесс (Herbert Sturges) предложил свою эмпирическую формулу для определения количества столбиков в гистограмме в 1926 году. С тех пор эта формула попала во множество учебников по статистике, и многие статистические пакеты используют эту формулу по умолчанию. Тем не менее, подход Стерджесса не имеет статистического обоснования, и существуют более обоснованные альтернативы.

Количество элементов исходного ряда, попавших в каждую группу можно определить с помощью функции ЧАСТОТА.

Замечание.

Результаты измерения, как правило, регистрируют сначала в произвольном, хаотичном порядке, или в алфавитном порядке, или в том порядке, в каком поступают результаты измерения (например, ежедневный биржевой курс доллара к рублю). В такой форме полученные данные неудобны для анализа и выявления закономерностей. Первичная обработка статистических данных состоит в упорядочении данных (по возрастанию или убыванию), подсчете некоторых показателей, характеризующих эти значения, в группировании данных.

Упорядочение данных и подсчет их частот можно выполнять с помощью редактора электронных таблиц Microsoft Excel. Для этого используются команды илии статистическая функция (ЧАСТОТА).

Относительная частота значения является краткой и содержательной характеристикой рассматриваемой информации.

Для большого количества данных на следующем этапе обработки статистических данных целесообразно их обобщение. Тем самым приходим к необходимости группирования статистических данных. Имеются различные способы группирования. Рассмотрим некоторые из них.

Один из них реализуется в следующей последовательности действий.

1. Определение количества групп k, на которые подразделяются все данные. Четкого правила выбора количества групп не существует. Они определяются содержанием рассматриваемой задачи. Обычно количество групп выбирают не меньше 12, но не больше 15. Малое количество групп (<12) может исказить результаты, а большое количество (>15) затрудняет работу с таблицей.

2. Вычисление размаха данных ω - разности между наибольшим xmax и наименьшим xmin значениями, увеличенной на погрешность измерения величины.

В общем случае к разности xmax - xmin добавляется число, равное погрешности величины.