Скачиваний:
12
Добавлен:
01.03.2022
Размер:
967.62 Кб
Скачать

1.4. Что такое переменная?

Так как значения переменных не постоянны, нужно научиться

описывать их изменчивость.

Для этого придуманы описательные или дескриптивные

статистики.

Минимум и максимум — это минимальное и максимальное значения переменной.

Среднее — сумма значений переменной, деленная на n (число значений переменной).

Дисперсия и стандартное отклонение — наиболее

часто используемые меры изменчивости переменной. Дисперсия меняется от нуля до бесконечности. Крайнее значение 0 означает отсутствие изменчивости, когда значения переменной постоянны.

1.4. Что такое переменная?

Медиана разбивает выборку на две равные части. Половина значений переменной лежит ниже медианы, половина — выше.

Медиана дает общее представление о том, где сосредоточены значения переменной, иными словами, где находится ее центр. В некоторых случаях, например при описании доходов населения, медиана более удобна, чем среднее.

Мода представляет собой максимально часто встречающееся значение переменной (иными словами, наиболее «модное» значение переменной), например популярная передача на телевидении, модный цвет платья или марка автомобиля и т. д.

А так же есть еще множество других статистик: квартили, коэффициент асимметрии, эксцесс, коэффициент корреляции и др.

1.5. Основные законы распределения случайных величин и их назначение

Законы распределения случайных величин служат математическими моделями для реальных объектов и явлений, что позволяет в некоторых случаях применять их для расчетов и анализа ситуации.

1.5. Основные законы распределения случайных величин и их назначение

Нормальное распределение особенно часто используется

при анализе данных. Нормальное распределение дает хорошую модель для реальных явлений, в которых:

1)имеется сильная тенденция данных группироваться вокруг центра;

2)положительные и отрицательные отклонения от центра равновероятны;

3)частота отклонений быстро падает, когда отклонения от центра становятся большими.

 

 

1

 

e

( x m)2

f (x)

 

 

2 2

 

 

 

2

 

 

 

 

 

1.5. Основные законы распределения случайных величин и их назначение

Равномерное распределение полезно при описании

переменных, у которых каждое значение равновероятно, иными словами, значения переменной равномерно распределены в некоторой области.

 

1

, x [ , ]

 

 

 

f ( x)

 

0, x [ , ]

1.5. Основные законы распределения случайных величин и их назначение

Экспоненциальное распределение. Имеют место

события, которые на обыденном языке можно назвать редкими. Если T – время между наступлениями редких событий, происходящих в среднем с интенсивностью λ, то величина имеет экспоненциальное распределение с параметром λ (лямбда). Экспоненциальное распределение часто используется для описания интервалов между последовательными случайными событиями, например интервалов между заходами на непопулярный сайт, так как эти посещения являются редкими событиями.

f ( x) e x , x 0

1.5. Основные законы распределения случайных величин и их назначение

Распределение Лапласа, или, как его еще называют,

двойного экспоненциального, используется, например, для описания распределения ошибок в моделях регрессии (зависимость среднего значения

какой-либо величины от некоторой другой величины или от нескольких величин).

f ( x) 12 e x , ( x )

1.5. Основные законы распределения случайных величин и их назначение

Натуральный логарифм случайной величины подчинен нормальному закону

распределения.

Логнормальное распределение используется,

например, при моделировании таких переменных, как доходы, возраст новобрачных или допустимое отклонение от стандарта вредных веществ в продуктах питания. Итак, если величина x имеет нормальное распределение, то величина y=ex имеет логнормальное распределение.

 

 

1

 

 

 

(ln x ln a)2

f ( x)

 

 

e

2 2

 

 

 

 

 

x

 

 

2

 

 

1.5. Основные законы распределения случайных величин и их назначение

Распределение Пуассона иногда называют распределением

редких событий. Примерами переменных, распределенных по закону Пуассона, могут служить: число несчастных случаев, число дефектов в производственном процессе и т д.

f ( x) xe x!

2. Краткий обзор современных программных средств для проведения анализа данных.

MATLAB – это высокопроизводительный

пакет для технических расчетов. Он включает в себя вычисления, визуализацию и программирование в удобной среде, где задачи и решения выражаются в форме, близкой к математической. Типичное использование MATLAB – это:

математические вычисления

создание алгоритмов

моделирование

анализ данных, исследования и визуализация

научная и инженерная графика

разработка приложений, включая создание графического интерфейса

Соседние файлы в папке 2017