Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Инструментарий качества Алгоритмы построения.doc
Скачиваний:
30
Добавлен:
11.02.2015
Размер:
4.05 Mб
Скачать

Диаграмма разброса (рассеивания)

Диаграмма разброса представляет собой точечную диаграмму в виде графика, получаемого путем нанесения в определенном масштабе экспериментальных точек, полученных в результате наблюдений. Координация точек на графике соответствует значениям рассматриваемой величины и влияющего на него фактора. Расположение точек показывает наличие и характер связи между двумя переменными. По полученным экспериментальным точкам могут быть определены и числовые характеристики связи между рассматриваемыми случайными величинами коэффициент корреляции и коэффициенты регрессии.

Диаграмма разброса (рассеяния) применяется для выявления зависимости (корреляции) одних показателей от других или для определения степени корреляции между n парами данных для переменных X и y:

(x1,y1), (x2,y2), ..., (xn,yn).

Эти данные наносятся на график (диаграмму разброса), и для них вычисляется коэффициент корреляции по формуле

,

,

,

Где, ковариация;

стандартные отклонения случайных переменных xиу;

n– размер выборки (количество пар данных –хiиуi);

и – среднеарифметические значенияхiиуi cоответственно.

На рис. представлены различные варианты диаграмм разброса (или полей корреляции).

Рис. Варианты диаграмм разброса.

В случае:

а) можно говорить о положительной корреляции (с ростомxувеличиваетсяy);

б) проявляется отрицательная корреляция (с ростомxуменьшаетсяy);

в) при ростеx yможет как расти, так и уменьшаться, говорят об отсутствии корреляции. Но это не означает, что между ними нет зависимости, между ними нет линейной зависимости. Очевидная нелинейная (экспоненциальная) зависимость представлена и на диаграмме разбросаг).

Коэффициент корреляции всегда принимает значения в интервале . Т.е. при r>0 – положительная корреляция, при r=0 – нет корреляции, приr<0 – отрицательная корреляция.

Для тех же n пар данных (x1,y1), (x2,y2), ..., (xn, yn) можно установить зависимость между x и y. Формула, выражающая эту зависимость, называется уравнением регрессии (или линией регрессии), и ее представляют в общем виде функцией

у=а+bх

Для определения линии регрессии (рис.10) необходимо статистически оценить коэффициент регрессии b и постоянную a.

Для этого должны быть выполнены следующие условия:

1) Линия регрессии должна проходить через точки (x,y) средних значенийxиy.

2) Сумма квадратов отклонений от линии регрессии значений yпо всем точкам должна быть наименьшей.

3) Для расчета коэффициентов а и b используются формулы

()

, ()

Рис. Пример линии регрессии.

Правила построения диаграммы разброса (рассеивания) [Кузьмин ММк2006 №2]:

  1. Определить, между какими парами данных необходимо установить наличие и характер связи (желательно не менее 25-30 пар).

  2. Для сбора данных подготовить бланк таблицы или листок регистрации, предусмотрев в нем графы для порядкового номера наблюдения, независимой переменной характеристики (х), зависимой переменной, называемой функцией – откликом (у).

  3. По данным наблюдения заполнить листок регистрации данных.

  4. По полученным данным построить график в координатах х-у и нанести на него данные. Длина осей, равная разности между максимальными и минимальными значениями для оси х и у, по вертикали и по горизонтали должна быть примерно одинаковой, тогда диаграмму легче читать.

  5. Нанести на диаграмму все необходимые обозначения. Данные на диаграмме должны быть понятны любому человеку, а не только тому кто занимался построением диаграммы.