Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

КОНСПЕКТ ЛЕКЦИЙ КОДЭИ

.pdf
Скачиваний:
108
Добавлен:
14.03.2016
Размер:
28.31 Mб
Скачать

Для непрерывных числовых данных применяются:

1. Гистограмма

подобна круговой диаграмме, но без пробелов, так как данные непрерывны. Ширина каждого элемента гистограммы должна соответствовать интервалу значений для данной переменной.

26.01.2015 Доцент С.Т. Касюк

28

2. Точечный график — каждое наблюдение изображено одной точкой на горизонтальной (или вертикальной) линии. Такой график легко строить, но при большом объеме данных он неприемлем.

26.01.2015 Доцент С.Т. Касюк

29

Форма частотного распределения

Выбор наиболее подходящего статистического метода часто зависит от формы распределения. Распределение данных обычно унимодальное, т.е. имеет одну «вершину». Возможно бимодальное (две «вершины») или равномерное (каждая величина одинаково вероятна и «вершин» нет) распределение. При унимодальном распределении важно увидеть, где относительно максимальных и минимальных значений находится большая часть данных.

26.01.2015 Доцент С.Т. Касюк

30

Важно определить, является ли распределение:

1) симметричным

сосредоточенным вокруг средней точки, одна сторона которой служит симметричным отражением другой;

26.01.2015 Доцент С.Т. Касюк

31

2) скошенным вправо

(положительная асимметрия) — с

длинным правым «хвостом» с одним или несколькими большими значениями. Такие данные бывают весьма часто в медицинских исследования;

26.01.2015 Доцент С.Т. Касюк

32

3) скошенным влево

(отрицательная асимметрия) — с длинным левым «хвостом» с одним или несколькими малыми значениями.

26.01.2015 Доцент С.Т. Касюк

33

Какие диаграммы можно построить в случае двух переменной?

Если одна переменная категориальная, то диаграммы, показывающие распределение второй переменной, нужно начертить для каждой категории. Другие графики, подходящие для таких данных, включают групповые или сегментные линии или графики с колонками.

С.Т. Касюк

34

Если обе переменные непрерывные или ординальные, то связь между ними можно изобразить с помощью

двумерного графика (скаттерплот). Это двумерный график, где оси переменных перпендикулярны друг другу. Одну переменную обычно обозначают буквой х и отображают на горизонтальной оси. Вторая переменная, обозначаемая буквой у, наносится на вертикальную ось.

35

Проверка соответствия анализируемых данных закону нормального распределения

Важным условием, определяющим возможность применения многих методов анализа данных, является подчинение анализируемых данных закону нормального (Гауссова) распределения, которое имеет характерный колоколообразный вид. По некоторым данным, примерно в 75% случаев распределения биологических признаков существенно отличаются от нормального, и многие исследователибиологи совершают ошибку, применяя методы анализа для ненормально распределенных признаков. Часто это приводит к выводам, не соответствующим действительности.

26.01.2015 Доцент С.Т. Касюк

36

Во избежание указанной ошибки, любой анализ

биологических признаков должен сопровождаться проверкой нормальности их распределения.

26.01.2015 Доцент С.Т. Касюк

37