- •Введение
- •Раздел I. Введение в теорию вероятностей
- •Понятие о случайном событии
- •Классическое определение вероятности
- •Относительная частота. Статистическое определение вероятности.
- •Геометрическая вероятность
- •Свойства вероятностей Сложение вероятностей несовместимых событий
- •Умножение вероятностей
- •Сложение вероятностей совместимых событий
- •Формула полной вероятности
- •Основные формулы комбинаторики
- •Дискретные и непрерывные случайные величины. Понятие «случайные величины»
- •Закон распределения случайной величины
- •Теоретические распределения вероятностей
- •Биномиальное распределение
- •Распределение Пуассона
- •Числовые характеристики дискретных случайных величин
- •Нормальное распределение
- •Вопросы для самопроверки:
- •Раздел II. Основные понятия и термины биологической статистики Генеральная совокупность и выборка
- •Непреднамеренный отбор. Метод последовательных номеров. Случайный и механический методы отбора
- •Признаки и показатели
- •Правила ранжирования
- •Способы группировки первичных данных.
- •Схемы (модели) научного исследования
- •Однофакторная и многофакторная модель Контрольные и экспериментальные группы
- •Метод автоконтроля
- •Метод дублирования
- •Метод последовательного пополнения групп
- •Численность контрольных и экспериментальных групп
- •Научные гипотезы
- •Направленные гипотезы
- •Статистические критерии
- •Параметрические критерии
- •Непараметрические критерии
- •Уровни статистической значимости
- •1 Рода.
- •Вопросы для самопроверки
- •Раздел III. Статистические методы обработки экспериментальных данных
- •Проверка гипотезы о законе распределения
- •Χ2 Пирсона
- •Описательные статистики Концепция сжатия экспериментальных данных
- •Показатели центральной тенденции. Средние.
- •Медиана
- •Персентили
- •Показатели изменчивости
- •Стандартизованные данные
- •Показатели асимметрии и эксцесса
- •Эксцесс
- •Работа с качественными переменными Количественная оценка результатов эксперимента.
- •Вопросы для самопроверки:
- •Сравнение двух независимых групп т критерий Стьюдента
- •Критерии согласия для дисперсий
- •U критерий Маана-Уитни
- •Сравнение качественных признаков Критерий χ2
- •Сравнение долей
- •Точный тест Фишера
- •Сравнение более двух независимых групп Однофакторный дисперсионный анализ Фишера
- •Критерий Краскела-Уоллиса
- •Сравнение двух зависимых групп Парный т критерий Стьюдента
- •Парный критерий т – Вилкоксона
- •Критерий x2r Фридмана
- •Тест Мак-Немара
- •Корреляционный анализ
- •Вычисление и интерпретация параметров парной линейной корреляции
- •Условия применения и ограничения корреляционно анализа
- •Вычисление и интерпретация параметров парной линейной корреляции
- •Измерение связи количественных признаков
- •Измерение связи порядковых признаков
- •Измерение связи номинальных признаков
- •Относительный риск. Отношение шансов
- •Статистическая оценка надежности параметров парной корреляции
- •Частная корреляция
- •Факторный анализ
- •Вопросы для самопроверки:
- •Регрессионный анализ
- •Метод наименьших квадратов
- •Выбор формы функциональной зависимости
- •Применение парного линейного уравнения регрессии
- •Корреляционно-регрессионные модели (крм) и их применение в анализе и прогнозе.
- •Логистическая регрессия
- •Анализ динамических изменений Применение метода наименьших квадратов при исследовании тенденции развития
- •Анализ циклических изменений
- •Метод обычных средних
- •Метод корригирования средних
- •Метод отношения фактических данных
- •Ошибки, допускаемые при количественной характеристике сезонных колебаний
- •Кластерный анализ
- •Иерархическое дерево
- •Меры расстояния
- •Правила объединения или связи
- •Метод k средних
- •Выбор между параметрическими и непараметрическими тестами: легкая ситуация.
- •Выбор между параметрическими и непараметрическими тестами: сложные случаи.
- •Выбор между параметрическим и непараметрическим тестом: насколько это на самом деле влияет на результат?
- •Одно или двухсторонняя p-оценка?
- •Парный или непарный тест?
- •Тест Фишера или хи-квадрат?
- •Регрессия или корреляция?
- •Вопросы для самопроверки:
- •Раздел IV. Работа с программой easystatistics Общие сведения о программе EasyStatistics
- •Создание новой базы данных
- •Работа с файлами
- •Копирование и вставка данных
- •Работа с фильтрами
- •Работа с переменными и строками
- •Статистические методы Описательные статистики
- •Частотный анализ
- •Сравнение независимых выборок
- •Сравнение связанных выборок
- •Дисперсионный анализ
- •Корреляционный анализ
- •Множественная регрессия
- •Проверка типа распределения эмпирических данных
- •Вероятностный калькулятор
- •Задания для самостоятельной работы с программой
- •Список рекомендуемой литературы
- •Граничные (критические) значения 2-критерия, соответствующие разным вероятностям допустимой ошибки и разным степеням свободы
- •Критические значения коэффициентов корреляции для различных степеней свободы (n - 2) и разных вероятностей допустимых ошибок
Вопросы для самопроверки
Приведите примеры генеральной совокупности и выборки.
Приведите примеры повторной и бесповторной выборок.
Преобразуйте признак «Рост» из количественной шкалы в порядковую, а затем в номинальную.
Преобразуйте переменную «Качество жилья» из порядковой шкалы в количественную, а затем в номинальную.
Объясните, почему «оценка на экзамене» - порядковая, а не количественная переменная.
Каким из методов формирования контрольной и экспериментальной группы, на ваш взгляд, необходимо воспользоваться для изучения влияния трудностей обучения в вузе в течение года на массу тела? Почему?
Допустим вы сравниваете частоту сердечных сокращений до и после экзамена. Каковы в этом случае нулевая и альтернативная гипотезы? Каковы в данном случае ошибки первого и второго рода?
В условиях предыдущего вопроса, каким способом формирования контрольной и экспериментальной группы вы бы воспользовались? Почему?
Выберите область вашей будущей специализации. Придумайте эксперимент. Сформулируйте нулевую и альтернативную гипотезу.
Как вы считаете, почему за пороговое значение Р принята величина 0,05?
Приведите примеры, когда требуется выбрать уровень ошибки первого рода отличный от 0,05 и 0,01?
Раздел III. Статистические методы обработки экспериментальных данных
Задача |
Количественные переменные, имеющие нормальное распределение |
Количественные и порядковые переменные |
Качественные переменные |
Описательные статистики |
MS или Mm |
Me, 25 и 75 персентиль |
% |
Сравнение двух независимых выборок |
Т критерий |
U критерий Манна-Уитни |
Тест Фишера, 2 |
Сравнение более двух независимых выборок |
Дисперсионный анализ Фишера |
Дисперсионный анализ Краскел-Уоллиса |
2 |
Сравнение двух зависимых выборок |
Парный Т критерий |
Критерий Вилкоксона |
Тест Мак-Немара |
Изучение взаимосвязи между признаками |
Коэффициент корреляции Пирсона |
Коэффициент корреляции Спирмена |
2 |
Предсказать изменение одного значения, если было измерено другое значение |
Простая линейная или нелинейная регрессия |
Непараметрическая регрессия |
Простая логистическая регрессия |
В данной таблице приведены основные методы, использующиеся в биологических исследованиях, в зависимости от задач исследователя. В следующих главах мы постараемся подробно описать области применения, способ расчета и интерпретацию получаемых результатов.
Проверка гипотезы о законе распределения
Большое познавательное значение имеет сопоставление фактических кривых распределения с теоретическими.
Под теоретической кривой распределения понимается графическое изображение ряда в виде непрерывной линии изменения частот в вариационном ряду, функционально связанного с изменением вариантов (значений признака). Теоретическое распределение может быть выражено аналитически - формулой, которая связывает частоты вариационного ряда и соответствующие значения признака. Такие алгебраические формулы носят название законов распределения
Гипотезы о распределениях заключаются в том, что выдвигается предположение о том, что распределение в генеральной совокупности подчиняется какому-то определенному закону. Проверка гипотезы состоит в том, чтобы на основании сравнения фактических (эмпирических) частот с предполагаемыми (теоретическими) частотами сделать вывод о соответствии фактического распределения гипотетическому распределению. Может проводиться и сравнение частостей.
Под гипотетическим распределением необязательно понимается нормальное распределение. Может быть выдвинута гипотеза о биномиальном распределении, распределении Пуассона и т.д. Причина частого обращения к нормальному распределению в том, что в этом типе распределения выражается закономерность, возникающая при взаимодействии множества случайных причин, когда ни одна из них не имеет преобладающего влияния. Закон нормального распределения лежит в основе многих теорем математической статистики, применяемых для оценки репрезентативности выборок, при измерении связей и т. д.
Итак, пусть имеется вариационный ряд. Предположим, что признак Х распределен по некоторому вероятностному закону Р.
х |
х1 |
х2 |
.... |
xk |
р |
p1 |
p2 |
..... |
pk |
По теоретическому распределению Р можно построить так называемое выравнивающие или теоретические частоты . Если отличия между теоретическими и эмпирическими частотами небольшое, то можно считать, что Х распределен по закону Р.