- •Н.К. Чертко, а.А. Карпиченко
- •Введение
- •Глава 1 элементы математической статистики
- •1.2. Генеральная совокупность и выборка
- •1.2. Обработка вариационного ряда
- •Группировка вариант в классы при дискретной изменчивости признака
- •1.3. Показатели описательной статистики
- •Статистические показатели распределения
- •Форма записи и расчета среднеквадратического отклонения
- •Сравнительная оценка состава работников предприятия
- •1.4. Оценка статистических параметров по выборочным данным
- •1.5. Теоретические функции распределения
- •1.6. Статистические критерии различия
- •Форма обработки вариант в независимых совокупностях
- •Форма обработки данных сопряженных наблюдений
- •Сравнение эмпирических и теоретических частот с использованием критерия Пирсона
- •Глава 2 дисперсионный анализ
- •2.1. Однофакторный дисперсионный анализ
- •Однофакторный дисперсионный анализ
- •Результаты однофакторного дисперсионного анализа
- •Влияние высоких доз торфа на урожай ячменя
- •2.2. Двухфакторный дисперсионный анализ
- •Двухфакторный дисперсионный комплекс
- •Результаты двухфакторного дисперсионного анализа
- •Глава 3 кластерный анализ
- •Число разбиений в зависимости от их заданной доли и вероятности
- •Число разбиений в зависимости от сочетаний числа кластеров и объектов
- •3.1. Этапы работ в кластерном анализе
- •3.2. Вроцлавская таксономия
- •Матрица таксономических метрик
- •3.3. Метод дендро-дерева б. Берри
- •Количественные показатели для зонирования города
- •Нормализованные безразмерные данные
- •Глава 4 информационный анализ
- •4.1. Показатели неопределенности объектов
- •Расчет показателя энтропии для установления оптимального времени отбора образцов
- •4.2. Применение информационного анализа в картографии
- •Решетка для вычисления информационных показателей
- •Глава 5 корреляционный анализ
- •5.1. Линейная корреляция
- •Исходные данные для расчета коэффициента корреляции
- •5.2. Нелинейная корреляция
- •Исходные данные по упругости водяного пара
- •5.3. Частная (парциальная) корреляция
- •Исходные данные для расчета коэффициентов частной корреляции
- •Итоговые значения коэффициентов корреляции
- •5.4. Понятие о множественной корреляции
- •5.5. Оценка различий коэффициентов корреляции
- •5.6. Ранговая корреляция
- •Оценка ландшафта для рекреационной цели
- •Расчет рангового коэффициента корреляции
- •Глава 6 регрессионный анализ
- •6.1. Линейная зависимость
- •Расчет данных для уравнения линейной зависимости
- •Расчет данных для определения точности выравнивания линии
- •6.2. Гиперболическая зависимость
- •Расчет данных для уравнения линейной зависимости
- •6.3. Параболическая зависимость
- •Расчет данных для уравнения параболической зависимости
- •6.4. Множественная регрессия
- •Расчет данных для уравнения линейной множественной регрессии
- •Расчет данных для критерия хи-квадрат
- •Глава 7 факторный анализ
- •7.1. Сущность и возможности применения
- •7.2. Последовательность операций
- •Корреляционная матрица r для восьми параметров агроландшафта
- •Корреляционная матрица r с приближенными значениями общностей
- •Редуцированная корреляционная матрица Rx
- •Квадрат корреляционной матрицы
- •Показатели четвертой и восьмой степени корреляционной матрицы
- •Квадрат корреляционной матрицы
- •Матрица произведений
- •Матрица первых остаточных коэффициентов корреляции r1
- •Этапы вычисления приближенных значений коэффициентов
- •Вычисление коэффициентов при факторе f2
- •Этапы вычисления приближенных значений коэффициентов
- •Глава 8 методы линейного программирования
- •8.1. Составные части общей модели линейного программирования
- •8.2. Распределительная модель линейного программирования
- •Исходные данные для землеустроительной задачи
- •8.3. Правила работы с матрицей
- •Исходные данные транспортной задачи
- •Допустимые планы перевозок грузов
- •8.4. Метод потенциалов
- •Базисный допустимый план (матрица 1)
- •Результаты первого перераспределения поставок (матрица 2)
- •Результаты второго распределения поставок (матрица 3)
- •Результаты третьего распределения поставок (матрица 4)
- •8.5. Дельта-метод Аганбегяна
- •Рабочая матрица прироста затрат
- •Первый вариант перемещения поставки
- •Второе перемещение поставки
- •Третье перемещение поставки
- •Четвертое перемещение поставки
- •8.6. Модификация моделей транспортных задач
- •8.6.1.Открытая транспортная задача
- •8.6.2. Максимизация целевой функции
- •8.6.3. Ограничения по времени транспортировки продукции
- •Учет времени перевозки продукции
- •8.6.3. Транспортно-производственная задача
- •8.6.4. Многоэтапная транспортная задача
- •Форма записи исходных данных в четырехблочную матрицу
- •8.6.5. Многопродуктовая транспортная задача
- •Мощности и спросы по торфу
- •Мощности и спросы по бурому углю
- •Оптимальный вариант распределения поставок в условных единицах
- •8.6.6. Лямбда-задача
- •Глава 9 методы теории графов
- •9.1. Элементы теории графов
- •9.2. Топологический анализ сетей
- •Матрица кратчайших расстояний между вершинами и индексы доступности вершин
- •9.3. Сетевые постановки транспортных задач
- •9.4. Сетевая постановка открытой транспортной задачи
- •9.5. Транспортно-производственная задача
- •9.6. Классификация с использованием графов
- •Выращивание сельскохозяйственных культур в разрезе областей
- •Глава 10 динамические ряды
- •Виды трендовых моделей
- •10.1. Показатели динамического ряда
- •Уровень производства промышленной продукции (пп) предприятия
- •10.2. Сглаживание динамических рядов
- •Сглаживание динамического ряда укрупнением интервалов и скользящим средним
- •10.3. Выравнивание по способу наименьших квадратов
- •Выравнивание динамического ряда по способу наименьших квадратов
- •Глава 11 математическое моделирование в географии
- •11.1. Математическое моделирование природных и общественных процессов
- •Глава 12 географическое поле
- •12.1. Операции над статистическими поверхностями
- •12.2. Методика составления карт изокоррелят
- •Литература Основная
- •Дополнительная
- •Приложения
- •1. Таблица достаточно больших чисел
- •2. Случайные числа
- •3. Значение критерия τ в зависимости от объема выборки n и уровня значимости α
- •4. Значения критерия Стьюдента t при различных уровнях значимости
- •6. Значения критерия хи-квадрат (Пирсона)
- •5. Критические значения f (критерия Фишера)
- •7. Минимальные существенные значения коэффициентов корреляции
- •8. Соотношение между r и z' для z' значений от 0 до 5*
- •9. Значения коэффициента корреляции рангов Спирмена для двусторонних пределов уровня значимости α
- •10. Алгоритм вычисление основных показателей описательной статистики и критерия Стьюдента в Microsoft Office Excel 2003
- •11. Алгоритм проведения однофакторного дисперсионного анализа в Microsoft Office Excel 2003
- •12. Алгоритм проведения корреляционного и регрессионного анализов в Microsoft Office Excel 2003
- •13. Алгоритм проведения кластерного анализа в Statsoft Statistica 6.0
- •14. Алгоритм проведения факторного анализа в Statsoft Statistica 6.0
- •15. Решение задачи на оптимальность
- •Оглавление
- •Глава 9 146
- •Глава 10 166
- •Глава 11 174
- •Глава 12 179
1.6. Статистические критерии различия
Проведение географических исследований предполагает не только изучение строения, развития, закономерностей распространения исследуемых объектов, явлений, но и установление сходства или различия между одноименными генеральными совокупностями изучаемых систем. Это зависит от условий, в которых протекает один и тот же процесс. Сопряженный анализ одноименных признаков в выборках используется для классификации и районирования по одному или нескольким параметрам. При этом возникает необходимость применения объективного метода выделения классификационных групп или районов на основе методов математической статистики с использованием критериев достоверности. Если достоверность различия между выборочными совокупностями доказана, то генеральные совокупности, сравниваемые по какому-либо признаку, выделяют как самостоятельные. В случае отсутствия достоверных различий их объединяют в одну группу.
Различие между двумя выборками устанавливается с помощью ряда критериев: t – распределение Стьюдента, наименьшего существенного различия (НСР), F – распределения Фишера, критерия соответствия (χ2).
Каждый из критериев применяется при определенных условиях, которые задаются целью исследования. Несоблюдение указанных условий может привести к ошибочным выводам.
Прежде, чем приступать к статистической обработке и расчету критериев различия, следует убедиться в отсутствии артефакта в сравниваемых выборках. Если в малых совокупностях распределение нормально, то для установления артефакта достаточно использовать правило трех сигм. Согласно этому правилу, в пределах М±3σ находится 99,7 % всех вариант выборки. Если крайние варианты попадают в этот интервал, то они включаются в статистическую выборку, так как не являются артефактом. Наличие артефакта можно проверить по формулам (1.1, 1.2).
Критерий Стьюдента. Используется для оценки сходства или различия между выборочными совокупностями по разности величин их средних арифметических (d = Mбольшая – Мменьшая) и ее отношения к ошибке этой разности (md) при условии распределения вариант в группах по закону нормального распределения и подтверждается равенство разброса вариант в выборке (близкие дисперсии сравниваемых выборок). Не допускается применения критерия в случае балльного характера сравниваемых числовых признаков.
Выбор конкретной методики оценки различий по критерию Стьюдента зависит от учета следующих особенностей выборочных совокупностей: сравниваются средние арифметические в независимых (несвязанных) выборках; различия устанавливаются в сопряженных (парных) выборках; устанавливается различие между выборочными и генеральными средними (теоретическими стандартами).
Независимые статистические совокупности могут быть получены на одном или нескольких объектах, но при одинаковых условиях проведения эксперимента: например, измерение температуры воздуха в январе в г. Бресте на протяжении нескольких лет и установление достоверных различий между этими показателями по годам исследований; сравнение экономического показателя в хозяйстве или на предприятии по пятилеткам между собой; сравнение чистого дохода в хозяйствах с одинаковым экономическим развитием, но расположенных на значительном расстоянии. При сравнении независимых выборочных совокупностей объемы выборок могут быть одинаковы (N1 = N2) или разные (N1 ≠ N2). В двух сравниваемых независимых выборках с одинаковым или разным объемом наблюдений степень свободы определяется по формуле: ν = (N1 –
–1) + (N2 – 1) = N1 + N2 – 2.
При малых объемах независимых совокупностей, если дисперсии сравниваемых выборок нельзя считать одинаковыми, число степеней свободы определяется сложнее:
ν = ,
где u = / ( +); и – ошибки среднего арифметического первой и второй выборок соответственно.
Сопряженные статистические совокупности получают на одном или на разных объектах, но в разных условиях. Например, сравнение температуры воздуха в июле и январе г. Могилева; сравнение прибыли фермерских и подсобных хозяйств в любом районе или фермерских хозяйств Витебской и Гомельской области. Объем сравниваемых выборок должен быть одинаков (N1 = N2). Определение степени свободы для сопряженных выборок определяется как: ν = Nпар – 1.
Ошибка разности между средними выборок (md) в зависимости от вида наблюдений (независимые, сопряженные) и объема наблюдений рассчитывается по разным формулам. Рассмотрим их ниже.
Вариант первый. Сравниваемые выборки имеют одинаковый объем наблюдений (N1 = N2) и независимы:
md =, (1.18)
где и – ошибка средней арифметической первой и второй выборки.
Критерий Стьюдента определяют по формуле:
t = d / md = (Mбольшая – Мменьшая) / md . (1.19)
Сопоставляя критерий Стьюдента вычисленный с табличным устанавливают или отвергают с некоторой долей уверенности различия между средними арифметическими выборок.
Пример.При исследовании глубины расчленения рельефа в Северной (х1) и Центральной (х2) провинци Беларуси необходимо установить, объединять их в один геоморфологический район по степени расчленения рельефа или различать их как самостоятельные. Исходные данные и их обработка приводятся в табл. 1.5. Из полученной информации по средним арифметическим (= 16,6 и= 15,2 м) различие по глубине расчленения рельефа можно признать как существенным, так и несущественным. Для объективных выводов используем критерий Стьюдента.
Таблица 1.5