- •Министерство науки и образования Украины
- •Введение
- •Развить навыки защиты выполненной работы.
- •Исходные данные варианта 17
- •Содержание пояснительной записки:
- •Защита работы
- •Содержание и последовательность выполнения работы
- •Краткие сведения из теории и компьютерной технологии
- •1.1. Контроль исходной информации на наличие грубых ошибок и выбросов
- •1.2. Проверка соответствия исследуемых признаков нормальному закону распределения
- •1.4. Регрессионный анализ статистических данных
- •1.4.1. Парный линейный регрессионный анализ
- •1.4.2. Парный нелинейный регрессионный анализ
- •1.4.3. Многомерный линейный регрессионный анализ
- •1.4.4. Многомерный нелинейный регрессионный анализ
- •1.5. Критерии оценки качества модели регрессии
- •1.6. Прогнозирование на основе уравнения регрессии
- •1.7. Экономический смысл параметров модели регрессии
- •2. Пример выполнения задания
- •Контроль исходной информации на наличие грубых ошибок и выбросов
- •Проверка соответствия исследуемых признаков нормальному закону распределения
- •Корреляционный анализ данных наблюдений
- •Парный линейный регрессионный анализ
- •Выходная информация инструмента «Регрессия»
- •Анализ качества модели регрессии
- •Парный нелинейный регрессионный анализ
- •Многомерный линейный регрессионный анализ
- •Многомерный нелинейный регрессионный анализ
- •Прогнозирование на основе методов оптимизации
- •Целевая функция
- •Целевая функция
- •Постановка задач оптимизации для принятия решений внутри выборки
- •Список литературы
Краткие сведения из теории и компьютерной технологии
Суть корреляционно-регрессионного метода состоит в том, что на основе имеющейся информации, полученной в результате статистических наблюдений за прошлое время, составляются уравнения регрессии, представляющие собой математические модели. Они могут быть линейными и нелинейными. По математическим моделям регрессии можно прогнозировать, т.е. находить прогнозные значения результативного признака при увеличении (уменьшении) значений входящих в модель регрессии факторных признаков на 10-15%.
Уравнения регрессии в отличие от функциональных уравнений устанавливают зависимости между случайными переменными.
Во время статистических наблюдений для каждого объекта часто можно измерить (получить) значения нескольких признаков. В итоге получается многомерная выборка.
Смысл обработки многомерных выборок заключается в установлении связи между признаками. Для этого их делят на факторные и результативные. Факторный признак вызывает изменение других, связанных с ним, признаков.Результативный признак изменяется под действием факторных признаков.
Связь может быть функциональной, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака. Если зависимость проявляется не в каждом отдельном случае, а в среднем при большом числе наблюдений, то она называетсястатистической (стохастической). В этом случае в расчетах используют среднее значение признака. Частным случаем статистической связи являетсякорреляционная связь, при которой исследуется зависимость среднего значения результативного признака от факторных признаков.
1.1. Контроль исходной информации на наличие грубых ошибок и выбросов
Так как уравнения регрессии обычно используют для прогноза, то исходная информация должна быть достоверна. Поэтому прежде чем проводить сложный корреляционно-регрессионный анализ, необходимо выполнить анализ исходных данных на наличие грубых ошибок и выбросов и исключить из многомерной выборки строчки, содержащие сомнительную информацию, или провести дополнительное уточнение информации. Возможно, что специалисты разных предприятий используют различные формулы для расчета показателей производственно-хозяйственной деятельности, например, индекса снижения себестоимости продукции (диапазон значений этого показателя от 13,6 до 598,1) или допускают арифметические ошибки в расчетах. Кроме того, могут быть просто описки, которые тоже являются грубыми ошибками. Поэтому после ввода информации в память компьютера необходимо построчно просмотреть многомерную выборку и удалить строки с грубыми ошибками и выбросами (выброс - слишком большое и слишком малое значение признака в ряде его умеренно различающихся значений).
Для проверки исходной информации на наличие выбросов используют в зависимости от объема выборки критерий:
- критерий для выборки, содержащей более 25 элементов;
- критерий для выборки малого объема.
По заданию объем выборки , следовательно, экстремальные значения должны быть проверены по критерию. Расчетное значение критерия определяется по формуле:
(1)
где - выборочное среднее и- стандартное отклонение, для признака, в котором обнаружено экстремальное значение;- экстремальное значение (предполагаемый выброс). Критическое значение критерия берется по таблице 4.
Т а б л и ц а 4
Критические значения критерия
Объем выборки |
Уровень значимости | |
=0,05 |
=0,01 | |
30 |
2,929 |
3,402 |
50 |
3,082 |
3,539 |
100 |
3,283 |
3,718 |
1000 |
3,884 |
4,264 |
Если то экстремальное значениес вероятностьюне является выбросом, т.е. его нельзя исключать из выборки. В этом случае экстремальное значение объясняется проявлением изменчивости, характерной для данной генеральной совокупности.
При из многомерной выборки исключается строка с экстремальным значением.