Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Мат_моделир_2015_заоч_ЭП_ФИН / Корр_регр_анализ_2015_заоч.doc
Скачиваний:
40
Добавлен:
14.02.2016
Размер:
4.39 Mб
Скачать
  1. Краткие сведения из теории и компьютерной технологии

Суть корреляционно-регрессионного метода состоит в том, что на основе имеющейся информации, полученной в результате статистических наблюдений за прошлое время, составляются уравнения регрессии, представляющие собой математические модели. Они могут быть линейными и нелинейными. По математическим моделям регрессии можно прогнозировать, т.е. находить прогнозные значения результативного признака при увеличении (уменьшении) значений входящих в модель регрессии факторных признаков на 10-15%.

Уравнения регрессии в отличие от функциональных уравнений устанавливают зависимости между случайными переменными.

Во время статистических наблюдений для каждого объекта часто можно измерить (получить) значения нескольких признаков. В итоге получается многомерная выборка.

Смысл обработки многомерных выборок заключается в установлении связи между признаками. Для этого их делят на факторные и результативные. Факторный признак вызывает изменение других, связанных с ним, признаков.Результативный признак изменяется под действием факторных признаков.

Связь может быть функциональной, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака. Если зависимость проявляется не в каждом отдельном случае, а в среднем при большом числе наблюдений, то она называетсястатистической (стохастической). В этом случае в расчетах используют среднее значение признака. Частным случаем статистической связи являетсякорреляционная связь, при которой исследуется зависимость среднего значения результативного признака от факторных признаков.

1.1. Контроль исходной информации на наличие грубых ошибок и выбросов

Так как уравнения регрессии обычно используют для прогноза, то исходная информация должна быть достоверна. Поэтому прежде чем проводить сложный корреляционно-регрессионный анализ, необходимо выполнить анализ исходных данных на наличие грубых ошибок и выбросов и исключить из многомерной выборки строчки, содержащие сомнительную информацию, или провести дополнительное уточнение информации. Возможно, что специалисты разных предприятий используют различные формулы для расчета показателей производственно-хозяйственной деятельности, например, индекса снижения себестоимости продукции (диапазон значений этого показателя от 13,6 до 598,1) или допускают арифметические ошибки в расчетах. Кроме того, могут быть просто описки, которые тоже являются грубыми ошибками. Поэтому после ввода информации в память компьютера необходимо построчно просмотреть многомерную выборку и удалить строки с грубыми ошибками и выбросами (выброс - слишком большое и слишком малое значение признака в ряде его умеренно различающихся значений).

Для проверки исходной информации на наличие выбросов используют в зависимости от объема выборки критерий:

  • - критерий для выборки, содержащей более 25 элементов;

  • - критерий для выборки малого объема.

По заданию объем выборки , следовательно, экстремальные значения должны быть проверены по критерию. Расчетное значение критерия определяется по формуле:

(1)

где - выборочное среднее и- стандартное отклонение, для признака, в котором обнаружено экстремальное значение;- экстремальное значение (предполагаемый выброс). Критическое значение критерия берется по таблице 4.

Т а б л и ц а 4

Критические значения критерия

Объем выборки

Уровень значимости

=0,05

=0,01

30

2,929

3,402

50

3,082

3,539

100

3,283

3,718

1000

3,884

4,264

Если то экстремальное значениес вероятностьюне является выбросом, т.е. его нельзя исключать из выборки. В этом случае экстремальное значение объясняется проявлением изменчивости, характерной для данной генеральной совокупности.

При из многомерной выборки исключается строка с экстремальным значением.

Соседние файлы в папке Мат_моделир_2015_заоч_ЭП_ФИН