Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
УД_МУ к ЛР 5.doc
Скачиваний:
11
Добавлен:
20.11.2019
Размер:
29.48 Mб
Скачать

Теория и практический пример выполнения лабораторной работы 5

Тема: Анализ данных (частотный и корреляционный анализ).

Метод «Деревья решений

На примере ранка предложений керамической плитки

Введение

Для осуществления анализа данных для рынка керамической плитки требуется создать базу данных, которая отражает количественные и качественные характеристики компонентов модели. База данных строится на основе данных, полученных методом статистики.

Основной характеристикой современной действительности является острый недостаток правильной и проверенной информации, важной для принятия управленческого решения. При этом многие фирмы из-за отсутствия, неполноты или неточности информации, либо присутствия большого количества ненужных или устаревших данных значительно снижают адекватность составления долгосрочных прогнозов и стратегических планов развития фирмы.

Для достижения поставленной цели исследования, были проанализированы прайс-листы и информация на сайтах нескольких фирм керамической плитки. Были сравнены цены и выбор, предоставляемый той или иной фирмой. На основе полученных данных нами была создана база данных в программе SPSS и Deductor.

Полученные данные были обработаны с помощью программы SPSS и Deductor и проанализированы, с помощью построения таблиц и расчета коэффициентов корреляции.

Для решения поставленных проблем были выбраны 5 фирм-производителей керамической плитки (отечественных и зарубежных (иностранных)):

1) Imola Ceramica

2) ARKIM

3) KERAMA MARAZZI

4) FLOOR GRES (Италия)

5) Eiffelgres (Италия)

На основании анализа прайс-листов были выбраны 200 различных видов керамической плитки и 15 признаков, по которым можно охарактеризовать выбранную плитку (см. приложение А).

1. Проведение частотного анализа и выявление корреляционных связей между признаками описание метода частотный анализ

После формирования матрицы данных можно приступить к статистическому анализу данных, первым этапом которого является частотный анализ.

В названии этого метода используется понятие частота, которая указывает на то что, прежде всего, будет учитываться вопрос как часто или какую долю составляет данный объекты его характеристика относительно общего множества. Частотный анализ предполагает вычисление описательных статистик. К ним относятся:

1) Квартили (Quarticls).

2) Процентили (Percentiles) – это процентное отношение, которое определяется непосредственно пользователем.

3) Разброс (Dispersion).

а) стандартное отклонение- это мера разброса измеренных величин = квадратный корень из дисперсии.

б) Дисперсия.

в) Размах – разница м/д максимальным и минимальным значениями.

г) Стандартная ошибка – измеряется как стандартное отклонение/на квадратный корень из объема выборки

4) Среднее (Central).

К этой группе относятся: среднее значение, медиана, мода

5) Распределение (Distribution).

а) коэффициент асимметрии

б) коэффициент вариации

Описание метода корреляционный анализ

Корреляционный анализ применяется для оценки зависимости выходных полей данных от входных факторов и устранения незначащих факторов. Принцип корреляционного анализа состоит в поиске таких значений, которые в наименьшей степени коррелированы (взаимосвязаны) с выходным результатом. Такие факторы могут быть исключены из результирующего набора данных практически без потери полезной информации. Критерием принятия решения об исключении является порог значимости. Если корреляция (степень взаимозависимости) между входным и выходным факторами меньше порога значимости, то соответствующий фактор отбрасывается как незначащий.

Статистик говорит о корреляции между двумя переменными и указывает силу связи при помощи некоторого критерия взаимосвязи, который получил название коэффициента корреляции. Этот коэффициент, всегда обозначаемый латинской буквой г, может принимать значения между -1 и +1, причём если значение находится ближе к 1, то это означает наличие сильной связи, а если ближе к 0, то слабой.

Если коэффициент корреляции отрицательный, это означает наличие противоположной связи: чем выше значение одной переменной, тем ниже значение другой. Сила связи характеризуется также и абсолютной величиной коэффициента корреляции. Метод вычисления коэффициента корреляции зависит от вида шкалы, которой относятся переменные.

Переменные с интервальной и с номинальной шкалой: коэффициент корреляции Пирсона (корреляция моментов произведений).

По меньшей мере, одна из двух переменных имеет порядковую шкалу либо не является нормально распределённой: ранговая корреляция по Спирману или т (тау-грого-соая) Кендала. Одна из двух переменных является дихотомической: точечная двухрядная корреляция. Эта возможность в SPSS отсутствует. Вместо этого может быть применён расчёт ранговой корреляции. Обе переменные являются дихотомическими: четырёхполевая корреляция. Данный вид корреляции рассчитываются в SPSS на основании определения мер расстояния и мер сходства. Расчёт коэффициента корреляции между двумя недихотомическими переменными не лишён смысла только тогда, кода связь между ними линейна (однонаправлена). Если связь, к примеру, U-образная (неоднозначная), то коэффициент корреляции непригоден для использования в качестве меры силы связи: его значение стремится к нулю. В следующих разделах будут рассмотрены корреляции по Пирсону, Спирману и Кендалу. Ешё один раздел специально посвящён частной корреляции.[12]

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]