Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МЕТОДЫ АНАЛИЗА ДАННЫХ Экзамен.doc
Скачиваний:
217
Добавлен:
06.03.2017
Размер:
93.7 Кб
Скачать

18. Построение уравнения регрессии

Построение уравнения регрессии осуществляется, как правило, методом наименьших квадратов, суть которого состоит в минимизации суммы квадратов отклонений фактических значений результатного признака от его расчётных значений.

Коэффициенты регрессии рекомендуется определять с помощью аналитических пакетов для персонального компьютера или специального финансового калькулятора.

Для эффективной обработки дискретных данных и получения регрессионных зависимостей при исследовании и моделировании технологических процессов разработан алгоритм и составлена программа, которая осуществляет статистическую обработку данных, определение коэффициентов корреляции, поиск оптимального вида функционального выражения при аппроксимации данных с произвольным числом факторов и откликов, степенью полинома, экспоненциальными и логарифмическими преобразованиями и т.д

19. Метод наименьших квадратов

Метод, применяемый для решения различных задач, основанный на минимизации суммы квадратов отклонений некоторых функций от искомых переменных. Он может использоваться для «решения» переопределенных систем уравнений (когда количество уравнений превышает количество неизвестных), для поиска решения в случае обычных (не переопределенных) нелинейных систем уравнений, для аппроксимации точечных значений некоторой функции. МНК является одним из базовых методов регрессионного анализа для оценки неизвестных параметров регрессионных моделей по выборочным данным.

20. Остаточная дисперсия

Остаточная дисперсия- вариацию результативного признака, обусловленную влиянием прочих факторов (за исключением влияния изучаемого фактора).

Остаточная (случайная) дисперсия есть сумма групповых сумм квадратов отклонений всех вариант результативного признака в группах от их средних значений.

21. Дискриминантный анализ

Дискриминантный анализ — анализ различий заранее заданных групп объектов исследования (потребителей, товаров, брендов и т.п.). Переменная, разделяющая совокупность объектов исследования на группы, называется группирующей.

С помощью дискриминантного анализа изучаются различия между двумя или более группами по определенным признакам. Признаки, используемые для выявления различий между группами, называются дискриминационными переменными. Дискриминантный анализ, как и кластерный, относится к классификационным видам анализа.

22. Кластер-анализ

Кластерный анализ представляет собой класс методов, используемых для классификации объектов или событий в относительно однородные группы, которые называют мастерами (clusters). Объекты в каждом кластере должны быть похожи между собой и отличаться от объектов в других кластерах.

Кластерный анализ используют в маркетинге для различных целей.

• Сегментация рынка.

• Понимание поведения покупателей.

• Определение возможностей нового товара.

• Выбор тестовых рынков

• Сокращение размерности данных.

23. Планирование эксперимента

Планирование эксперимента состоит из следующих разделов:

1) определение цели опыта и формы конечных результатов, выявление нерешенных вопросов;

2) выбор теоретической модели;

3) установление очередности этапов решения задания;

4) определение пространственного и временного объема исследования, а также объема выборки в тех случаях, когда применяется статистический анализ;

5) разработка программ наблюдений и планирование отдельных этапов выполнения задачи, расстановки сал и расходования средств.

24. Область применения бизнес-анализа

Сфера применения бизнес анализа весьма обширна – это и разработка концепции IT решения, и описание и реинжениринг бизнес процессов автоматизируемых предприятий, и проектирование информационных систем, а также анализ, детализация и управление требованиями на всех этапах разработки.

Основная роль аналитика на проекте – это проанализировать и систематизировать информацию и обеспечить единое понимание содержания проекта у всех задействованных в проекте лиц.

25. Стохастическая связь данных

Стохастическая связь- это связь между величинами, при которой одна из них, случайная величина у, реагирует на изменение другой величины х или других величин x1,x2,...,xn (случайных или неслучайных) изменением закона распределения. Это обусловливается тем, что зависимая переменная (результативный признак), кроме рассматриваемых независимых, подвержена влиянию ряда неучтенных или неконтролируемых (случайных) факторов, а также некоторых неизбежных ошибок измерения переменных. Поскольку значения зависимой переменной подвержены случайному разбросу, они не могут быть предсказаны с достаточной точностью, а только указаны с определенной вероятностью.

Характерной особенностью стохастических связей является то, что они проявляются во всей совокупности, а не в каждой ее единице (причем не известен ни полный перечень факторов, определяющих значение результативного признака, ни точный механизм их функционирования и взаимодействия с результативным признаком). Всегда имеет место влияние случайного. Появляющиеся различные значения зависимой переменной - реализации случайной величины.

26. Метод аналитической обработки данных в режиме реального времени (OLAP)

OLAP (англ. online analytical processing, аналитическая обработка в реальном времени) — технология обработки данных, заключающаяся в подготовке суммарной (агрегированной) информации на основе больших массивов данных, структурированных по многомерному принципу.

Имея столько разрозненных источников информации, часто бывает очень сложно получить ответы на ключевые вопросы деятельности компании и увидеть общую картину. А когда нужная информация все же находится в одной из используемых систем или локальном файле, то она часто оказывается устаревшей или противоречит информации, полученной из другой системы.

Данная проблема эффективно решается с помощью информационно-аналитических систем, построенных на базе OLAP-техологий (другие названия: OLAP-система, Система бизнес-аналитики, Business Intelligence). OLAP-системы интегрируют уже существующие системы учёта, предоставляя пользователю инструменты для анализа больших объёмов данных в реальном времени, динамического конструирования отчётов, мониторинга и прогнозирования ключевых бизнес-показателей.