- •Обозначения
- •Классификация фактов (случаев)
- •Функции классификации
- •Расстояние Махалонобиса
- •Пошаговый дискриминантный анализ
- •Пошаговый анализ с включением
- •Пошаговый анализ с исключением
- •Разработка статистической модели данных
- •Напишем макрос, который заполнит таблицу с векторами
- •Подвергнем данные дискриминантному анализу
- •Теоретический расчет ошибок классификации для модели
Министерство образования и науки РФ
Санкт-Петербургский государственный электротехнический университет «ЛЭТИ»
кафедра математического обеспечения ЭВМ
Отчет
по лабораторной работе №2
«Изучение дискриминантного анализа с помощью пакета программ STATISTICA»
по дисциплине
«Анализ и интерпретация данных»
Выполнил: студент гр. 3341 Рыжок М.С.
Проверила: Жукова Н.А.
Санкт-Петербург 2007 г.
Лабораторная работа № 2
Изучение дискриминантного анализа с помощью пакета программ "STATISTICA"
Цель работы: ознакомиться с принципами и методами дискриминантного анализа.
Задание:
-
Провести исследование по построению дискриминантных функций для имеющихся экспериментальных данных iris.txt
-
Подготовить самостоятельно модельные примеры из многомерных нормальных векторов с заданными векторами математического ожидания и ковариационной матрицей
-
Провести эксперименты по классификации на модельных примерах аналогично описанным выше. Провести теоретический расчет ошибок классификации для модельных примеров и сравнить их с результатами полученными по программе "Statistica"
Предварительные сведения :
Дискриминантный анализ используется для принятия решения о том, какие переменные различают (дискриминируют) две или более возникающие совокупности (группы). Например, некий исследователь в области образования может захотеть исследовать, какие переменные относят выпускника средней школы к одной из трех категорий: (1) поступающий в колледж, (2) поступающий в профессиональную школу или (3) отказывающийся от дальнейшего образования или профессиональной подготовки. Для этой цели исследователь может собрать данные о различных переменных, связанных с учащимися школы. После выпуска большинство учащихся естественно должно попасть в одну из названных категорий. Затем можно использовать Дискриминантный анализ для определения того, какие переменные дают наилучшее предсказание выбора учащимися дальнейшего пути.
Медик может регистрировать различные переменные, относящиеся к состоянию больного, чтобы выяснить, какие переменные лучше предсказывают, что пациент, вероятно, выздоровел полностью (группа 1), частично (группа 2) или совсем не выздоровел (группа 3). Биолог может записать различные характеристики сходных типов (групп) цветов, чтобы затем провести анализ дискриминантной функции, наилучшим образом разделяющей типы или группы.
Выполнение задания:
-
В системе STATISTIKA в панели Statistics->Multivariate Exploratory Techniques (Методы исследования многомерных данных) выбираем пункт Dyscriminant Analysis (Дискриминантный анализ)
-
В появившемся окне появляется панель с единственной закладкой Quick. Нажимаем кнопку Variables, в первом окне в качестве группирующей переменной указываем Сlass, во втором окне – все остальные. Указывать другую переменную в качестве группирующей нельзя, т.к. в этом случае могут получиться классы без элементов. Нажимаем Ok.
-
Полученное окно Discriminant Function Analysis Results содержит результаты дискриминантного анализа, которые приведены ниже
|
Wilks' lambda |
Partial lambda |
F-remove(2.144) |
p-level |
Tolerance. |
1-Toler.(R-sqr) |
Длина чашелистика |
0,024851 |
0,958492 |
3,11803 |
0,047245 |
0,393583 |
0,606417 |
Ширина чашелистика |
0,032505 |
0,732791 |
26,25444 |
0,000000 |
0,618176 |
0,381824 |
Длина лепестка |
0,035025 |
0,680071 |
33,87138 |
0,000000 |
0,438836 |
0,561164 |
Ширина лепестка |
0,036108 |
0,659661 |
37,14698 |
0,000000 |
0,696851 |
0,303149 |
Обозначения
Wilk`s lambda |
Переменная принимает значения от 0 (различает группы полностью) до 1 (не различает) |
Partial lambda |
Насколько данная переменная участвует в мощности различия в модели |
F- remove |
Это F – величина, связанная с соответствующей partial lambda |
p-level |
Показатель, находящийся в обратной зависимости от надежности результатов |
Tolerance |
Мера избыточности соответствующей переменной. Переменная почти полностью избыточна, если Tolerance приближается к 0 |
1-Tolerance |
Величина, противоположная Tolerance |
Матрица классификации
|
Percent |
G_1:1 |
G_2:2 |
G_3:3 |
G_1:1 |
100,0000 |
50 |
0 |
0 |
G_2:2 |
96,0000 |
0 |
48 |
2 |
G_3:3 |
98,0000 |
0 |
1 |
49 |
Total |
98,0000 |
50 |
49 |
51 |
Матрица классификации содержит число образцов, которые были классифицированы верно или, напротив, попали не в свой класс. Корректно классифицированные образцы показаны на диагонали матрицы (50 для 1 класса, 48 для второго и 50 для третьего)
Классификация фактов (случаев)
|
Observed |
1 |
2 |
3 |
1 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
2 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
3 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
4 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
5 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
6 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
7 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
8 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
9 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
10 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
11 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
|
Observed |
1 |
2 |
3 |
12 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
13 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
14 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
15 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
16 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
17 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
18 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
19 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
20 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
21 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
22 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
23 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
24 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
25 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
26 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
27 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
28 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
29 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
30 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
31 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
32 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
33 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
34 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
35 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
36 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
37 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
38 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
39 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
40 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
41 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
42 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
43 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
44 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
45 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
46 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
47 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
48 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
49 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
50 |
G_1:1 |
G_1:1 |
G_2:2 |
G_3:3 |
51 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
52 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
53 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
54 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
55 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
56 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
57 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
58 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
59 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
60 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
61 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
62 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
63 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
64 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
65 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
66 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
67 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
68 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
69 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
70 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
71* |
G_2:2 |
G_3:3 |
G_2:2 |
G_1:1 |
72 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
73 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
74 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
75 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
76 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
77 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
78 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
79 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
80 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
81 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
82 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
83* |
G_2:2 |
G_3:3 |
G_2:2 |
G_1:1 |
84 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
85 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
86 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
87 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
88 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
89 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
90 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
91 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
92 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
93 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
94 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
95 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
96 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
97 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
98 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
99 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
100 |
G_2:2 |
G_2:2 |
G_3:3 |
G_1:1 |
101 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
102 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
103 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
104 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
105 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
106 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
107 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
108 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
109 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
110 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
111 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
112 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
113 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
114 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
115 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
116 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
117 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
118 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
119 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
120 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
121 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
122 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
123 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
124 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
125 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
126 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
127 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
128 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
129 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
130 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
131 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
132 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
133 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
134* |
G_3:3 |
G_2:2 |
G_3:3 |
G_1:1 |
135 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
136 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
137 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
138 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
139 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
140 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
141 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
142 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
143 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
144 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
145 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
146 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
147 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
148 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
149 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |
150 |
G_3:3 |
G_3:3 |
G_2:2 |
G_1:1 |