Скачиваний:
68
Добавлен:
01.05.2014
Размер:
1.4 Mб
Скачать

Министерство образования и науки РФ

Санкт-Петербургский государственный электротехнический университет «ЛЭТИ»

кафедра математического обеспечения ЭВМ

Отчет

по лабораторной работе №2

«Изучение дискриминантного анализа с помощью пакета программ STATISTICA»

по дисциплине

«Анализ и интерпретация данных»

Выполнил: студент гр. 3341 Рыжок М.С.

Проверила: Жукова Н.А.

Санкт-Петербург 2007 г.

Лабораторная работа № 2

Изучение дискриминантного анализа с помощью пакета программ "STATISTICA"

Цель работы: ознакомиться с принципами и методами дискриминантного анализа.

Задание:

  • Провести исследование по построению дискриминантных функций для имеющихся экспериментальных данных iris.txt

  • Подготовить самостоятельно модельные примеры из многомерных нормальных векторов с заданными векторами математического ожидания и ковариационной матрицей

  • Провести эксперименты по классификации на модельных примерах аналогично описанным выше. Провести теоретический расчет ошибок классификации для модельных примеров и сравнить их с результатами полученными по программе "Statistica"

Предварительные сведения :

Дискриминантный анализ используется для принятия решения о том, какие переменные различают (дискриминируют) две или более возникающие совокупности (группы). Например, некий исследователь в области образования может захотеть исследовать, какие переменные относят выпускника средней школы к одной из трех категорий: (1) поступающий в колледж, (2) поступающий в профессиональную школу или (3) отказывающийся от дальнейшего образования или профессиональной подготовки. Для этой цели исследователь может собрать данные о различных переменных, связанных с учащимися школы. После выпуска большинство учащихся естественно должно попасть в одну из названных категорий. Затем можно использовать Дискриминантный анализ для определения того, какие переменные дают наилучшее предсказание выбора учащимися дальнейшего пути.

Медик может регистрировать различные переменные, относящиеся к состоянию больного, чтобы выяснить, какие переменные лучше предсказывают, что пациент, вероятно, выздоровел полностью (группа 1), частично (группа 2) или совсем не выздоровел (группа 3). Биолог может записать различные характеристики сходных типов (групп) цветов, чтобы затем провести анализ дискриминантной функции, наилучшим образом разделяющей типы или группы.

Выполнение задания:

  1. В системе STATISTIKA в панели Statistics->Multivariate Exploratory Techniques (Методы исследования многомерных данных) выбираем пункт Dyscriminant Analysis (Дискриминантный анализ)

  2. В появившемся окне появляется панель с единственной закладкой Quick. Нажимаем кнопку Variables, в первом окне в качестве группирующей переменной указываем Сlass, во втором окне – все остальные. Указывать другую переменную в качестве группирующей нельзя, т.к. в этом случае могут получиться классы без элементов. Нажимаем Ok.

  3. Полученное окно Discriminant Function Analysis Results содержит результаты дискриминантного анализа, которые приведены ниже

Wilks' lambda

Partial lambda

F-remove(2.144)

p-level

Tolerance.

1-Toler.(R-sqr)

Длина чашелистика

0,024851

0,958492

3,11803

0,047245

0,393583

0,606417

Ширина чашелистика

0,032505

0,732791

26,25444

0,000000

0,618176

0,381824

Длина лепестка

0,035025

0,680071

33,87138

0,000000

0,438836

0,561164

Ширина лепестка

0,036108

0,659661

37,14698

0,000000

0,696851

0,303149

Обозначения

Wilk`s lambda

Переменная принимает значения от 0 (различает группы полностью) до 1 (не различает)

Partial lambda

Насколько данная переменная участвует в мощности различия в модели

F- remove

Это F – величина, связанная с соответствующей partial lambda

p-level

Показатель, находящийся в обратной зависимости от надежности результатов

Tolerance

Мера избыточности соответствующей переменной. Переменная почти полностью избыточна, если Tolerance приближается к 0

1-Tolerance

Величина, противоположная Tolerance

Матрица классификации

Percent

G_1:1

G_2:2

G_3:3

G_1:1

100,0000

50

0

0

G_2:2

96,0000

0

48

2

G_3:3

98,0000

0

1

49

Total

98,0000

50

49

51

Матрица классификации содержит число образцов, которые были классифицированы верно или, напротив, попали не в свой класс. Корректно классифицированные образцы показаны на диагонали матрицы (50 для 1 класса, 48 для второго и 50 для третьего)

Классификация фактов (случаев)

Observed

1

2

3

1

G_1:1

G_1:1

G_2:2

G_3:3

2

G_1:1

G_1:1

G_2:2

G_3:3

3

G_1:1

G_1:1

G_2:2

G_3:3

4

G_1:1

G_1:1

G_2:2

G_3:3

5

G_1:1

G_1:1

G_2:2

G_3:3

6

G_1:1

G_1:1

G_2:2

G_3:3

7

G_1:1

G_1:1

G_2:2

G_3:3

8

G_1:1

G_1:1

G_2:2

G_3:3

9

G_1:1

G_1:1

G_2:2

G_3:3

10

G_1:1

G_1:1

G_2:2

G_3:3

11

G_1:1

G_1:1

G_2:2

G_3:3

Observed

1

2

3

12

G_1:1

G_1:1

G_2:2

G_3:3

13

G_1:1

G_1:1

G_2:2

G_3:3

14

G_1:1

G_1:1

G_2:2

G_3:3

15

G_1:1

G_1:1

G_2:2

G_3:3

16

G_1:1

G_1:1

G_2:2

G_3:3

17

G_1:1

G_1:1

G_2:2

G_3:3

18

G_1:1

G_1:1

G_2:2

G_3:3

19

G_1:1

G_1:1

G_2:2

G_3:3

20

G_1:1

G_1:1

G_2:2

G_3:3

21

G_1:1

G_1:1

G_2:2

G_3:3

22

G_1:1

G_1:1

G_2:2

G_3:3

23

G_1:1

G_1:1

G_2:2

G_3:3

24

G_1:1

G_1:1

G_2:2

G_3:3

25

G_1:1

G_1:1

G_2:2

G_3:3

26

G_1:1

G_1:1

G_2:2

G_3:3

27

G_1:1

G_1:1

G_2:2

G_3:3

28

G_1:1

G_1:1

G_2:2

G_3:3

29

G_1:1

G_1:1

G_2:2

G_3:3

30

G_1:1

G_1:1

G_2:2

G_3:3

31

G_1:1

G_1:1

G_2:2

G_3:3

32

G_1:1

G_1:1

G_2:2

G_3:3

33

G_1:1

G_1:1

G_2:2

G_3:3

34

G_1:1

G_1:1

G_2:2

G_3:3

35

G_1:1

G_1:1

G_2:2

G_3:3

36

G_1:1

G_1:1

G_2:2

G_3:3

37

G_1:1

G_1:1

G_2:2

G_3:3

38

G_1:1

G_1:1

G_2:2

G_3:3

39

G_1:1

G_1:1

G_2:2

G_3:3

40

G_1:1

G_1:1

G_2:2

G_3:3

41

G_1:1

G_1:1

G_2:2

G_3:3

42

G_1:1

G_1:1

G_2:2

G_3:3

43

G_1:1

G_1:1

G_2:2

G_3:3

44

G_1:1

G_1:1

G_2:2

G_3:3

45

G_1:1

G_1:1

G_2:2

G_3:3

46

G_1:1

G_1:1

G_2:2

G_3:3

47

G_1:1

G_1:1

G_2:2

G_3:3

48

G_1:1

G_1:1

G_2:2

G_3:3

49

G_1:1

G_1:1

G_2:2

G_3:3

50

G_1:1

G_1:1

G_2:2

G_3:3

51

G_2:2

G_2:2

G_3:3

G_1:1

52

G_2:2

G_2:2

G_3:3

G_1:1

53

G_2:2

G_2:2

G_3:3

G_1:1

54

G_2:2

G_2:2

G_3:3

G_1:1

55

G_2:2

G_2:2

G_3:3

G_1:1

56

G_2:2

G_2:2

G_3:3

G_1:1

57

G_2:2

G_2:2

G_3:3

G_1:1

58

G_2:2

G_2:2

G_3:3

G_1:1

59

G_2:2

G_2:2

G_3:3

G_1:1

60

G_2:2

G_2:2

G_3:3

G_1:1

61

G_2:2

G_2:2

G_3:3

G_1:1

62

G_2:2

G_2:2

G_3:3

G_1:1

63

G_2:2

G_2:2

G_3:3

G_1:1

64

G_2:2

G_2:2

G_3:3

G_1:1

65

G_2:2

G_2:2

G_3:3

G_1:1

66

G_2:2

G_2:2

G_3:3

G_1:1

67

G_2:2

G_2:2

G_3:3

G_1:1

68

G_2:2

G_2:2

G_3:3

G_1:1

69

G_2:2

G_2:2

G_3:3

G_1:1

70

G_2:2

G_2:2

G_3:3

G_1:1

71*

G_2:2

G_3:3

G_2:2

G_1:1

72

G_2:2

G_2:2

G_3:3

G_1:1

73

G_2:2

G_2:2

G_3:3

G_1:1

74

G_2:2

G_2:2

G_3:3

G_1:1

75

G_2:2

G_2:2

G_3:3

G_1:1

76

G_2:2

G_2:2

G_3:3

G_1:1

77

G_2:2

G_2:2

G_3:3

G_1:1

78

G_2:2

G_2:2

G_3:3

G_1:1

79

G_2:2

G_2:2

G_3:3

G_1:1

80

G_2:2

G_2:2

G_3:3

G_1:1

81

G_2:2

G_2:2

G_3:3

G_1:1

82

G_2:2

G_2:2

G_3:3

G_1:1

83*

G_2:2

G_3:3

G_2:2

G_1:1

84

G_2:2

G_2:2

G_3:3

G_1:1

85

G_2:2

G_2:2

G_3:3

G_1:1

86

G_2:2

G_2:2

G_3:3

G_1:1

87

G_2:2

G_2:2

G_3:3

G_1:1

88

G_2:2

G_2:2

G_3:3

G_1:1

89

G_2:2

G_2:2

G_3:3

G_1:1

90

G_2:2

G_2:2

G_3:3

G_1:1

91

G_2:2

G_2:2

G_3:3

G_1:1

92

G_2:2

G_2:2

G_3:3

G_1:1

93

G_2:2

G_2:2

G_3:3

G_1:1

94

G_2:2

G_2:2

G_3:3

G_1:1

95

G_2:2

G_2:2

G_3:3

G_1:1

96

G_2:2

G_2:2

G_3:3

G_1:1

97

G_2:2

G_2:2

G_3:3

G_1:1

98

G_2:2

G_2:2

G_3:3

G_1:1

99

G_2:2

G_2:2

G_3:3

G_1:1

100

G_2:2

G_2:2

G_3:3

G_1:1

101

G_3:3

G_3:3

G_2:2

G_1:1

102

G_3:3

G_3:3

G_2:2

G_1:1

103

G_3:3

G_3:3

G_2:2

G_1:1

104

G_3:3

G_3:3

G_2:2

G_1:1

105

G_3:3

G_3:3

G_2:2

G_1:1

106

G_3:3

G_3:3

G_2:2

G_1:1

107

G_3:3

G_3:3

G_2:2

G_1:1

108

G_3:3

G_3:3

G_2:2

G_1:1

109

G_3:3

G_3:3

G_2:2

G_1:1

110

G_3:3

G_3:3

G_2:2

G_1:1

111

G_3:3

G_3:3

G_2:2

G_1:1

112

G_3:3

G_3:3

G_2:2

G_1:1

113

G_3:3

G_3:3

G_2:2

G_1:1

114

G_3:3

G_3:3

G_2:2

G_1:1

115

G_3:3

G_3:3

G_2:2

G_1:1

116

G_3:3

G_3:3

G_2:2

G_1:1

117

G_3:3

G_3:3

G_2:2

G_1:1

118

G_3:3

G_3:3

G_2:2

G_1:1

119

G_3:3

G_3:3

G_2:2

G_1:1

120

G_3:3

G_3:3

G_2:2

G_1:1

121

G_3:3

G_3:3

G_2:2

G_1:1

122

G_3:3

G_3:3

G_2:2

G_1:1

123

G_3:3

G_3:3

G_2:2

G_1:1

124

G_3:3

G_3:3

G_2:2

G_1:1

125

G_3:3

G_3:3

G_2:2

G_1:1

126

G_3:3

G_3:3

G_2:2

G_1:1

127

G_3:3

G_3:3

G_2:2

G_1:1

128

G_3:3

G_3:3

G_2:2

G_1:1

129

G_3:3

G_3:3

G_2:2

G_1:1

130

G_3:3

G_3:3

G_2:2

G_1:1

131

G_3:3

G_3:3

G_2:2

G_1:1

132

G_3:3

G_3:3

G_2:2

G_1:1

133

G_3:3

G_3:3

G_2:2

G_1:1

134*

G_3:3

G_2:2

G_3:3

G_1:1

135

G_3:3

G_3:3

G_2:2

G_1:1

136

G_3:3

G_3:3

G_2:2

G_1:1

137

G_3:3

G_3:3

G_2:2

G_1:1

138

G_3:3

G_3:3

G_2:2

G_1:1

139

G_3:3

G_3:3

G_2:2

G_1:1

140

G_3:3

G_3:3

G_2:2

G_1:1

141

G_3:3

G_3:3

G_2:2

G_1:1

142

G_3:3

G_3:3

G_2:2

G_1:1

143

G_3:3

G_3:3

G_2:2

G_1:1

144

G_3:3

G_3:3

G_2:2

G_1:1

145

G_3:3

G_3:3

G_2:2

G_1:1

146

G_3:3

G_3:3

G_2:2

G_1:1

147

G_3:3

G_3:3

G_2:2

G_1:1

148

G_3:3

G_3:3

G_2:2

G_1:1

149

G_3:3

G_3:3

G_2:2

G_1:1

150

G_3:3

G_3:3

G_2:2

G_1:1

Соседние файлы в папке Лабораторная работа 2
  • #
    01.05.2014119.3 Кб42IRIS_1.stw
  • #
    01.05.201438.91 Кб42Learning.stw
  • #
    01.05.20142.65 Кб43Macro3.svb
  • #
    01.05.201411.26 Кб42Spreadsheet15.sta
  • #
    01.05.2014144.9 Кб42Vector Discriminant Analysys Result.stw
  • #
    01.05.20141.4 Mб68АИД_02.doc
  • #
    01.05.201411.26 Кб45Нормальные вектора.sta