Функции классификации

Функции классификации. Функции классификации предназначены для определения того, к какой группе наиболее вероятно может быть отнесен каждый объект. Имеется столько же функций классификации, сколько групп. Каждая функция позволяет вам для каждого образца и для каждой совокупности вычислить веса классификации по формуле:

S_i = c_i + w_i1*x₁ + w_i2*x₂ + ... + w_im*x_m

В этой формуле индекс i обозначает соответствующую совокупность, а индексы 1, 2, ..., m обозначают m переменных; c_i являются константами для i-ой совокупности, w_ij - веса для j-ой переменной при вычислении показателя классификации для i-ой совокупности; x_j - наблюдаемое значение для соответствующего образца j-ой переменной. Величина S_i является результатом показателя классификации. Переменные с наибольшими регрессионными коэффициентами вносят наибольший вклад в дискриминацию

	G_1:1	G_2:2	G_3:3
Длина чашелистика	21,6680	15,7141	13,153
Ширина чашелистика	24,5093	6,9262	3,159
Длина лепестка	-13,4189	5,2140	11,668
Ширина лепестка	-20,6124	6,9767	22,958
Constant	-84,9980	-73,1145	-104,768

Расстояние Махалонобиса

В общем, расстояние Махаланобиса является мерой расстояния между двумя точками в пространстве, определяемым двумя или более коррелированными переменными. Например, если имеются всего две некоррелированных переменные, то можно нанести точки (образцы) на стандартную диаграмму рассеяния. Расстояние Махаланобиса между точками будет в этом случае равно расстоянию Евклида, т.е. расстоянию, измеренному, например, рулеткой. Если имеются три некоррелированные переменные, то для определения расстояния вы можно по-прежнему использовать рулетку (на 3М диаграмме). При наличии более трех переменных вы не можете более представить расстояние на диаграмме. Также и в случае, когда переменные коррелированы, то оси на графике могут рассматриваться как неортогональные (они уже не направлены под прямыми углами друг к другу). В этом случае простое определение расстояния Евклида не подходит, в то время как расстояние Махаланобиса является адекватно определенным в случае наличия корреляций.

Для каждой совокупности(класса) в выборке можно определить положение точки, представляющей средние для всех переменных в многомерном пространстве, определенном переменными рассматриваемой модели. Эти точки называются центроидами группы. Для каждого наблюдения вы можете затем вычислить его расстояние Махаланобиса от каждого центроида группы. Снова, вы признаете наблюдение принадлежащим к той группе, к которой он ближе, т.е. когда расстояние Махаланобиса до нее минимально

	G_1:1	G_2:2	G_3:3
G_1:1	0,0000	90,13914	179,9831
G_2:2	90,1391	0,00000	17,3041
G_3:3	179,9831	17,30407	0,0000

<<< < Предыдущая 12 / 72 3 4 5 6 7 > Следующая >>>

Соседние файлы в папке Лабораторная работа 2

#
01.05.2014119.3 Кб42IRIS_1.stw
#
01.05.201438.91 Кб42Learning.stw
#
01.05.20142.65 Кб43Macro3.svb
#
01.05.201411.26 Кб42Spreadsheet15.sta
#
01.05.2014144.9 Кб42Vector Discriminant Analysys Result.stw
#
01.05.20141.4 Mб68АИД_02.doc
#
01.05.201411.26 Кб45Нормальные вектора.sta