Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
дарыс кешены.docx
Скачиваний:
32
Добавлен:
17.02.2016
Размер:
520.3 Кб
Скачать

Функционалды сапалық бөліну

Элементтердің кластарға бөлудің көптеген әртүрлі әдістері бар. Сондықтан осы бөліну кезіндегі әдістердің Q(S) талдау сапасына қөңіл бөлінеді.

Сонда ең жақсы бөліну S* деп, таңдалған экстремум функционалды сапаға жетуді айтамыз. Функционалды сапаның бірін таңдау эмпирикалық ой-қабілетке жүгінеді. Кең тараған функционалды сапалық бөлінудің кейбіреуін қарастырайық.

Зерттеу метрикасы болып р Х ауданында алынсың, және S=(S1,S2,…,Sp) болса-кейбір тұрақты бөліну қарастырып жатқан Х1,...,Хn белгіленген р кластер саны S1,S2,…,Sp.

Функционалды сапаға жиі кластерішілік дисперсия суммасын («өлшенген») алады:

(9)

3. Иерархиялық кластер-процедуралар

Иерархиялық процедуралар – кластерлік талдау алгоритмінде ең кең таралған әдіс болып есептелінеді. Олар екі типте болады: агломеративтік және дивизимдік.

Агломеративтік процедураларда бірінші бөліну жүргізіледі, n бір элементтік кластан құралады, ал соңында-бір кластан; дивизимдікте-керісінше.

Иерахиялық агломеративтік (дивизимдік) процедуралар жұмысының принципі топ элементтерінің кезектік бірігуінен (бөлінуінен) тұрады, бірінші ең жақын (алыс), ал содан кейін бір-бірінен алысырақ (жақынырақ). Осы алгоритмдердің көбі матрица арақашықтығынан шығады (ұқсас).

Иерархиялық процедуралардың кемшілігіне есептеу кезіндегі көп көлемді есептеуді қажет ететіндігін жатқызуға болады. Алгоритмдер матрица арақашықтығының әр қадамында есептеуді қажет етеді, сондықтан машинаның кең көлемді сақтау қабілеті және көп уақыт қажет. Осындай алгоритмдердің санын есептеу, үлкен бірнеше жүз, мақсатқа сай емес, көптеген жағдайда мүмкін емес.

Мысал ретінде агломеративтік иерархиялық алгоритмді қарастырайық. Алгоритмнің бірінші қадамында әрбір зерттеу Хі(і=1,2,...,n) жеке кластер ретінде қарастырылады. Осыдан кейін алгоритммен жұмыстың әр қадамында екі ең жақын кластерлерді біріктіру жүргізіледі. Тұрақты арақашықтықты ескере отырып, матрица арақашықтығы формула бойынша есептеледі, оның өлшемі бірлікке дейін төмендейді. Зерттеу объектілері бір кластерге біріктірілгенде, алгоритмнің жұмысы бітеді.

Иерахиялық алгоритм классификациясын жүргізетін көптеген программалар, графикалық көріністегі шешімдер классификациясын дендрограмма түрінде көрсетеді.

14-15 дәріс

Дискриминантты талдау. Объектілерді жіктеу әдістері. Дискриминантты талдау әдісін қолдану.

Объектілер екі немесе одан да көп санатқа тиісті болғанда ДТ орындалады.

Дискриминанттық айнымалылардың құрамына қатысты шектеулер болады:

- дискриминанттық айнымалының мөлшері 0<p<(n-2) есебінен шыққан объектілер санынан асып кетпеуі керек;

- айнымалылар метрикалық өлшеммен өлшенуі тиіс;

-дискриминанттық айнымалылар коллинеарлы болмауы керек;

- оқытушы (обучающие) таңдамалар бірқалыпты үлестірілген жиыннан алынған;

- барлық класстар (санаттар) үшін коварациялық матрицаның теңдігі орындалады.

Класстар саны к=2 болғандағы ДТ алгоритмін қарастырамыз.

1. Есептің қойылымы. Х1 және Х2 екі бас жиындары және осы бас жиындардан алынған көлемі п1 және п2 , п1+п2=п таңдамалары берілген.

(1)

ДТ бағасы болып табылатын дұрыс жиынмен қарастырылған таңдаулы орташа менковариациялық матрицасы арқылы жүргізіледі.

2. Түрлердің эталонды (үлгілі) сипаттамасын құру үшін белгілер дұрыс үйлестірілгенде классификациялық оқытушы таңдамалар (хik) бойынша таңдамалы орташаны анықтаған жеткілікті.

(2) (3)

3. Класстар (санаттар) бойынша ковариациялық матрица түрін анықтаймыз

(4)

Екі класс бойынша дисперсия келесі формуламен есептеледі:

(5)

(6)

Матрицаның диагональды элементтері мына формулалар бойынша есептеледі:

(7)

(8)

М ковариациялық матрицаның сипаты көп өлшемді векторды зерттеуге тән, яғни көп өлшемді белгі бойынша ортақ және әрбір компонент бойынша жеке кездейсоқ үйлестіру деңгейі.

4. Екі класстың ковариациялық матрицасының қосындысы келесі түрге ие:

(9)

Ары қарай М кері матрицасын есептейміз.

  1. Дискриминанттық функцияның коэффициенттерін табамыз.

(10)

6. Дискриминанттық функция

(11)

Егер болса, онда Х объектісі 1-ші классқа, ал егер болса, онда 2-ші классқа жатады.