Добавил:

Studfiles2 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Анализ и интерпретация данных

Файл:

Классификация / glava1_2 / p44_56.doc

Скачиваний:

Добавлен:

01.05.2014

Размер:

493.06 Кб

Скачать

☆

<<< < Предыдущая 12 / 32 3 > Следующая >>>

§ 4. Классификация с частичным обучением. Параметрический случай

В области социально-экономических исследований сравнительно распространены ситуации, в которых исследователю неизвестно заранее сколько типов (классов, объектов) представлено в изучаемой выборке

однако, предварительные сведения или специальные экспертные оценки помогают выделить определенные, как правило, небольшие «порции» данных вида {X_j} из выборки {X_j} или помимо нее, о каждой из которых известно, что эта порция представляет лишь один какой-то класс.

Учитывая определение частичной обучающей выборки, данное в § 1 настоящей главы, естественно назвать подобные задачи классификацией при наличии частичного обучения. В этом параграфе мы рассмотрим процедуру классификации на неизвестное число классов при наличии частичного обучения и ее свойства применительно к одной частной схеме.

Предположим, что каждый из векторов наблюдений X_j исследуемой выборки извлечен из какой-то нормальной генеральной совокупности, принадлежащей семейству

где

вектор средних значений, а - матрица ковариаций компонент исследуемых случайных величинX_i, общая для всех рассматриваемых генеральных совокупностей. Предположим также, что , где, как и прежде,m - общее число наблюдений, составляющих s частичных обучающих выборок.

Введем в рассмотрение априорные вероятности _l (l = 1, 2, ....K) появления объекта l-го класса, или иначе _l - это удельный вес l -го класса среди всех исследуемых классов. При этом, вообще говоря, a_l, , K и _l (l = 1, 2, ....K) нам неизвестны, а K может быть и +. Будем для определенности предполагать, что наблюдения, участвующие в частичных обучающих выборках, не входят в состав исследуемой выборки {X_j}. Этого всегда можно добиться с помощью предварительного исключения этих наблюдений из состава выборки {X_j}.

1. Описание процедуры классификации

Следуя [9] и [15], определим понятие минимального дистанционного разбиения

относительно заданных центров

и заданного числа классов k. Выше и далее Z_i - вектор в рассматриваемом нами р-мерном пространстве R⁽^p⁾ с заданной в нем метрикой . В соответствии с этим разбиением класс S_i(Z) состоит из точек пространства R⁽^p⁾, ближайших в смысле метрики  к Z_i, причем точки, равноотстоящие от нескольких центров Z_i, относятся к классу с наименьшим индексом. Так что, если ввести множества^¹

то

Пусть v - номер шага процедуры классификации, что в нашем случае совпадает с текущим номером последовательно извлекаемых из {X_j} наблюдений Х_v.

Сущность описываемой процедуры в предварительном (по v) уточнении «центров тяжести» классов

и их числа k(v), а затем использование получаемой на последнем n-м шаге последовательности центров Z⁽ⁿ⁾ для образования классов

с помощью определенного выше минимального дистанционного разбиения .

Введем в рассмотрение - расстояние махаланобисского типа между случайными векторамиХ и Y в исследуемом p-мерном пространстве R⁽^p⁾.

где  - ковариационная матрица и для Х и для Y.

Пусть - оценка максимального правдоподобия с устраненным смещением для, построенная по совокупности частичных обучающих ,выборок, ,

арифметическое среднее v_i(v) наблюдений, выбранных некоторым образом из v первых членов последовательности {X_j}, причем, вообще говоря, , гдеа_il - какие-то векторы средних, возможно и повторяющихся, из числа а_j (j = 1, 2, ...,K), ранее рассмотренных. И, наконец, обозначим

где v_i(v) - число точек из последовательности , участвующих в вычислении переменного центра тяжестиi-го класса Z_iv

На первом шаге процедуры из случайной последовательности берется X_i и принимается в качестве центра первого класса, т. е. при v = 1, k(1) = 1 и .

На втором шаге процедуры (v = 2) извлекаем X₂ и подсчитываем

Если , где- 100%-ная точка центрального F-распределения с числами степеней свободы числителя и знаменателя соответственно q и r, то X₂ принимается в качестве центра второго класса, т. е. k(2) = 2 и

Если же , тоX₂ присоединяется к первому классу, центр которого пересчитывается

и, следовательно, k(2) = 1, .

На (v + 1)-м шаге процедуры вначале подсчитывается величина

Если

то

и переходит к следующему шагу, т. е. к рассмотрению точки X_v₊₂.

Если же , то точка X_v₊₁ относится к i₀-му классу, центр которого пересчитывается по формуле

Этап А. Положив в остальных классах

подсчитываем величины , j = 1, 2, ...,k(v), . Если окажется, что

, (1.13)

то полагают

, (i = 1, 2, …, k(v))

и переходят к следующему шагу, т. е. к рассмотрению точки X_v₊₂. Если же

то центр тяжести класса с номером i = min (i₀, j₀) пересчитывается по формуле

а для ипричем классам с порядковыми номерамиприсваиваются номера на единицу меньшие (за счет «исчезновения» класса с порядковым номером, равным). Далее повторяется процедураА с заменой i₀ на i и надо тех пор, пока не окажется выполненным соотношение (1.13), либо не останется всего лишь один класс.

Последним (n + 1)-м шагом процедуры является реализация минимального дистанционного разбиения относительноk(n) - точки Z⁽ⁿ⁾, полученной на предыдущем шаге.

Замечание 1. При сравнительно небольших объемах исследуемых выборок n можно использовать один из двух, или оба сразу вспомогательных приема:

циклическое продолжение выборки, т. е. реализация описанной процедуры на искусственно удлиненных последовательностях вида

<<< < Предыдущая 12 / 32 3 > Следующая >>>

Соседние файлы в папке glava1_2

#
01.05.20142 Mб58P12_43.DOC
#
01.05.2014493.06 Кб57p44_56.doc
#
01.05.2014672.77 Кб60p57_74.doc