Скачиваний:
58
Добавлен:
01.05.2014
Размер:
2 Mб
Скачать

Глава 1

КЛАССИФИКАЦИЯ

ПРИ ПОЛНОСТЬЮ ОПИСАННЫХ КЛАССАХ

ИЛИ ПРИ НАЛИЧИИ ОБУЧАЮЩИХ ВЫБОРОК

§ I. Основные понятия. Терминология1

1. Многомерная случайная величина - ее наблюдаемые значения

Во многих практических задачах исследователю приходится фиксировать одновременно значения несколькихколичественных признаковна обследуемом объекте, причем каждый из этих признаков подвержен некоторому неконтролируемому разбросу при переходе от одного объекта к другому, какими бы идентичными между собой не представлялись нам эти объекты. Так, например, исследуя совершенно однородные (по среднедушевому доходу и социально-демографической структуре) семьи с точки зрения структуры их бюджета потребления, т. е. подразумевая под, например, среднедушевую характеристику потребления хлебобулочных изделий, под- потребление молочных продуктов, по- потребление мясных продуктов, под- потребление определенного вида благ и т. д., в рублях, обнаружим, что при переходе от обследования одной семьи к другой каждый из измеряемых признаков обнаруживает некоторый неконтролируемый разброс значении. Однако, как легко убедиться, это случайное варьирование признаков, как правило, подчиняется некоторым закономерным тенденциям как в смысле вполне определенных средних уровней, около которых оно происходит, так и в смысле степени варьирования и взаимной зависимости варьирования.

Итак, будем называть многомерной случайной величиной набор количественных признаков определенного физического смысла

значения каждого из которых подвержены некоторому неконтролируемому разбросу при повторениях данного процесса, наблюдения, эксперимента.

В зависимости от природы области всех мыслимых значений признака, или отдельной компоненты (l = 1, 2, ..., р), этот признак (одномерная случайная величина) называется либо непрерывным — когда область всех мыслимых значений признака заполняет отрезок прямой, полупрямую или всю прямую — что мы имеем при измерениив единицах времени, длины и т. п., либодискретным - когда область мыслимых значений признака состоит из отдельных точек, лежащих на числовой прямой: число сбоев в единицу времени некоторого производственного процесса; число членов в наугад выбранной семье и т. п.

На практике мы имеем дело с результатами измерений исследуемой многомерной случайной величины, которые в дальнейшем мы чаще будем называть простомногомерными наблюдениями. Возвращаясь к нашему примеру с обследованием семейных бюджетов, мы под , следовательно, понимаем результат измерения всехр компонент в i-ой семье. Заметим, что многомерные наблюдения Xi (i = 1, 2, ..., n) часто бывает удобно геометрически интерпретировать в качестве точек в соответствующем р-мерном пространстве.

2. Генеральная совокупность -выборка Способы задания генеральной совокупности

Генеральной совокупностью называют совокупность всех мыслимых наблюдений, которые могли бы быть сделаны при данном реальном комплексе условий. При этом следует отличать совокупность всех мыслимых наблюдений от области Х всех мыслимых значений исследуемой случайной величины Х; наблюдений, вообще говоря, «больше», поскольку каждому фиксированному значению из Х может соответствовать бесчисленное множество мыслимых наблюдений. Под реальным комплексом условий обычно понимаются объективно существующие условия, определяющие те закономерности, в соответствии с которыми происходит случайное варьирование признаков при повторениях наблюдений.

Так, например, анализируя ряд числовых параметров некоторого изделия (например, - вес,и - размерные параметры и т. п.; и рассматривая при этом два конкурирующих способа его производства, скажем, два разных технологических режима, естественно интерпретировать каждый из этих способов как генеральную совокупность и столь же естественно ожидать, что закономерности случайного варьирования параметров изделий (), например, ширина разброса значений по каждому из параметров будут, вообще говоря, различными при разных способах производства.

Точно так же при исследовании семейных бюджетов можно рассматривать в качестве двух различных генеральных совокупностей две различные категории семей, хотя и одинаковой доходной группы, скажем, семьи рабочих и семьи ИТР и служащих (по признаку главы семьи), не определяя при этом объема каждой из этих генеральных совокупностей, который может быть сколь угодно большим.

Однако на практике обследование всей генеральной совокупности (всех мыслимых изделий, которые могли бы быть произведены в каждом из сравниваемых технологических режимов, всех мыслимых — а не только реально существующих в данном месте и в данный момент времени — семей рабочих или семей ИТР и служащих и т. д.) либо слишком трудоемко, либо принципиально невозможно. Поэтому исследователь обычно ограничивается лишь некоторой выборкой из анализируемой генеральной совокупности, т. е. конечным рядом многомерных наблюдений

(1.1)

исследуемой случайной величины X. При этом, как правило, мы будем подразумевать, что наблюдения получены с помощью случайного извлечения из исследуемой генеральной совокупности, при котором каждое из мыслимых наблюдений генеральной совокупности имеет одинаковый шанс попасть в нашу выборку.

А сущность статистических методов как раз и состоит в том, чтобы по некоторой части генеральной совокупности, т. е. выборке, выносить обоснованные суждения о свойствах совокупности в целом.

И, наконец, о способах задания генеральной совокупности, т. е. о математически формализованных способах описания того реального комплекса условий, которым определяются закономерности случайного варьирования исследуемых признаков.

Обычно здравый смысл подсказывает нам, что если мы случайно извлекаем из совокупности семей определенной доходной группы семью для обследования ее месячного бюджета, то гораздо вероятнее

обнаружить чем, скажем,

где и - среднедушевое потребление соответственно хлебобулочных изделий, молочных и мясных продуктов, выраженное в рублях. И это несмотря на то, что ширина «вилки» для каждого из признаков в том и другом случае одинакова и равна трем рублям.

Другими словами, заранее ясно, что если всю р-мерную область Х мыслимых значений исследуемой случайной величины Х разбить на большое число подобластей равного объема, то эти подобласти, несмотря на равный объем, будут далеко не равноправными с точки зрения частоты попадания в них значений многомерных наблюдений (1.1), извлекаемых из исследуемой генеральной совокупности.

Очевидно, закономерности распределения по области Х наблюдаемых значений ; можно считать заданными, если для любой представляющей практический интерес подобласти, образованной из элементов области X, будет задана некоторая численная характеристикаР (S) степени достоверности того факта, что случайно извлеченное из данной генеральной совокупности наблюдение Х окажется принадлежащим именно этой подобласти. Эта численная характеристика Р (S) называется вероятностью события («X принадлежит подобласти S») или вероятностной мерой, заданной на совокупности упомянутых выше подобластей S, обладает рядом свойств, среди которых отметим следующие1:

а) Вероятность любого события заключена между нулем и единицей, т. е. для любой из подобластей S имеет место соотношение .

б) Вероятность достоверного события, т. е. события, заключающегося в том, что наблюдение примет одно из веех мыслимых значений, равна единице Р(X)=P{XX}=1.

Отметим здесь же, что в случае непрерывных случайных компонент вектораX существуют и другие события, вероятность которых равна единице. Такими событиями, в частности, являются все события вида {X}, гдеполучено из Х исключением из последнего любого конечного или даже счетного числа гиперплоскостей типа=С (С—вектор, компонентами которого являются произвольные постоянные числа)2.

в) Вероятность невозможного события, т. е. события, заключающегося в том, что наблюдение примет значение из области Z, не пересекающейся с областью всех мыслимых значений X, равна нулю, т. е. Р (Z) = 0, если Z не пересекается с X. Отметим, что в случае непрерывных случайных компонент существуют и другие события нулевой вероятности. Такими событиями являются, в частности, события вида

,

где- любой набор фиксированных чисел, быть может и принадлежащих к области Х мыслимых значенийX.

г) Вероятность суммы непересекающихся событий

,

т. е. таких событий, для которых области попарно не пересекаются, равна сумме вероятностей этих событий. В символической записи:

Р{Х принадлежит хотя бы одной из областей } = P() = =. При этом области иназываютсяпересекающимися (пересечение ибудем обозначатьили в терминах событий), если они имеют хотя бы одну общую точку из Х по хотя бы одной дискретной случайной компоненте, или если они имеют хотя бы один, пусть сколь угодно малой длины общий интервал значений, принадлежащих области Х по хотя бы одной непрерывной случайной компоненте. Заметим, что такое определение пересекающихся областей (событий) является строгим и совпадает с общепринятым лишь для того класса случайных величин, которым мы ограничиваемся в нашем дальнейшем изложении (см. сноску 2 на стр. 15).

д) Условная вероятность Р (А/В) события А = {X  S} при условии, что уже имеет место событие В, которое может и не выражаться непосредственно в терминах Х и X, определяется с помощью формулы

Р(А/В)= (1.2)

Так, если Р (А/В)=Р(А) (в этом случае естественно назвать события А и В взаимно независимыми), то

Р(АВ)=Р(А)Р(В). (1.3)

Отметим, что аксиоматика и определения теории вероятностей построены таким образом, что эмпирическим, или выборочным аналогом понятия вероятности Р(S), является относительная частота наблюдений из общего числа n, попавших в заданную область S. При этом, чем больше объем выборки п, тем ближе в некотором смысле относительная частота

к вероятности Р (S), где - число наблюдений из выборки (1.1), попавших в заданную областьS1.

Как же конструктивно реализуется задание генеральной совокупности? Ведь из сказанного выше следует, что для этого мы должны указать правило, по которому практически любой области S из Х сопоставляется некоторое неотрицательное (и не большее единицы) число, т. е. задать так называемую функцию множества на X. Однако оказывается, что в большинстве случаев для этого достаточно задать функцию от р числовых переменных . Действительно, если исследуемая величина Х по своей природе дискретна, то функции следует придать смысл вероятности события

или, короче, события {X=U}, где .

Тогда для любой области S, сформированной из элементов области, воспользовавшись свойством (г), вероятность Р (S) можно определить как

.

Суммирование производится по всем точкам p-мерного пространства X, принадлежащим заданной области S.

Если же исследуемая случайная величина Х непрерывна, то функции придается смысл относительной удельной плотности наблюдений генеральной совокупности, сосредоточенных в непосредственной близости от точки, т. е. в достаточно малой окрестности  (U).

Точнее

(1.4)

Здесь - число наблюдений выборки (1.1), попадающих в окрестность(U) точки U, a - объем этой окрестности. Предел понимается в смысле сходимости по вероятности, см., например, [8]. Другими словами, значение функцииf(U) пропорционально вероятности того, что наугад извлеченное из генеральной совокупности наблюдение Х окажется принадлежащим достаточно малой окрестности точки U.

В этом случае функцию f(U) называют функцией плотности распределения вероятностей. Ее выборочным аналогом, в соответствии с вышесказанным, будет величина

, (1.4)

а вероятность Р (S) определяется формулой

. (1.5)

Интегрирование производится здесь по р переменным по всей заданной областиS1. Примеры конкретных функций f(), задающих генеральные совокупности, читатель может найти» например, в [1], [8].

Соседние файлы в папке glava1_2