- •1 Основы обработки данных
- •Предисловие
- •1. Введение в анализ данных
- •Проблема обработки данных
- •1.2. Матрица данных
- •Гипотезы компактности и скрытых факторов
- •1.4. Структура матрицы данных и задачи обработки
- •1.5. Матрица объект-объект и признак-признак. Расстояние и близость
- •1.6. Измерение признаков
- •1.7. Отношения и их представление
- •1.8. Основные проблемы измерений
- •1.9. Основные типы шкал
- •1.10. Проблема адекватности
- •1. 11. Заключение
- •1.12. Литература к главе 1
- •1.13. Вопросы для самопроверки
- •Тема 1. Представление данных и задачи обработки.
- •Тема 2. Типы признаков и их измерение.
- •2. Основы анализа связей
- •2.1. Предположение о природе связи
- •2.2. Нормальное распределение
1.7. Отношения и их представление
Пусть задано некоторое множество объектов А = {a1,a2,…aN}. Множество всех пар вида (ai , аj), где ai A, ai A образуют декартово произведение А х А. Любое подмножество Р A х А декартова произведения называется бинарным отношением на множестве А. Отношения задаются в виде матрицы P(N х N), в которой строки и столбцы соответствуют объектам из А. Если пара (ai , аj) P, то элемент pij= 1, в противном случае - 0.
Рассмотрим основные типы наиболее распространенных бинарных отношений.
Рефлексивность. Отношение P рефлексивно, если пары (ai , аi)P, i =1,..N
Антирефлексивность. Отношение Р антирефлексивно, если пары (ai , аi)P, i= 1,...N.
Симметричность. Отношение Р симметрично, если одновременно (ai , аj)P и (aj , аi)P .
Асимметричность. Отношение Р асимметрично, если (ai,аj) P только когда (aj , аi) P.
Антисимметричность. Р антисимметрично, если из (ai , аj) P и (aj , аi) P следует ai=аj.
Транзитивность. P транзитивно, если из (ai , аj)P и (aj , аk)P следует (ai , аk) P .
Связность (линейность). Отношение Р связно, если для любых ai A и ai A выполнено
(ai , аj) P или (aj , аi)P или эти условия выполнены одновременно.
Эквививалентность. Отношение Р называется эквивалентностью, если оно рефлексивно, симметрично и транзитивно. Эквивалентность выражает неразличимость объектов из одного класса. Пусть А = {a1,a2,a3,a4,a5}. Если a1= a2 и a3= a4 = a5 , то есть объекты a1 и a2 не различаются, и a3 ,a4 ,a5 также не различаются, то матрица эквивалентности
имеет вид:
1 1 0 0 0
1 1 0 0 0
Pэ =0 0 1 1 1
0 0 1 1 1
0 0 1 1 1
Отношение можно также представить в виде графа. Тогда отношение эквивалентности можно представить в виде неориентированного графа (Рис. 1.9).
1 2 3 4 5
Рис. 1.9. Граф эквивалентности.
20
Толерантность. Отношение Р называется толерантностью, если оно рефлексивно и симметрично. Толерантность выражает свойство похожести. Если a1 a2 , a2 a3 , a4 a5 ,то матрица толерантности и граф выглядят как на Рис. 1.10.
1 1 0 0 0
1 1 1 0 0
Pт=0 1 1 0 0
0 0 0 1 1
0 0 0 1 1
1 2 3 4 5
Рис. 1.10. Отношение и граф толерантности.
Линейный порядок. Отношение Р называется линейным порядком, если оно рефлексивно, антисимметрично, транзитивно и связно. Для линейного порядка применяются также и другие названия: линейный квазипорядок, ранжирование. Данное отношение говорит о частичном упорядочении объектов из А, когда классы неразличимых объектов упорядочены. Если неразличимых объектов нет, то есть все классы эквивалентности одноэлементны, то отношение Р является антирефлексивным, а порядок или ранжирование называется строгим. Пусть A1={a1}, A2={a2}, A3={a3, a4} и A4={a5} - классы эквивалентности. Следовательно, a3=a4 и классы Ai упорядочены A1 A2 A3 A4 то есть A1 предшествует A2 и т.д. Тогда матрица линейного порядка имеет вид:
1 1 1 1 1
0 1 1 1 1
Pл=0 0 1 1 1
0 0 1 1 1
0 0 0 0 1
Граф линейного порядка является ориентированным (Рис. 1.11).
1 2 3 4 5
Рис. 1.11. Граф линейного порядка.
21