2- 1_Технология разработки программного обеспечения
.docМинистерство образования РФ
Томский государственный университет
Систем управления и радиоэлектронике
(ТУСУР)
Центр дистанционного обучения.
Кафедра автоматизированных систем управления (АСУ)
Контрольная работа № 2
по дисциплине: «Технология разработки программного обеспечения»
тема: «Анализ нечисловой информации»
Вариант № 1
Автор методического пособия: Калайда В.Т. Романенко В.В.
Задание 1
1) Показать, что в четырехклеточной таблице
D = a - (a+c)(a+b)/n = (ad-bc)/n
2) Вычислить и проанализировать коэффициенты связи для
четырехклеточных таблиц
а)
-
9
1
1
9
б)
-
90
10
10
90
в)
-
900
100
100
900
Задание 2
Вычислить ранговые критерии
а) p1: 1 2 3 4 5 б) p1: 1 2 3 4.5 4.5 в) p1: 4 1 2 3 5
p2: 1 2 3 4 5 p2: 1.5 1.5 4 4 4 p2: 5 4 1 2 3
г) p1: 1 3 2 4 6 7 5
p2: 2 1 3 4 5 6 7
p3: 1 2 3 4 5 6 7
p4: 3 1 2 4 5 7 6
Задание 3
На основе данных исследования получена таблица
Возраст |
Оценка состояния здоровья |
|||
Не болею совсем |
Болею редко |
Болею часто |
Совсем больной |
|
До 25 лет |
30 |
40 |
20 |
10 |
25-55 лет |
10 |
20 |
60 |
10 |
Старше 55 лет |
0 |
10 |
40 |
50 |
Есть ли и какова связь в оценке здоровья респондентов разных возрастов?
Указание: а) провести анализ при помощи ХИ-квадрат теста
б) вычислить [X/Y]
в) перейти к ранговым переменным и оценить согласованность мнений людей разных возрастов
Задание 1
1) Показать, что в четырехклеточной таблице
D = a - (a+c)(a+b)/n = (ad-bc)/n
2) Вычислить и проанализировать коэффициенты связи для четырехклеточных таблиц
а)
-
9
1
1
9
б)
-
90
10
10
90
в)
-
900
100
100
900
Решение:
1. Показать, что в четырехклеточной таблице
четырехклеточной таблице: , откуда
2. Вычислить и проанализировать коэффициенты связи для четырехклеточных таблиц
а)
-
9
1
1
9
Расчитаем коэффициент связи Юла:
Расчитаем коэффициент контингенции:
.
Критерий согласия:
Признаки очень сильно связаны.
б)
-
90
10
10
90
Расчитаем коэффициент связи Юла:
Расчитаем коэффициент контингенции:
.
Критерий согласия:
Признаки очень сильно связаны.
в)
-
900
100
100
900
Расчитаем коэффициент связи Юла:
Расчитаем коэффициент контингенции:
.
Критерий согласия:
Во всех трех таблицах признаки связаны сильно и различаются только критерии согласия.
Задание 2
Вычислить ранговые критерии
а) p1: 1 2 3 4 5 б) p1: 1 2 3 4.5 4.5 в) p1: 4 1 2 3 5
p2: 1 2 3 4 5 p2: 1.5 1.5 4 4 4 p2: 5 4 1 2 3
г) p1: 1 3 2 4 6 7 5
p2: 2 1 3 4 5 6 7
p3: 1 2 3 4 5 6 7
p4: 3 1 2 4 5 7 6
Решение:
Вычислить ранговые критерии
а) p1: 1 2 3 4 5
p2: 1 2 3 4 5
Находим ранговый коэффициент корреляции Спирмэна:
. Величина этого коэффициента равного единице, говорит о наличии сильной связи между ранжировками. Теперь находим ранговый коэффициент корреляции Кендалла:
. Величина этого коэффициента равного 1, так же говорит о наличии сильной связи между ранжировками.
б) p1: 1 2 3 4.5 4.5
p2: 1.5 1.5 4 4 4
Находим ранговый коэффициент корреляции Спирмэна по формулам, но здесь имеются группы неразличимых рангов:
; ;
Величина этого коэффициента, приближается к единице, это говорит о наличии связи между ранжировками. Теперь находим ранговый коэффициент корреляции Кендалла:
; ; ;
. Величина этого коэффициента, тоже говорит о наличии связи между ранжировками.
в) p1: 4 1 2 3 5
p2: 5 4 1 2 3
Находим ранговый коэффициент корреляции Спирмэна:
. Величина этого коэффициента, равного 0,2, говорит о наличии слабой связи между ранжировками. Теперь находим ранговый коэффициент корреляции Кендалла, для этого необходимо упорядочить любую из двух выборок.
p1: 1 2 3 4 5
p2: 4 1 2 5 3
. Величина этого коэффициента, равного 0,2, тоже говорит о наличии слабой связи между ранжировками.
г) p1: 1 3 2 4 6 7 5
p2: 2 1 3 4 5 6 7
p3: 1 2 3 4 5 6 7
p4: 3 1 2 4 5 7 6
Здесь ранжировок больше двух, то вычисляем коэффициент конкорданации:
Из этого результата видно, что при оценке объектов между экспертами присутствует сильная связь и согласие между ними.
Задание 3
На основе данных исследования получена таблица
-
Возраст
Оценка состояния здоровья
Не болею
совсем
Болею редко
Болею часто
Совсем больной
До 25 лет
30
40
20
10
25-55 лет
10
20
60
10
Старше 55 лет
0
10
40
50
Есть ли и какова связь в оценке здоровья респондентов разных возрастов?
Указание: а) провести анализ при помощи ХИ-квадрат теста
б) вычислить [X/Y]
в) перейти к ранговым переменным и оценить согласованность мнений людей разных возрастов
Решение:
а) выдвигаем гипотезу о том, что связи в оценке здоровья респондентов разных возрастов нет.
Вычислим где
-
30
40
20
10
100
10
20
60
10
100
0
10
40
50
100
40
70
120
70
300
Теперь нахожу значение , для этого определим число степеней свободы:
Тогда при находим по таблице
Если то гипотеза о том, что связь в оценке здоровья мужчин и женщин отсутствует, не подтверждается (связь имеется), иначе нет.
б) рассчитаем направленный (несимметричный):
Здесь и далее предполагается, что уровни (градации) признака - строки, - столбцы.
Ненаправленный (симметричный) коэффициент :
в) перейдем к ранговым коэффициентам:
-
4
3
2
1
10
1
2
4
1
9
1
2
3
4
10
Имеются объединенные ранги, поэтому рассчитываем коэффициент конкордации (согласия экспертов) по формуле:
где
Рассчитываем поправки:
и коэффициент:
Вычисляем статистику:.
Теперь необходимо найти по таблице теоретическое значение при и числе степеней свободы . Если , то гипотеза об отсутствии связи отвергается, т.е. согласованность признаков значима, иначе гипотеза об отсутствии связи подтверждается.