Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Практикум в STATISTICA

.pdf
Скачиваний:
178
Добавлен:
10.04.2015
Размер:
4.14 Mб
Скачать

Выделим точки, соответствующие наблюдениям, лежащим выше прямой Тромбоциты = 250.

Если мы теперь откроем таблицу Редактор данных графика, то отмеченные наблюдения будут выделены красным цветом.

Диаграмма Вороного

Построим диаграмму Вороного по переменным Гемоглобин и Тромбоциты.

На диаграмме Вороного значения двух переменных X и Y изображаются, как на диаграмме рассеяния, а затем пространство между отдельными точками данных делится границами, окружающими каждую точку данных, на области по следующему принципу: каждая точка области находится ближе к заключенной внутри точке данных, чем к любой другой соседней точке данных.

Приведем пример практического использования диаграммы Вороного.

Предположим, что на анализ поступил новый больной.

Для назначения лечения было бы полезно знать, какая гемограмма ему наиболее близка. Это можно сделать с помощью диаграммы Вороного.

Пусть в поступившей гемограмме указано значения: Тромбоциты=220 и Гемоглобин = 105. Проведём на графике соответствующие прямые; точка пересечения прямых будет соответствовать новому пациенту.

Выявим наблюдение, которое является «хозяином» области, в которое попадает данное наблюдение. Для этого воспользуемся средством Кисть.

Описательный (дескриптивный) анализ гемограмм

Вычислим описательные статистики для переменных, содержащих информацию о гемограммах.

Шаг 1. Запуск модуля Основные статистики и таблицы.

Выберем пункт Описательные статистики. Нажмём OK.

Шаг 2. Выбор переменных

Шаг 3. На вкладке Дополнительно укажем интересующие нас статистики.

Нажав OK, получим таблицу с описательными статистиками.

Описательные статистики по группам

Достаточно часто возникает необходимость вычислить описательные статистики отдельно по каждой группе наблюдений.

Например, вычислим средние значения показателей гемограммы отдельно для каждой группы пациентов, а также для мужчин и для женщин.

Шаг 1. В диалоге Основные статистики и таблицы выберем пункт Группировка и однофакторный ДА.

В окне Внутригрупповые статистики и корреляции перейдём на вкладку Списки таблиц.

Шаг 2. Выберем группирующие переменные.

Шаг 3. Выберем зависимые переменные.

Нажмём на кнопку OK в диалоге Внутригрупповые статистики и таблицы.

В рабочей книге STATISTICA появится таблица, содержащая таблицу средних по группам.

Анализ выбросов

Выбросами являются резко выделяющиеся наблюдения, например, пациенты с избыточным числом тромбоцитов.

Выявление выбросов осуществляется посредством построения двумерных диаграмм размаха.

Построим диаграмму размаха по переменной Тромбоциты.

Выберем в меню пункт Графики/2M Графики/Диаграммы размаха. В

появившемся окне перейдём на вкладку Дополнительно.

Укажем переменные.

Пока что мы не будем указать группирующую переменную.

Отметим, что на вкладке Дополнительно окна 2M Диаграмма размаха Вы можем настроить опции для выявления наблюдений – выбросов (например, Вы можете указать Коэффициент выбросов).

Нажмём OK в диалоге 2M Диаграмма размаха.

На диаграмме размаха отмечены четыре выброса – три «слишком больших» значения и одно «слишком маленькое».

Визуально анализируя диаграмму размаха, Вы можете получить представление об изменчивости переменной.

Определим, какие именно наблюдения являются выбросами.

Один из способов нам уже известен – можно построить диаграмму рассеяния для переменных Номер наблюдения и Тромбоциты и при помощи средства Кисть выделить нужные наблюдения.

Опишем другой способ. Расположим наблюдения по убыванию переменной

Тромбоциты.

Для этого выберем из меню пункт Данные/Сортировка.

В появившемся окне укажем параметры Ключа 1.

После нажатия на кнопку OK наблюдения в исходной таблице данных будут расположены в порядке убывания переменной Тромбоциты.

Теперь мы можем определить, какие наблюдения являются выбросами – это будут первые три и последнее наблюдение в таблице. Итак, «нестандартный» уровень тромбоцитов в крови выявлен у пациентов номер 71, 87, 79 и 97.

Теперь вновь вызовем диалог 2M Диаграмма размаха и зададим в окне Переменные в качестве группирующей переменной переменную Пол.

Отметим, что наблюдения – выбросы, отмеченные на этой диаграмме, отличаются от наблюдений-выбросов на диаграмме, построенной без разбиения на группы.

Например, значение Тромбоциты=300, являющее выбросом для наблюдений, рассмотренных вместе, оказывается «нормальным» при рассмотрении только группы женщин. Есть и примеры обратного: значение Тромбоциты=73 оказывается выбросом для группы мужчин, но при рассмотрении всех наблюдений оно оказывается «нормальным».

Корреляционный анализ

Вычислим корреляции между переменными Var4 – Var7.

Корреляции Пирсона

Запустим модуль Основные статистики и таблицы. В появившемся окне выберем пункт Парные и частные корреляции.

Отобразится окно Парные и частные корреляции.

Нажмём на кнопку Квадратная матрица и укажем переменные.

После нажатия на кнопку OK в диалоге Парные и Частные корреляции в рабочую книгу добавится таблица с коэффициентами корреляции между указанными переменными.

Итак, почти все переменные попарно зависимы; исключение составляет пара

Эритроциты – Тромбоциты.