Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
PSK_ShPOR.doc
Скачиваний:
2
Добавлен:
24.09.2019
Размер:
400.9 Кб
Скачать

5.Работа с переменными Statistica.

Таблица исходных данных системы STATISTICA состоит из строк и столбцов.

В отличие от обычных электронных таблиц, в которых строки и столбцы равноправны, в STATISTICA они имеют разные смысловые значения. Столбцы таблицы STATISTICA называются Переменные, а строки - Наблюдения. В качестве переменных обычно выступают исследуемые величины, а наблюдения - это значения, которые принимают переменные и которые измеряются в процессе наблюдения.

Например, наблюдения – это больные, переменные – пол, возраст, дата поступления в больницу, дата диагноза, дата операции, дата выписки и т.д.

Переменные — это величины, которые в результате измерения могут принимать различные значения.

Независимые переменные — это переменные, значения которых в процессе эксперимента можно изменять, а зависимые переменные — это переменные, значения которых можно только измерять (Программа STATISTICA для студентов и инженеров).

Переменные могут быть измерены в различных шкалах. Различие шкал определяется их информативностью. Рассматривают следующие типы шкал, представленные в порядке возрастания их информативности: номинальная, порядковая, интервальная, шкала отношений, абсолютная. Эти шкалы отличаются друг от друга также и количеством допустимых математических действий. Самая «бедная» шкала — номинальная, так как не определена ни одна арифметическая операция, самая «богатая» — абсолютная.

6.Управление данными в среде spss.

Управление работой пакета происходит в основном через меню, при этом соблюдаются стандарты системы WINDOWS. Каждое окно имеет свое меню, многие команды меню доступны из различных окон.

Основные команды меню SPSS:

FILE: Обеспечивает доступ к файлам данных, к выходным файлам и программам преобразования данных. С файлами данных связываются окна. Если текущее окно соответствует данным наблюдений, то команда FILE обслуживает сохранение и замену данных. Если окно содержит файл синтаксиса (SYNTAX) или выдачи результатов счета (OUTPUT), то обеспечивается обработка файла синтаксиса или выдачи.

EDIT: Обеспечивает редактирование командных файлов, выходных файлов и файлов данных статистических наблюдений и др..

DATA: Обеспечивает операции над данными - сортировку, слияние различных файлов данных, агрегирование, организацию подвыборки из данных. Эта команда имеется только в меню окна редактора данных.

TRANSFORM: Обеспечивает преобразование данных. Эта команда также имеется только в меню окна редактора данных.

STATISTICS: Команда обеспечивает доступ и реализацию методов анализа данных; в 9-й версии SPSS она заменена на команду ANALISIS.

GRAPHS: Графическое представление данных.

UTILITIES: Обслуживающие программы

WINDOOW: Обеспечивает переключение окон.

HELP: Содержит справочную информацию.

Кроме того, при работе с графиками и мобильными таблицами (PIVOT TABLES) появляются меню специального назначения.

Приведенные команды - далеко не полное описание меню, а лишь наиболее используемая его часть.

Статусная строка

Статусная строка показывает, текущее состояние данных и процесса счета, например:

Transformations pending - задержка преобразований (например, если за преобразованиями не следует команда EXECUTE или статистическая процедура).

Weight on - данные взвешены

Split on - данные для проведения расчетов разбиты на группы

Filter on - включена временная выборка данных

Другая информация.

Ввод данных с экрана

При загрузке пакета появляется таблица, похожая на электронные таблицы. Данные можно вводить непосредственно с экрана. По умолчанию переменные будут иметь имена VAR0001.. Var0002 и т.д. Для изменения имен переменных, назначения их типов и расширенных названий (меток) можно щелкнуть мышкой дважды на существующих названиях столбцов. При этом открывается окно диалога по описанию переменной.

Ниже приводятся команды VARIABLE LABELS, VALUE LABELS, MISSING VALUES, дублирующие основные функции этого диалога.

7. Управление данными в среде STATISTICA. Пакет STATISTICA имеет модульную структуру. Каждый модуль содержит уникальные процедуры и методы анализа данных: Base — включает в себя обширный выбор основных статистик, широкий набор методов для разведочного анализа. Advanced Linear/Non-Linear Models — предлагает широкий спектр линейных и нелинейных средств моделирования, регрессионный анализ, анализ компонент дисперсий, анализ временных рядов и т. д. Multivariate Exploratory Techniques — многомерные разведочные технологии анализа STATISTICA предоставляет широкий выбор разведочных технологий, начиная с кластерного анализа до расширенных методов классификационных деревьев, в сочетании с бесчисленным набором средств интерактивной визуализации для построения связей и шаблонов QC — Контроль качества — предоставляет широкий спектр аналитических методов управления качеством, а также контрольные карты презентационного качества, непревзойденной гибкости и разнообразия. Neural Networks — (отдельный модуль) единственный в мире программный продукт для нейросетевых исследований, полностью переведенный на русский язык Data Miner — интеллектуальный анализ данных

8. Оценка закона распределения эксперементальных данных. Если выборка объёма n из генеральной совокупности представительна, то элементы с одинаковыми значениями варианты будут приблизительно одинаково часто встречаться как в выборке, так и в генеральной совокупности. В этом случае естественно принять распределение X в выборке за приближенное распределение ее в генеральной совокупности, тоесть считать дискретное распределение выборки Fn(x) приближением к теоретической функции распределения F(x). Пример приближения показан на рисунке Основанием для такого приближения является так называемая основная теорема математической статистики, доказанная В.И. Гливенко Из этой теоремы следует, что при n→∞ с вероятностью, равной единице, верхняя граница отклонения |F(x)−F(x)| на всей оси x стремится к нулю. Тем самым гарантируется равномерное приближение Fn (x) к F(x) на всей оси x. Таким образом, исследуя функцию Fn (x), мы можем по ней приближено оценить теоретическую функцию распределения случайной величины.

9.10. Оценивание статистических характеристик выборки в среде статистического пакета Statistica/SPSS. Описательные стат-ки- это оценивание статистических характеристик. Стат.пакеты предлагают вычислять описательные стат-ки как в контекстном меню, так и в виде отдельного меню.

Mean, average

Median

Moda

Эти три – харк-ки положение

Разброс:

Variance

Standart deriation

Standart error

Нижний квартиль – это значение выборки,нижэе кт ¼ наблюдений, а выше ¾

Верхний квартиль – это значение выборки, ниже которой ¾ наблюдений, а выше – ¼

Skewness – скос, ассиметрия

Skew=0 Skew=2,5 Skew=

Скос вправо>2 Скос влево<2

Kurtoses(крутизна, эксцесс)

Kurtoses

Kurt=0 Kurt >2 Kurt<-2

Перед началом анализа данных рекоменд-ся: навскидку определить закон распределения изучаемых данных графически(по гистогр.распр-я). При графич. способе можно предположить какой будет закон распр. И увидеть ошибки вывода. Посмотреть показатели ассиметрии и эксцесса [-2;2], посмотреть расхождение м-у сред. И медианой. Выполнить тесты на нормальность. Но: зак.распр. нормальн. Н1: зак.распр. отличается.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]