Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ri2014_materials

.pdf
Скачиваний:
74
Добавлен:
13.02.2015
Размер:
7.47 Mб
Скачать

540

РЕГИОНАЛЬНАЯ ИНФОРМАТИКА – 2014

 

 

информации, что связано с глобальной информатизацией общества, а также объясняет тот факт, что в качестве исходных данных для анализа рассматриваются электронные средства массовой информации и социальные сети.

Аналитическая обработка текстовой информатизации включает в себя стандартные этапы: сбор, хранение и анализ данных. На данный момент уже существуют информационные технологии, которые позволяют осуществлять сбор и хранение данных из интернет источников. Однако практически отсутствует реализация интеллектуальных технологий анализа, которые позволили бы уменьшить нагрузку на эксперта-аналитика за счет автоматизации части его работы, осуществления предварительной обработки информации, выявления значимых закономерностей и предоставления возможности концентрации на наиболее важных фактах.

По этой причине особую актуальность принимают вопросы создание программных средств, реализующих алгоритмы интеллектуального анализа текстовой информации.

Алгоритмы анализа данных на естественном языке принято относить к компьютерной лингвистике. Эта научная область развивается уже на протяжении длительного периода времени. Существует огромное количество научных трудов, посвященных решению задач интеллектуального анализа текста и извлечения из него полезной информации. Но, не смотря на активную работу в этом направление, вопреки оптимистическим прогнозам, компьютеры далеки от понимания естественных языков. Невозможность создания решения, которое стало бы панацеей в компьютерной лингвистике, привело к появлению новых техник анализа текста, заточенных под решение конкретных прикладных задач. Примером, такой техники является анализ тональности, который получил широкое распространение в сфере маркетинга.

Полученные в рамках исследования результаты позволяют заключить, что исследование социальных сетей интернета позволяет получить новый срез информации о развитии региона. Следует отметить, что полученные результаты являются смещенными и характеризуют определенную часть общества, активно пользующихся социальными сетями интернета, однако, как показали исследования, результаты мониторинга социальных сетей могут эффективно применяться в задачах моделирования и исследования скрытых социальных процессов. По этой причине исследования социальных сетей не могут применяться для оценивания ситуации без альтернативных

итрадиционных подходов, но существенно расширяют инструментарий социологического анализа.

Сдругой стороны, использование данных социальных сетей в моделировании позволяет поставить и разрешить ряд сопутствующих задач. Таким образом, при проектировании информационно-аналитического обеспечения для органов государственной власти первостепенной задачей стоит анализ существующих методов, алгоритмов и техник, которые могут быть использованы в данной предметной области. Возникает необходимость привлечения современных средств информационного поиска и обработки информации.

В докладе отображены основные результаты, полученные в процессе решения поставленной задачи. А также представлены методы анализа текстовой информации, которые являются перспективными для внедрения в информационно-аналитические системы органов государственной власти.

Соложенцев Е.Д.

Россия, Санкт-Петербург, Институт проблем машиноведения РАН, Санкт-Петербургский государственный университет аэрокосмического приборостроения ТЕХНОЛОГИИ И МОДЕЛИ УПРАВЛЕНИЯ ЭКОНОМИЧЕСКОЙ БЕЗОПАСНОСТЬЮ СТРАНЫ

Безопасность страны зависит не только от военной, технической, технологической, экологической и информационной безопасности [1], но и от экономической безопасности, то есть от устойчивого развития социально-экономических систем (СЭС), систем противодействия коррупции и наркотизации населения страны и др. Для управления успешным развитием социальноэкономических систем страны необходимы ресурсы. Поэтому нужна система управления инновациями для уменьшения потерь средств и увеличения их поступления.

Вприоритетные фундаментальные научные направления, выделенные правительством страны

иРоссийской академией наук (РАН), не вошли исследования по экономической безопасности страны

иее социально-экономических систем. Конкурсы Российского научного фонда по приоритетным направлениям также не содержат тем исследований по экономической безопасности страны.

Вработах лауреатов Нобелевские премии Джеймс Бьюкенен и Джеймс Хекман и академика А.Г. Аганбегяна [2,] рассматриваются связи экономики и политики в развитии государства и обеспечение его экономической безопасности на основе теории игр, моделирования и анализа статистических данных. В настоящей работе предлагается новый подход к анализу и управлению экономической безопасностью страны на основе Технологий Управления Риском в СтруктурноСложных Системах (ТУР ССС) [3, 4] с логико-вероятностными (ЛВ) моделями риска.

http://spoisu.ru

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ УПРАВЛЕНИЯ РИСКОМ В СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ СИСТЕМАХ

541

 

 

Проблема управления экономической безопасностью страны многогранна. В работе рассматривается один из аспектов – управление экономической безопасностью на верхнем уровне внутренних проблем страны (без учета транснациональных корпораций).

Цель настоящей работы разработать технологии и модели для системы управления экономической безопасностью страны, направленной на уменьшение потерь в социальноэкономических системах и на увеличение поступления средств от их функционирования.

Задачи настоящей работы:

1.Обосновать фундаментальность и приоритетность научной проблемы экономической безопасности страны и предложить структуру, компоненты и модели системы управления экономической безопасностью страны;

2.Ввести новые типы событий и моделей для построения ЛВ-моделей риска социальноэкономических систем;

3.Изложить суть Технологий Управления Риском в Структурно-Сложных Системах, как основы системы управления экономической безопасностью страны;

4.Разработать методику, сценарий и ЛВ-модели риска неуспеха решения трудных социальноэкономических проблем;

5.Разработать ЛВ-модели риска для управления системой инноваций страны;

6.Установить роль ученых и общественного мнения в решении трудных социальноэкономических проблем страны;

7.Оценить состояние образования, науки и экономики для обеспечения экономической безопасности страны.

Экономическая безопасность определяется состоянием следующих социально-экономических проблем: Рождаемость, Строительство жилья, Медицинское обслуживание, Образование, Занятость населения, Коррупция, Наркомания, Информатизация страны, Экология, Кредитование и банковское дело, Сельское хозяйство, Малый бизнес.

Для оценки состояния и успешности решения этих проблем введем критерии (количественные оценки) их экономической безопасности. Сопоставим этим критериям логические переменные имеющими смысл событий успеха (или неуспеха) их решения с вероятностями и запишем логическую

ивероятностную модели риска неуспеха экономической безопасности.

Соложенцев Е. Д., Карасев В.В.

Россия, Санкт-Петербург, Институт проблем машиноведения РАН, Санкт-Петербургский государственный университет аэрокосмического приборостроения ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ УПРАВЛЕНИЯ РИСКОМ В СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ СИСТЕМАХ

Изложены положения нового фундаментального научного и прикладного направления исследований «Технологии управления риском в структурно-сложных системах» (ТУР ССС). Определены требования к разрабатываемым моделям для управления риском. Описаны компоненты технологий управления риском. Рассмотрена динамичность логико-вероятностных (ЛВ-) моделей риска. Введены новые типы событий и ЛВ-моделей риска. Приведены методики технологий управления риском в социально-экономических системах: ЛВ-анализ риска, оперативное и стратегическое ЛВ-управление риском системы, синтез и анализа вероятностей инициирующих событий в ЛВ-моделях риска. Сформулированы положения по научной новизне научного направления и названы приложения.

Лаборатория Интегрированных Систем Автоматизированного Проектирования (ИСАПР) ИПМаш РАН и кафедра «Бизнес-информатика» СПбГУАП в течение более 10 лет проводят фундаментальные и прикладные исследования по научному направлению. Результаты исследований опубликованы в российских и иностранных журналах и используются при обучении студентов экономического и инженерного факультетов ГУАП.

Вначале создавались ЛВ-модели риска для отдельных приложений в технике и экономике и, наконец, пришло понимание, что нужны технологии для управления риском в структурно-сложных экономических, социальных и технических системах.

Актуальность работы и ее научная и практическая значимость определяются тем, что для устойчивого развития России необходимы адекватные на единой методической основе модели для управления безопасностью и риском как в военных, технических, экологических и информационных системах, так и в социально-экономических системах: управление безопасностью и риском состояния и развития социально-экономических систем и государства, противодействие взяткам и коррупции, противодействие наркотизации населения страны, управления кредитными и операционными рисками банков, управление системой инноваций страны и др.

На разработку моделей, методик и технологий управления риском в социальных, экономических и технических системах и процессах оказали влияние известные ученые: Н. Винер и Дж. Нейман, считавшие, что методы для управления экономическими и социальными системами

http://spoisu.ru

542

РЕГИОНАЛЬНАЯ ИНФОРМАТИКА – 2014

 

 

должны опираться на комбинаторику, логику и множества; Р. Калман, писавший, что проблема «данные модель, объясняющая данные» должна рассматриваться как основная для любой отрасли науки; И.А. Рябинин, предложивший ЛВ-исчисление для анализа риска в системах; лауреаты Нобелевской премии Джеймс Бьюкенен, исследовавший модель устойчивого развития государства на основе принятия экономических и политических решений; и Джеймс Хекмен, создавший теорию анализа микроданных, неоднородностей и оценки политики по статистике социально-экономических процессов.

Технологии управления риском в структурно-сложных системах – это набор ЛВ-моделей, методик, процедур, специальных Software и примеров оценки и анализа риска. Они являются также информационными интеллектуальными и инновационными. Системы и процессы рассматриваются как структурно-сложные со случайными событиями. Введены события появления и неуспеха состояний системы, события для параметров и их градаций, невалидные события. В ТУР ССС риск и эффективность рассматривают как единое целое.

Компонентами ТУР ССС являются: ЛВ-исчисление, классы ЛВ-моделей риска, процедуры для классов ЛВ-моделей, методика оценки вероятностей событий в ЛВ-моделях риска, специальные программные средства для классов и процедур, примеры приложений, учебный курс.

ЛВ-исчисление использует расширенное определение события и рассматривает около 10 типов новых событий 4 типа новых моделей.

Классы ЛВ-моделей риска: ЛВ-моделирование, ЛВ-классификация, ЛВ-эффективность, ЛВпрогнозирование, Гибридные ЛВ-модели риска.

Процедуры для классов ЛВ-моделей риска:построение Л-моделей риска, идентификация ЛВ-моделей риска по статистическим данным, ЛВ-анализ риска по вкладам инициирующих событий, ЛВ-управление риском, ЛВ-прогнозирование риска во времени и пространстве состояний, синтез вероятностей событий в ЛВ-моделях.

http://spoisu.ru

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В СОЦИОКОМПЬЮТИНГЕ

543

 

 

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В СОЦИОКОМПЬЮТИНГЕ

Абрамов М.В., Азаров А.А.

Россия, Санкт-Петербург, Санкт-Петербургский институт информатики и автоматизации РАН, г. Москва, Московский государственный гуманитарный университет им. М.А. Шолохова КОНЦЕПЦИЯ АНАЛИЗА РАСПРОСТРАНЕНИЯ КОНТЕНТА В СОЦИАЛЬНЫХ МЕДИА НА ОСНОВНИИ МЕТОДОВ АНАЛИЗА ЗАЩИЩЕННОСТИ ПОЛЬЗОВАТЕЛЕЙ ИНФОРМАЦИОННЫХ СИСТЕМ ОТ СОЦИО-ИНЖЕРНЫХ АТАК

Сегодня социальные медиа являются одним из самых популярных инструментов получения, обмена и распространения информации. Их нарастающая популярность заставила учёных посмотреть на социальные медиа, как на объект изучения. Одним из основных аспектов стали модели распространения информации. Наиболее заметные среди них них описаны в статьях А.С. Минзова и К.А. Шумикиной «Механизмы распространения информации в телекоммуникационных сетях и их использование в электронном PR», Д.А. Губанова, Д.А. Новикова и А.Г. Чхарташвили «Модели репутации и информационного управления в социальных сетях», В.В. Бреер «Стохастические модели социальных сетей».

Пользователей социальных медиа условно можно разделить на две группы: генераторы контента и потребители контента. Существует гипотеза, относительно которой поведение пользователей при возникновении определённых условий можно предсказать с высокой степенью точности. Задача прогнозирования поведения существует давно, но до сих пор не решена. Исследования в области анализа защищённости пользователей информационных систем от социоинженерных атак показали высокий уровень корреляции между поведением пользователя и разработанными профилями уязвимости. Существует мнение, что разработанную систему профилей уязвимости пользователей можно доработав применить к анализу распространения контента в социальных медиа.

Азаров А.А.

Россия, Санкт-Петербург, Санкт-Петербургский институт информатики и автоматизации РАН МАТЕМАТИЧЕСКИЕ МОДЕЛИ РАСПРОСТРАНЕНИЯ ИНФОРМАЦИИ В СОЦИАЛЬНЫХ СЕТЯХ

Моделирование распространения информации в социальных сетях является актуальной проблемой, изучаемой рядом ведущих зарубежных ученых, таких как Lucy Small, Oliver Mason, Tatsuro Kawamoto, Jennifer Earl, Stefan Stieglitz и рядом других. Большинство исследователей не связывает распространение информации с индивидуальными особенностями пользователя, то есть при моделировании передачи информации от одного узла сети к другому рассматриваются только связи между узлами и степень удаленности узла от узла-первоисточника данных. В тоже время, при адаптации моделей анализа защищенности пользователей информационных систем от социоинженерных атак возникает возможность перехода к профилю поведения пользователя. Данный профиль позволит учитывать особенности каждого пользователя и строить более точные модели распространения информации в социальных сетях. В случае профиля уязвимостей пользователя, применяемого в анализе защищенности пользователей информационных систем от социоинженерных атак, рассматривается связь между психологическими особенностями личности и уязвимостями пользователя. При рассмотрении профиля поведения пользователя, необходимо решить задачу восстановления психологических особенностей личности по индивидуальным страницам пользователя социальной сети, и затем построить параметры, содержащиеся в этом профиле.

Губарев И.Д., Курилкин А.В. Митягин С.А., Гарадаглы И.Э.

Россия, Санкт-Петербург, Санкт-Петербургское государственное унитарное предприятие «Санкт-Петербургский информационно-аналитический центр», Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики МОНИТОРИНГ И АНАЛИЗ ДАННЫХ СОЦИАЛЬНЫХ МЕДИА В ЗАДАЧАХ ПОВЫШЕНИЯ

ЭФФЕКТИВНОСТИ УПРАВЛЕНЧЕСКОЙ ДЕЯТЕЛЬНОСТИ

Сбор и систематизация сведений о жизнедеятельности региона в современном мире не может производиться в отрыве от сведений, публикуемых в средствах массовой информации и социальных сетях Интернета, поскольку позволяют учесть важнейшую составляющую развития региона –

http://spoisu.ru

544

РЕГИОНАЛЬНАЯ ИНФОРМАТИКА – 2014

 

 

социально-информационную. Развитие информационных технологий, в частности Web 2.0 способствуют упрощению распространения информации и организации социальных коммуникаций между людьми, с другой являются своеобразной площадкой обсуждения наиболее проблемных тематик. Отличительной чертой онлайновых средств массовой информации является их динамическая структура, что способствует образованию локальных групп пользователей с близкими мнениями и интересами. Принимая во внимание определенную инертность мнений, информация, распространяемая через Интернет источники, оказывает существенное влияние на общее эмоциональное и психологическое состояние населения. С другой стороны, спектр обсуждаемых тематик в Интернет СМИ позволяет рассматривать их как некий срез эмоционально-психологического состояния общества на момент наблюдения.

Впоследние несколько лет в России наблюдается все большее развитие СМИ в сфере Интернет, ввиду широкой доступности и динамичности обновления данных. Рост популярности не в последнюю очередь связан с бурным развитием социальных сетей. В социальных сетях практически

ссамого момента их появления намечена тенденция объединения пользователей в виртуальные группы по различным критериям и интересам. Информация, получаемая из современных Интернет источников, предоставляет большой интерес для обработки и анализа с целью выявления проблемных сфер в развитии и состоянии общества для последующей поддержки принятия управленческих решений и их исправления.

Таким образом, исследование социально-значимых процессов жизнедеятельности региона не может производиться в отрыве от информационного поля существования общества. Рассматривая пример анализа наркоситуации в Санкт-Петербурге было осуществлено исследование пользовательских публикаций в социальной сети LiveJournal.

Данная логика повторяет логику мер противодействия от планирования целевых индикаторов на уровне основных направлений деятельности правительства и составления целевых программ, до планирования и реализации отдельных мероприятий.

Таким образом, современный уровень развития систем поддержки принятия управленческих решений требует разработки и внедрения технологий исследования Интернет сферы в процессы информационно-аналитической поддержки управленческой деятельности в регионе. Следует отметить, что данные Интернет-источников могут рассматриваться как дополнительные сведения, характеризующие развитие региона помимо традиционно используемых данных ведомственной статистики и результатов социологических исследований, а также позволяют получить оперативную характеристику состояния общества.

Врамках доклада представлен опыт использования данных Интернет источников в системе аналитической поддержки принятия управленческих решений в Санкт-Петербурге.

Ли Хен Ми, Носовец А.А, Торопова А.В., Тулупьев А.Л., Тулупьева Т.В. Россия, Санкт-Петербург, Санкт-Петербургский государственный университет, Санкт-Петербургский институт информатики и автоматизации РАН ЛИЧНОСТНЫЕ ОСОБЕННОСТИ ПОЛЬЗОВАТЕЛЕЙ СОЦИАЛЬНЫХ СЕТЕЙ

(НА ПРИМЕРЕ VK.COM)

Под действием стремительно развивающихся информационных технологий существенно меняются современные социально-коммуникативные практики. Особый интерес представляет подход к социальномукомпьютингу, позволяющий активно применять его в социологических исследованиях.

На примере группы студентов, основываясь на данныхпсихологического тестирования и анализа постов в социальной сети ВКонтакте, были выявлены взаимосвязи между личностными особенностями человека и категориями посты. Каждый пост был оценен с точки зрения принадлежности кодно или сразу нескольким из трех категорий: информационный, эмоциональный, побудительный. Каждая категория имела свои подклассы:

информационный: формальный/статический, событийный, личный, интеллектуальнорассуждательский/цитатный, ссылочный и кулинарный;

эмоциональный: позитивный, негативный, поздравительный;

побудительный: благотворительный, продающий, побудительный к действию.

Посты чаще размещают люди со склонностью к риску, с повышенной чувствительностью, мечтательные и экстравертированные. Информационные посты чаще публикуют люди экстравертированнные, нацеленные на общение, но в то же время подозрительные и недоверчивые, с низкой эмоциональной устойчивостью. Эмоциональные посты размещают люди с повышенной потребностью в поиске новых ощущений, эмоционально неустойчивые, с перепадами настроения, повышенной напряженностью и боязнью неудачи. Девушки предпочитают размещать аудио-посты, а юноши – видео-посты.

http://spoisu.ru

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В СОЦИОКОМПЬЮТИНГЕ

545

 

 

По результатам данного исследования можно сделать вывод, что соотношение постов разных категорий на страничке в социальной сети позволяет сделать предположение о личностных особенностях пользователя.

Ли Хен Ми, Носовец А.А, Тулупьев А.Л., Тулупьева Т.В.

Россия, Санкт-Петербург, Санкт-Петербургский государственный университет, Санкт-Петербургский институт информатики и автоматизации РАН

ПОДХОДЫ К КЛАССИФИКАЦИИ ПОСТОВ В СОЦИАЛЬНЫХ СЕТЯХ (НА ПРИМЕРЕ VK.COM)

Социальный компьютинг в последнее время стал одной из центральных тем в целом ряде смежных областей информационных и коммуникационных технологий. Социальныйкомпьютинг представляет собой междисциплинарную область исследований и технологических разработок, опирающихся на достижения в области общественных наук и технологии мультимедиа.

Одной из важнейших задач в этой области является автоматизация отнесения текста в сообщениях, размещенных в социальных сетях, по категориям с цельюмониторинга изменения настроения интернет-пользователей. Авторами была предложена классификация, которая помогает отнести размещенный пост к той или иной категории.

Были выделены три больших категории постов: информационный, эмоциональный и побудительный. Один и тот же пост может содержать в себе черты информационного, эмоционального и побудительного поста. Каждая из категорий была разделена на подкатегории:

1.информационный: формальный/статический, событийный, личный, интеллектуальнорассуждательский/цитатный, ссылочный и кулинарный;

2.эмоциональный: позитивный, негативный, поздравительный;

3.побудительный: благотворительный, продающий, побудительный к действию.

Для проверки классификации 1300 постов было проанализировано и отнесено к тому или иному классу группой экспертов состояла из 3 человек. Согласованность мнения экспертов(совпадением считалось две оценки из трех) была достаточно высокой -процент совпадений по всем категориям составил свыше 85%(информационный – 87%, эмоциональный – 97%, побудительный – 97%).

В анализе участвовали анкеты студентов, как самой активных пользователей социальных сетей. В результате анализа было выяснено, что в среднем за полгода размещают 37 постов (размах от 1 поста до 318), из них:информационных постов – 41,6%; эмоциональных – 27,1%; побудительных

– 10,2% (0-100).

Таким образом, создана основа для выработки алгоритма по автоматическому отнесению постов к определенным классам.

Суворова А.В.

Россия, Санкт-Петербург, Санкт-Петербургский институт информатики и автоматизации РАН АВТОМАТИЗАЦИЯ ИНСТРУМЕНТАРИЯ ДЛЯ ОБРАБОТКИ ОТВЕТОВ РЕСПОНДЕНТОВ ОБ ЭПИЗОДАХ ИХ ПОВЕДЕНИЯ

Одним из методов получения данных о рискованном поведении индивидов является опрос о последних эпизодах такого поведения. Предложена процедура вычисления интенсивности поведения на основе таких данных, в которой моделью поведения выступает случайный процесс, а в качестве вычислительного аппарата используется байесовская сеть доверия. Для сбора необходимых данных разработана формализованная анкета, включающая вопросы о трех последних эпизодах изучаемого поведения и о максимальном и минимальном интервалах между эпизодами.

Для автоматического преобразования ответов на вопросы об эпизодах поведения, представленные в виде системы фильтров, в численные значения длин интервалов разработана функция на языке R (http://www.r-project.org/) с использованием среды RStudio (http://www.rstudio.com/). При обработке учитываются как несоответствия и противоречия в системе ответов, так и отсутствующие ее элементы. Кроме численных значений длин интервалов (в днях) между эпизодами результатом вычислений являются и кодовые обозначения использованных единиц измерения (часы, дни, недели, месяцы и др.), что позволяет учитывать неопределенность исходных данных, выраженных на естественном языке. Отмечено, что выбор единицы измерения влияет на точность ответа: ответ «месяц назад» обычно не означает в точности «30 дней», поэтому принятие во внимание сведений о единицах измерения позволяет делать более точные выводы об интенсивности изучаемого типа рискованного поведения.

Функция автоматического преобразования ответов была апробирована на данных об эпизодах потребления алкоголя, полученных в рамках полевого исследования 2011 года на базе кожновенерологического диспансера №9 Калининского района Санкт-Петербурга. Менее 3% ответов 502 респондентов представляют собой несогласованную систему, что и было определено в результате обработки данных с помощью разработанной функции; остальные данные преобразованы в числовые значения для последующих выводов об интенсивности поведения.

http://spoisu.ru

546

РЕГИОНАЛЬНАЯ ИНФОРМАТИКА – 2014

 

 

Таким образом, показано, что разработанная функция позволяет полностью автоматизировать преобразования данных из анкет в значения длин интервалов между эпизодами поведения, что необходимо для дальнейшей обработки указанных данных при вычислении интенсивности и производных параметров рискованного поведения респондентов.

Торопова А.В.

Россия, Санкт-Петербург, Санкт-Петербургский институт информатики и автоматизации РАН РЕГИСТРАЦИЯ, ХРАНЕНИЕ И ПОИСК В БАЗЕ НАУЧНЫХ И НАУЧНО-ТЕХНИЧЕСКИХ ЗНАНИЙ НОВОГО ПОКОЛЕНИЯ

Социальные медиа стали неотъемлемой частью жизни большинства людей, в частности ученых. В социальных сетях могут обсуждаться и обсуждаются научные проблемы и вопросы. Для ученых созданы и создаются специальные социальные сети, но использование таких сетей не может сравниться по популярности с использованием социальных сетей, созданных для любого вида общения, например facebook, vkontakte. Но при этом общение в этих сетях устроено таким образом, что не всегда получается легко и быстро найти какие-то нужные сообщения из какого-либо обсуждения, особенно сложной эта задача может оказаться, если эти сообщения были посланы давно, а данная переписка ведется довольно активным образом. Кроме того, у ученых может возникнуть желание поделиться с общественностью обсуждением какого-либо вопроса, но нет инструмента, который бы позволил это сделать в удобной форме.

В докладе рассматривается система, которая могла бы стать решением этой проблемы.

Федоров А.В., Митягин С.А.

Россия, Санкт-Петербург, Санкт-Петербургское государственное унитарное предприятие «Санкт-Петербургский информационно-аналитический центр», Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики

АНАЛИЗ СЛАБОСТРУКТУРИРОВАННЫХ ДАННЫХ ИНТЕРНЕТ-ИСТОЧНИКОВ В ЗАДАЧЕ ВЫЯВЛЕНИЯ СВЯЗИ МЕЖДУ СФЕРАМИ ЖИЗНЕДЕЯТЕЛЬНОСТИ РЕГИОНА

Совместный анализ данных социометрических исследований социальных сетей интернета и картографических данных позволяет осуществлять анализ и прогнозирование процессов жизнедеятельности региона на основе новой логики: используя знания об уровне информационного фона в регионе, вовлеченности населения в различные тематические и субкультурные сообщества. Общее же состояние территории и в частности кризисных областей описывается макроэкономическими показателями развития территории на основе государственной ведомственной статистики.

Альтернативой, ставшим в последнее время традиционными опросным исследованиям, может являться исследование социальных сетей. Данное направление работ является весьма перспективным, поскольку независимо от специфики региона, за исключением уровня развития ИКТ. Исследование социальных сетей позволяет получить еще один важный срез знаний о развитии региона помимо общепринятых на данный момент социологических исследований методами опроса населения и анализа данных официальной государственной статистики.

Внастоящее время данные Интернет-источников и результаты анализа слабоструктурированной информации не используются в планировании развития регионов и информационной поддержке принятия решений руководства, что говорит о новизне данной задачи. Актуальность этой работы обусловлена тем, что планирование в настоящие время не является достаточно эффективным.

Врамках данной работы представлена попытка связать оценку развития региона, осуществляемую на основе мониторинга процессов жизнедеятельности по ряду характерных показателей и оценку состояния общества и территории, получаемую на основе исследования публикаций в Интернете, относящихся к выбранному региону.

Вкачестве предметной области для исследования рассматривается социально-значимые сферы жизнедеятельности региона, в частности оценка уровня преступности, токсикологической ситуации и ситуации, связанной с потреблением наркотиков и алкоголя в регионе, а также вопросы информационной поддержки принятия управленческих решений по стабилизации ситуации в названных областях.

Источниками информации выступают социальные сети, новостные сайты, блоги. Социальные сети и блоги рассматриваются исходя из наличия возможности свободного выражения мнения пользователями. С другой стороны, новостные сайты подвержены цензуре и выражают только официальную оценку ситуации. Исходными данными для анализа являются множества экспертнозаданных ключевых слов, характеризующих те показатели социально-экономического развития региона, между которыми выявлена статическая связь. Далее по этим множествам происходит выборка текстов из интернета. На следующем шаге происходит выделение ключевых

http://spoisu.ru

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В СОЦИОКОМПЬЮТИНГЕ

547

 

 

слов и словосочетаний из каждого выбранного текста. На последнем этапе применяется алгоритм нечеткой кластеризации в объединенном пространстве ключевых слов.

Анализ и интерпретация полученных результатов заключается в построении матрицы евклидовых расстояний между полученными центрами кластеров, определения размеров кластеров, а также анализа матрицы принадлежности. Исходя из этой информации, можно сделать вывод о близости выбранных тематик и соответствующих им показателей развития региона.

В рамках доклада представлен опыт использования данных Интернет источников в системе аналитической поддержки принятия управленческих решений в Санкт-Петербурге.

Федотова А.В., Коробейников А.Г.

Россия, г. Москва, Московский государственный технический университет им. Н.Э. Баумана, Санкт-Петербург, Санкт-Петербургский филиал Института земного магнетизма, ионосферы и распространения радиоволн им. Н.В. Пушкова РАН УПРАВЛЕНИЕ ЗНАНИЯМИ НА ОСНОВЕ СИСТЕМЫ ОНТОЛОГИЙ НА ЭТАПАХ ЖИЗНЕННОГО ЦИКЛА ПРОДУКЦИИ: ИНТЕЛЛЕКТУАЛИЗАЦИЯ МЕТОДОВ ПЛАНИРОВАНИЯ

ТЕХНИЧЕСКОГО ОБСЛУЖИВАНИЯ И РЕМОНТ СЛОЖНЫХ ТЕХНИЧЕСКИХ СИСТЕМ *

Основными стратегиями производства 21го века являются управление жизненным циклом сложных технических систем (СТС). К СТС, рассматриваемым в настоящей работе, относятся как комплексы магнитного зрения и магнитных измерений, так и авиационное оборудование. Управление жизненным циклом СТС (Product Lifecycle Management, PLM) интегрирует данные, процессы, организации и их персонал для обеспечения современных компьютерно-интегрированных организаций. Следует отметить, что концепция PLM стремится ответить на вопросы: как работает предприятие и что им производится.

Главными аспектами инженерии ЖЦ выступают инженерия знаний и управление знаниями о ЖЦ, в частности, на основе наглядного представления его структуры, оптимизация временных соотношений между этапами и стадиями ЖЦ СТС (например, сокращение сроков проектирования и увеличение периода эксплуатации СТС), учет и управление неопределенностями, возникающими на разных этапах ЖЦ. В свою очередь, моделирование ЖЦ создает основу для выработки различных стратегий его управления.

Внашей работе интеллектуализация решения прикладных задач автоматизация и управление технологическими процессами и производствами связывается с информационными гранулами и построением системы онтологий. Предлагается новый подход к управлению знаниями о жизненном цикле, опирающийся на онтологическое моделирование и теорию грануляции информации, что означает построение и использование гранулярных онтологий. Данная работа находится на стыке искусственного интеллекта, системного анализа, управления знаниями и онтологического моделирования.

Конкретная задача в рамках проблемы, на решение которой направлена работа: Построение фундаментальных основ разработки и реализации интеллектуальной системы управления жизненным циклом комплексов магнитного зрения и магнитных измерений с использованием технологий управления знаниями, онтологического моделирования.

Данная задача является крупномасштабной, междисциплинарной и весьма важной для современного производства авиационной техники.

Вдокладе будут представлены разработанные варианты гранулярного представления ЖЦ СТС

сразличной степенью абстрактности, предложена модифицированная спиральная модель ЖЦ. Управление знаниями на протяжении жизненного цикла – это инновационная стратегия

предприятия, направленная на обмен знаниями как ресурсами, используемыми на разных этапах ЖЦ, получение новых и обновление существующих знаний, позволяющих сотрудникам лучше понимать друг друга, эффективно взаимодействовать и совместно решать поставленные задачи. Знания, как продукт деятельности мышления, выступают в форме понятий, отношений между ними, суждений, рассуждений. Важнейшим аспектом управления знаниями на протяжении как всего ЖЦ СТС, так и его этапов является первоначальное структурирование знаний.

В настоящей работе центральное место занимают онтологические методы структурирования и управления знаниями. В докладе будут представлена общая классификация методов структурирования знаний применительно к ЖЦ как комплексов магнитного зрения и магнитных измерений, так и авиационного оборудования, построена система онтологий для обслуживания и ремонта авиационного оборудования с использованием магнитных средств инспекции и контроля, которая включает онтологию предметной области, онтологию задач, онтологию верхнего уровня. Показано, что гранулярные примитивы (интервалы, распределения) имеют ключевое значение для онтологий жизненного цикла сложных технических систем.

Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 14-37-50782 мол_нр.

http://spoisu.ru

548

РЕГИОНАЛЬНАЯ ИНФОРМАТИКА – 2014

 

 

Федотова А.В., Святкина М.Н., Давыденко И.Т.

Россия, г. Москва, Московский государственный технический университет им. Н.Э. Баумана, Республика Беларусь, г. Минск, Белорусский государственный университет информатики и радиоэлектроники ПОСТРОЕНИЕ И ИНТЕГРАЦИЯ СИСТЕМЫ ОНТОЛОГИЙ ДЛЯ РЕАЛИЗАЦИИ СЕМАНТИЧЕСКИХ

ТЕХНОЛОГИЙ ПРОЕКТИРОВАНИЯ ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМ

Настоящий доклад посвящен разработке онтологического подхода к созданию и реализации открытых семантических технологий разработки прикладных интеллектуальных систем

Главная цель нашей работы заключается в разработке массовой, комплексной и развивающейся технологии проектирования интеллектуальных систем, включающей в себя теоретические и практические, программные и аппаратные аспекты.

Его важной особенностью является стремление существенно сократить сроки проектирования интеллектуальных систем.

Авторы доклада предлагают методику компонентного проектирования, которая основывается на постоянно расширяемых библиотеках многократно используемых компонентов (типовых технических решений).

Создание технологии компонентного проектирования требует:

обеспечения совместимости компонентов интеллектуальных систем на основе их единого онтологического представления;

разработки онтологии компонентного проектирования интеллектуальных систем;

создания библиотек многократно используемых (типовых) компонентов интеллектуальных систем и уточнения типологии таких компонентов (онтологии верхнего уровня, предметные онтологии, онтологии задач и приложений, многократно используемые фрагменты баз знаний, машины вывода, интерфейсные компоненты и т.д.);

расширения возможностей языков онтологического моделирования в интересах представления усложненных знаний, создания средств компьютерной поддержки синтеза интеллектуальных систем из имеющихся компонентов.

В информатике под онтологией понимается наглядное и формализованное описание структуры некоторой проблемной области (темы).

Подобное описание всегда опирается на концептуализацию этой области, которая обычно задается в виде исходных понятий, отношений между ними и ограничений.

По сути, онтологии отражают соглашения о единых способах построения и использования концептуальных моделей.

Они выступают как удобный метод представления и повторного использования знаний, средство управления знаниями, способ обучения.

В работе мы опираемся на понимание онтологии как формального представления семантики и широко известное определение онтологии как модели предметной области, использующей все доступные средства представления знаний, релевантные для данной области. Иными словами, онтологический инжиниринг охватывает систему моделей представления знаний.

Соответственно, при формализации онтологий мы используем как наглядные, теоретикографовые (семантические сети, ментальные карты, деревья, графодинамические модели, когнитивные фреймы, ресурсные сети, ресурсно-целевые сети), так и абстрактные алгебраические (алгебраические системы, реляционные системы) и логические (дескриптивные логики, концептуальные логики) модели.

Термин «метаонтология» (т.е. онтология над онтологиями) понимается как основа представления, слияния и интеграции онтологий.

В нашей работе мы используем два различных вида метаонтологий: сингулярную и гранулярную. В частности, использование сингулярной метаонтологии означает выбор обычного языка теории ориентированных графов и деревьев для онтологии предметной области, а переход

кгранулярной метаонтологии означает интервальный характер соответствующей онтологии и ее визуализацию с помощью гиперграфов.

Гранулярные метаонтологии предполагают рассмотрение базовых понятий нижележащей онтологии на различных уровнях абстрактности.

Таким образом, происходит семиотизация онтологий.

В работе главное место занимает развитие онтологического подхода к созданию открытых семантических технологий проектирования интеллектуальных систем, в частности, разработки интеллектуальной метасистемы для поддержки синтеза интеллектуальных систем.

Ведутся работы над построением нечеткое расширение бинарной модели знаний. Отличительной особенностью является разработка методов семиотизации знаний, развитие подходов онтологической семантики, онтологической и логической прагматики.

http://spoisu.ru

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В СОЦИОКОМПЬЮТИНГЕ

549

 

 

Фильченков А.А., Азаров А.А.

Россия, Санкт-Петербург, Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, Санкт-Петербургский институт информатики и автоматизации РАН

ИСПОЛЬЗОВАНИЕ ПСИХОЛОГИЧЕСКИХ ОСОБЕННОСТЕЙ УЧАСТНИКОВ СОЦИАЛЬНОЙ СЕТИ ДЛЯ ОЦЕНКИ АПРИОРНЫХ РАСПРЕДЕЛЕНИЙ ВЕРОЯТНОСТИ ВОСПРИЯТИЯ И ПЕРЕДАЧИ СООБЩЕНИЙ

Одним из широко распространенных подходов к моделированию распространения информации (information / innovation diffusion) в социальных сетях является следующая модель: задан граф, вершинами которого являются пользователи, а ребра обозначают связи между ними. Как-либо узел или несколько узлов инициируются (считается, что соответствующие пользователи создали или получили некоторую информацию) затем происходит итеративный процесс распространения информации по графу. Процесс устроен следующим образом. Для каждой пары смежных вершин (инициированная, неинициированная) с некоторой вероятностью происходит событие, после которого неинициированная вершина становится инициированной. Модель может быть сложнее и включать в себя большее число статусов вершин. В общем виде модель каждого пользователя может быть описана марковской моделью, в которой вероятности перехода между состояниями зависят от состояний соседей.

Одной из основных задач в использовании модели из указанного семейства моделей является параметризация, то есть задание параметров вероятностных распределений перехода между состояниями.

Вместе с тем известно, что различные люди склонны воспринимать и распространять информацию с различной степенью активности, обусловленной их психологическими особенностями. В настоящей работе предлагается использовать это наблюдение для параметризации априорных вероятностей восприятия и передачи информации. Предлагаемый подход подразумевает построение дополнительной модели — психологического профиля пользователя: вектор из нескольких признаков, которые в простейшем случае бинарны и выражают наличие или отсутствие той или иной психологической особенности.

Для выделения соответствующих признаков и построения эмпирических оценок вероятностей необходимо провести исследования среди населения.

В работе предлагается математический формализм для описания вероятностного вывода для оценки вероятности пользователя с известным психологическим портретом осуществления того или иного действия в рамках используемой модели распространения информации в социальных сетях. Также предложено два подхода к построению выборки пользователей.

http://spoisu.ru

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]