- •Сергей Кузнецов, Александр Константинов, Николай Скворцов Ценность ваших данных
- •Предисловие
- •Введение
- •Глава 1. Цифровое многообразие
- •1.1. В чем ценность данных
- •1.2. Данные для науки
- •1.3. Данные для бизнеса
- •1.4. Данные для торговых сетей
- •1.5. Данные для государства
- •Литература к главе 1
- •Глава 2. От данных к мудрости
- •2.1. Данные и информация
- •2.2. Информационная иерархия
- •2.3. Внутри пирамиды знаний
- •2.4. Разрыв между данными и информацией
- •Глава 3. От побочного продукта к стратегическому ресурсу
- •3.1. Эволюция концепций стратегического менеджмента
- •3.2. Ресурсный подход к фирме
- •3.3. Концепция динамических способностей
- •3.4. Взгляд на фирму, основанный на знаниях
- •3.5. Данные как ресурс: ресурсоориентированный взгляд на данные и информацию
- •Литература к главе 3
- •Глава 4. Данные как ресурс: особенности и подходы к управлению
- •4.1. Свойства данных как ресурса
- •4.2. Особенности управления данными как ресурсом
- •4.3. Концепция управления информационными ресурсами
- •Литература к главе 4
- •Глава 5. От стратегического ресурса к ценнейшему активу
- •5.1. Повестка дня для совета директоров: развитие концепции управления информационными ресурсами
- •5.2. Данные как актив
- •5.3. Семь законов информации
- •5.4. Модели оценки информационных активов
- •5.5. Три уровня ценности информационных активов
- •Литература к главе 5
- •Глава 6. Данные как актив: барьеры и ошибки на пути извлечения ценности
- •6.1. Барьеры на пути развертывания информационных активов и Лидерский манифест о данных
- •6.3. Доктрина в области данных (версия 2)
- •6.5. Семь «смертных грехов» в области работы с данными
- •Литература к главе 6
- •Глава 7. Построение цепочек
- •7.1. Цепочка ценности данных
- •7.2. Цепочка поставок данных
- •7.3. Дата-центричная организация и организация, управляемая на основе данных
- •7.4. Управление информационными активами и управление корпоративной информацией: в чем разница?
- •7.5. Управление корпоративной информацией: необходимость актуализации повестки дня для совета директоров
- •7.6. Управление корпоративной информацией: сегодняшняя повестка дня для совета директоров
- •7.7. Управление корпоративной информацией: выгоды от внедрения и чек-лист для совета директоров
- •Литература к главе 7
- •Глава 8. Данные как объект управления
- •8.1. Источники данных и виды информационных активов
- •8.2. Классификация данных
- •8.3. Жизненный цикл данных, цепочка данных и происхождение данных
- •8.4. Системы и люди (организации, подразделения, сотрудники) в процессах управления данными
- •8.5. Эволюция управления данными в организациях и референтные модели
- •Литература к главе 8
- •Глава 9. Управление данными: принципы и структуры
- •9.1. Методология DAMA-DMBOK
- •9.2. Принципы создания системы управления данными
- •9.3. Модель зрелости управления данными
- •Литература к главе 9
- •Глава 10. Руководство данными
- •10.1. Руководство данными и его ключевая роль в управлении данными
- •10.2. Стратегия работы с данными
- •10.3. Программа руководства данными
- •10.4. Распоряжение данными
- •10.5. Организационная система руководства и управления данными
- •10.6. Контекстная диаграмма области знаний и уровни зрелости функции «Руководство данными»
- •Литература к главе 10
- •Глава 11. Планирование и проектирование данных
- •11.1. Архитектура данных
- •11.2. Моделирование и проектирование данных
- •Литература к главе 11
- •Глава 12. Обеспечение доступности и обслуживание данных: основы
- •12.1. Хранение и операции с данными
- •12.2. Интеграция и интероперабельность данных
- •12.3. Управление справочными и основными данными
- •Литература к главе 12
- •Глава 13. Управление основными данными: практика внедрения
- •13.1. Две стратегии внедрения MDM
- •13.3. MDM-проекты
- •13.5. Описание модели
- •13.6. Примеры MDM-проектов
- •13.7. Сопоставление существующих и описанного подходов
- •13.8. Пример архитектуры информационных систем, основанной на комплексном MDM-решении
- •Литература к главе 13
- •Глава 14. Обеспечение доступности и обслуживание данных: развитие
- •14.1. Ведение хранилищ данных и бизнес-аналитика
- •14.2. Управление документами и контентом
- •14.3. Большие данные и наука о данных
- •Литература к главе 14
- •Глава 15. Базовая поддержка жизненного цикла данных
- •15.1. Управление безопасностью данных
- •15.2. Управление метаданными
- •15.3. Управление качеством данных
- •Литература к главе 15
- •Глава 16. Организационные аспекты управления данными
- •16.1. Операционные модели руководства данными и управления данными
- •16.2. Роли, относящиеся к руководству и управлению данными
- •16.3. Ключевые первоначальные шаги
- •Литература к главе 16
- •Глава 17. Использование данных и расширение возможностей применения
- •17.1. Использование основных данных
- •17.2. Бизнес-аналитика
- •17.3. Наука о данных
- •17.4. Развитие платформенных решений в области управления данными
- •Литература к главе 17
- •Глава 18. Основные тренды будущего
- •18.1. Основные тренды на ближайшую перспективу
- •18.2. Ценность данных в различных областях
- •Литература к главе 18
- •Заключение
- •Сноски
|
|
|
|
hang |
e |
|
|
|
|
|
|
|
|
C |
|
E |
|
|
|||
|
|
X |
|
|
|
|
|
|||
|
- |
|
|
|
|
|
d |
|
||
|
F |
|
|
|
|
|
|
t |
|
|
|
D |
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
r |
||
P |
|
|
|
|
|
NOW! |
o |
|||
|
|
|
|
|
|
|
||||
|
|
|
|
|
BUY |
|
|
|||
|
|
|
|
to |
|
|
|
|
|
|
w Click |
|
|
|
|
|
m |
||||
|
|
|
|
|
|
|||||
w |
|
|
|
|
|
|
|
|
|
|
|
w |
|
|
|
|
|
|
|
o |
|
|
. |
|
|
|
|
|
.c |
|
||
|
|
p |
|
|
|
|
g |
|
|
|
|
|
|
df |
|
|
n |
e |
|
||
|
|
|
|
-xcha |
|
|
|
|
|
|
|
|
hang |
e |
|
|
|
|
|
|
|
|
C |
|
E |
|
|
|||
|
|
X |
|
|
|
|
|
|||
|
- |
|
|
|
|
|
d |
|
||
|
F |
|
|
|
|
|
|
t |
|
|
|
D |
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
r |
||
P |
|
|
|
|
|
NOW! |
o |
|||
|
|
|
|
|
|
|
||||
|
|
|
|
|
BUY |
|
|
|||
|
|
|
|
to |
|
|
|
|
|
|
w Click |
|
|
|
|
|
m |
||||
|
|
|
|
|
|
|||||
w |
|
|
|
|
|
|
|
|
|
|
|
w |
|
|
|
|
|
|
|
o |
|
|
. |
|
|
|
|
|
.c |
|
||
|
|
p |
|
|
|
|
g |
|
|
|
|
|
|
df |
|
|
n |
e |
|
||
|
|
|
|
-x cha |
|
|
|
|
2.4. Разрыв между данными и информацией
Хотя пирамида знаний служит общепринятой устоявшейся моделью, с каждым годом появляются новые публикации с предложениями по ее корректировке на основе учета современных тенденций.
Можно обратить внимание, например, на статью[73]. В ней справедливо отмечается, что, хотя общее количество собираемых данных стремительно возрастает, не все из них образуют базу для информации, не говоря уже о знаниях или мудрости. Нельзя не учитывать тот факт, что данные могут быть неточными или ложными. Таким образом, постоянно растущие собрания больших массивов данных также обязательно включают в себя и постоянно растущие собрания больших массивов неточных или ложных данных. На сегодняшний день нет никаких известных исследований, показывающих, остается ли удельный вес неточных или ложных данных постоянным по мере роста общего объема собираемых данных. Возможно, его величина сохраняется прежней или уменьшается, но не исключено, что доля неточных и ложных данных увеличивается. Это может происходить, в частности, из-за стремительного роста различного рода фейковых новостей или же по причине отрицательной реакции людей на сам сбор данных и т. п.[74] Поэтому просто сбор данных не приносит особой пользы. Что действительно ценно и необходимо, так это увеличение сбора точных и достоверных данных. Приведенные соображения, естественно, предполагают, что конечная цель получения данных – обретение знаний и мудрости, и не распространяются, например, на компании, чья основная деятельность – построение и обслуживание дата-центров, собирающих и хранящих любые данные.
Исходя из этого, в статье предложена нелинейная схема, отражающая взаимоотношения элементов иерархии DIKW (рис. 2.5). На ней элементы представлены в виде перекрывающихся и соприкасающихся областей (диаграмма Венна). Данные и информация не лежат в основе знаний и мудрости, а просто частично входят в их состав. В ближайшие годы область данных, вероятно, будет расти экспоненциально, но еще неизвестно, увеличатся ли в размерах какиелибо другие области. Преимущество приведенной диаграммы в том,
|
|
|
|
hang |
e |
|
|
|
|
|
|
|
|
C |
|
E |
|
|
|||
|
|
X |
|
|
|
|
|
|||
|
- |
|
|
|
|
|
d |
|
||
|
F |
|
|
|
|
|
|
t |
|
|
|
D |
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
r |
||
P |
|
|
|
|
|
NOW! |
o |
|||
|
|
|
|
|
|
|
||||
|
|
|
|
|
BUY |
|
|
|||
|
|
|
|
to |
|
|
|
|
|
|
w Click |
|
|
|
|
|
m |
||||
|
|
|
|
|
|
|||||
w |
|
|
|
|
|
|
|
|
|
|
|
w |
|
|
|
|
|
|
|
o |
|
|
. |
|
|
|
|
|
.c |
|
||
|
|
p |
|
|
|
|
g |
|
|
|
|
|
|
df |
|
|
n |
e |
|
||
|
|
|
|
-xcha |
|
|
|
|
|
|
|
|
hang |
e |
|
|
|
|
|
|
|
|
C |
|
E |
|
|
|||
|
|
X |
|
|
|
|
|
|||
|
- |
|
|
|
|
|
d |
|
||
|
F |
|
|
|
|
|
|
t |
|
|
|
D |
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
r |
||
P |
|
|
|
|
|
NOW! |
o |
|||
|
|
|
|
|
|
|
||||
|
|
|
|
|
BUY |
|
|
|||
|
|
|
|
to |
|
|
|
|
|
|
w Click |
|
|
|
|
|
m |
||||
|
|
|
|
|
|
|||||
w |
|
|
|
|
|
|
|
|
|
|
|
w |
|
|
|
|
|
|
|
o |
|
|
. |
|
|
|
|
|
.c |
|
||
|
|
p |
|
|
|
|
g |
|
|
|
|
|
|
df |
|
|
n |
e |
|
||
|
|
|
|
-x cha |
|
|
|
|
что она точнее отражает соотношение представленных на ней понятий, чем пирамида знаний, и, что не менее важно, ориентирует на углубление знаний и обретение мудрости, а не просто на увеличение сбора данных.
* Van Meter, Heather J. Revising the DIKW Pyramid and the Real Relationship Between Data, Information, Knowledge and Wisdom. Law Technology and Humans, 2020, Vol. 2. No. 2, 69–80. DOI: 10.5204/lthj.1470. – URL: https://lthj.qut.edu.au/article/view/1470.
Основываясь на сведениях, полученных в ходе нашего обзора взаимоотношений между элементами иерархии DIKW, можно сказать, что с точки зрения этих взаимоотношений деятельность любой организации представляет собой множество циклических цепочек преобразований «данные – информация – знания»[75][76][77].
|
|
|
|
hang |
e |
|
|
|
|
|
|
|
|
C |
|
E |
|
|
|||
|
|
X |
|
|
|
|
|
|||
|
- |
|
|
|
|
|
d |
|
||
|
F |
|
|
|
|
|
|
t |
|
|
|
D |
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
r |
||
P |
|
|
|
|
|
NOW! |
o |
|||
|
|
|
|
|
|
|
||||
|
|
|
|
|
BUY |
|
|
|||
|
|
|
|
to |
|
|
|
|
|
|
w Click |
|
|
|
|
|
m |
||||
|
|
|
|
|
|
|||||
w |
|
|
|
|
|
|
|
|
|
|
|
w |
|
|
|
|
|
|
|
o |
|
|
. |
|
|
|
|
|
.c |
|
||
|
|
p |
|
|
|
|
g |
|
|
|
|
|
|
df |
|
|
n |
e |
|
||
|
|
|
|
-xcha |
|
|
|
|
|
|
|
|
hang |
e |
|
|
|
|
|
|
|
|
C |
|
E |
|
|
|||
|
|
X |
|
|
|
|
|
|||
|
- |
|
|
|
|
|
d |
|
||
|
F |
|
|
|
|
|
|
t |
|
|
|
D |
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
r |
||
P |
|
|
|
|
|
NOW! |
o |
|||
|
|
|
|
|
|
|
||||
|
|
|
|
|
BUY |
|
|
|||
|
|
|
|
to |
|
|
|
|
|
|
w Click |
|
|
|
|
|
m |
||||
|
|
|
|
|
|
|||||
w |
|
|
|
|
|
|
|
|
|
|
|
w |
|
|
|
|
|
|
|
o |
|
|
. |
|
|
|
|
|
.c |
|
||
|
|
p |
|
|
|
|
g |
|
|
|
|
|
|
df |
|
|
n |
e |
|
||
|
|
|
|
-x cha |
|
|
|
|
Данные появляются в результате выполнения каких-либо действий, например операций по продаже клиенту товара или предоставлению гражданину государственной услуги (рис. 2.6). Эти данные могут быть преобразованы в ценную информацию, в частности, если зафиксировать сведения о том, что для определенного клиента заказ выполнен повторно. В свою очередь эта информация наполняет хранилище, содержащее корпоративные знания и позволяющее на основании совокупности сведений о заказах сделать, допустим, следующий вывод: клиенты старше 40 лет лучше реагируют на недавно проведенную рекламную кампанию.
С учетом этих знаний организация может приступить к дальнейшим действиям, например провести целевую кампанию, направленную на охват клиентов в возрасте до 40 лет, что приведет к увеличению продаж. Соответственно, появятся новые данные, новая информация и новые знания, на основе которых будут осуществляться новые действия. Таким образом, цикл повторяется.
|
|
|
|
hang |
e |
|
|
|
|
|
|
|
|
C |
|
E |
|
|
|||
|
|
X |
|
|
|
|
|
|||
|
- |
|
|
|
|
|
d |
|
||
|
F |
|
|
|
|
|
|
t |
|
|
|
D |
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
r |
||
P |
|
|
|
|
|
NOW! |
o |
|||
|
|
|
|
|
|
|
||||
|
|
|
|
|
BUY |
|
|
|||
|
|
|
|
to |
|
|
|
|
|
|
w Click |
|
|
|
|
|
m |
||||
|
|
|
|
|
|
|||||
w |
|
|
|
|
|
|
|
|
|
|
|
w |
|
|
|
|
|
|
|
o |
|
|
. |
|
|
|
|
|
.c |
|
||
|
|
p |
|
|
|
|
g |
|
|
|
|
|
|
df |
|
|
n |
e |
|
||
|
|
|
|
-xcha |
|
|
|
|
|
|
|
|
hang |
e |
|
|
|
|
|
|
|
|
C |
|
E |
|
|
|||
|
|
X |
|
|
|
|
|
|||
|
- |
|
|
|
|
|
d |
|
||
|
F |
|
|
|
|
|
|
t |
|
|
|
D |
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
r |
||
P |
|
|
|
|
|
NOW! |
o |
|||
|
|
|
|
|
|
|
||||
|
|
|
|
|
BUY |
|
|
|||
|
|
|
|
to |
|
|
|
|
|
|
w Click |
|
|
|
|
|
m |
||||
|
|
|
|
|
|
|||||
w |
|
|
|
|
|
|
|
|
|
|
|
w |
|
|
|
|
|
|
|
o |
|
|
. |
|
|
|
|
|
.c |
|
||
|
|
p |
|
|
|
|
g |
|
|
|
|
|
|
df |
|
|
n |
e |
|
||
|
|
|
|
-x cha |
|
|
|
|
Вэтом цикле данные играют роль первичного строительного блока. Они возникают из действий и приводят к новым действиям. Эффективность преобразования данных в информацию определяет эффективность получения знаний, а также предпринимаемых на их основе дальнейших действий.
Вэтой связи область бизнес-аналитики (Business Intelligence, BI), обсуждаемую более подробно в следующих главах, можно представить как «завод по очистке данных» (рис. 2.7). Он превращает сырье (данные) в разнообразные информационные продукты: «информацию», которая собирается и агрегируется в хранилищах данных; «знания», которые собираются из запросов, сообщений и от аналитических инструментов; «планы», которые собираются по кусочкам из правил, закономерностей, моделей и схем, обнаруженных с помощью аналитических инструментов; и «действия», посредством которых бизнес-пользователи реализуют планы, генерирующие события,
которые в свою очередь начинают новый цикл[78].
|
|
|
|
hang |
e |
|
|
|
|
|
|
|
|
C |
|
E |
|
|
|||
|
|
X |
|
|
|
|
|
|||
|
- |
|
|
|
|
|
d |
|
||
|
F |
|
|
|
|
|
|
t |
|
|
|
D |
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
r |
||
P |
|
|
|
|
|
NOW! |
o |
|||
|
|
|
|
|
|
|
||||
|
|
|
|
|
BUY |
|
|
|||
|
|
|
|
to |
|
|
|
|
|
|
w Click |
|
|
|
|
|
m |
||||
|
|
|
|
|
|
|||||
w |
|
|
|
|
|
|
|
|
|
|
|
w |
|
|
|
|
|
|
|
o |
|
|
. |
|
|
|
|
|
.c |
|
||
|
|
p |
|
|
|
|
g |
|
|
|
|
|
|
df |
|
|
n |
e |
|
||
|
|
|
|
-xcha |
|
|
|
|
|
|
|
|
hang |
e |
|
|
|
|
|
|
|
|
C |
|
E |
|
|
|||
|
|
X |
|
|
|
|
|
|||
|
- |
|
|
|
|
|
d |
|
||
|
F |
|
|
|
|
|
|
t |
|
|
|
D |
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
r |
||
P |
|
|
|
|
|
NOW! |
o |
|||
|
|
|
|
|
|
|
||||
|
|
|
|
|
BUY |
|
|
|||
|
|
|
|
to |
|
|
|
|
|
|
w Click |
|
|
|
|
|
m |
||||
|
|
|
|
|
|
|||||
w |
|
|
|
|
|
|
|
|
|
|
|
w |
|
|
|
|
|
|
|
o |
|
|
. |
|
|
|
|
|
.c |
|
||
|
|
p |
|
|
|
|
g |
|
|
|
|
|
|
df |
|
|
n |
e |
|
||
|
|
|
|
-x cha |
|
|
|
|
* Эккерсон У. Панели индикаторов как инструмент управления: ключевые показатели эффективности, мониторинг деятельности, оценка результатов / Пер. с англ. – М.: Альпина Бизнес Букс, 2007.
Между тем практика автоматизации большинства организаций показывает, что преобразование данных в информацию на сегодня слабейшее звено в описанной циклической цепочке. Очень часто мы наблюдаем своего рода разрыв (gap) между данными и информацией (см. рис. 2.6). Причиной могут явиться данные следующих категорий: плохо определенные, разрозненные, дублирующиеся, низкого качества или устаревшие. Кроме того, данных может быть недостаточно, или же, наоборот, слишком много. Устранение указанных слабых мест, повышение ценности данных – актуальнейшая задача для организации в современных условиях, если она хочет выжить и процветать[79].
Необходимым шагом в преодолении разрыва между данными и информацией является изменение отношения организации к своим
|
|
|
|
hang |
e |
|
|
|
|
|
|
|
|
C |
|
E |
|
|
|||
|
|
X |
|
|
|
|
|
|||
|
- |
|
|
|
|
|
d |
|
||
|
F |
|
|
|
|
|
|
t |
|
|
|
D |
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
r |
||
P |
|
|
|
|
|
NOW! |
o |
|||
|
|
|
|
|
|
|
||||
|
|
|
|
|
BUY |
|
|
|||
|
|
|
|
to |
|
|
|
|
|
|
w Click |
|
|
|
|
|
m |
||||
|
|
|
|
|
|
|||||
w |
|
|
|
|
|
|
|
|
|
|
|
w |
|
|
|
|
|
|
|
o |
|
|
. |
|
|
|
|
|
.c |
|
||
|
|
p |
|
|
|
|
g |
|
|
|
|
|
|
df |
|
|
n |
e |
|
||
|
|
|
|
-xcha |
|
|
|
|
|
|
|
|
hang |
e |
|
|
|
|
|
|
|
|
C |
|
E |
|
|
|||
|
|
X |
|
|
|
|
|
|||
|
- |
|
|
|
|
|
d |
|
||
|
F |
|
|
|
|
|
|
t |
|
|
|
D |
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
r |
||
P |
|
|
|
|
|
NOW! |
o |
|||
|
|
|
|
|
|
|
||||
|
|
|
|
|
BUY |
|
|
|||
|
|
|
|
to |
|
|
|
|
|
|
w Click |
|
|
|
|
|
m |
||||
|
|
|
|
|
|
|||||
w |
|
|
|
|
|
|
|
|
|
|
|
w |
|
|
|
|
|
|
|
o |
|
|
. |
|
|
|
|
|
.c |
|
||
|
|
p |
|
|
|
|
g |
|
|
|
|
|
|
df |
|
|
n |
e |
|
||
|
|
|
|
-x cha |
|
|
|
|
данным. Она должна перестать относиться к данным как к побочному продукту (byproduct) операционной деятельности и начать рассматривать данные как стратегически важный ресурс[80][81]. Об этом мы поговорим в следующей главе.
В завершение этой главы обратим внимание на следующее. Обсуждая иерархию DIKW и ликвидацию разрыва между данными и информацией, мы рассматриваем эти понятия как разные вещи, в действительности они тесно переплетены и по отдельности друг от друга не существуют. Данные – это форма информации, а информация – это форма данных, что, в частности, отмечается в
DAMA-DMBOK[82].
При этом в DAMA-DMBOK подчеркивается, что внутри организации полезно проводить четкую границу между информацией и данными хотя бы в целях более ясного донесения требований и ожиданий по различным направлениям практической работы до различных заинтересованных аудиторий. (Пример: «Предлагаем ознакомиться с отчетом о продажах за минувший квартал [информация]. Он составлен на основе данных нашего информационного хранилища [данные]. В следующем квартале эти результаты [данные] будут использованы для создания сравнительных показателей нашей работы по отношению к предыдущему кварталу [информация]».)
Признание различий между данными и информацией, а также между целями, для которых они могут быть использованы, служит основой стержневого постулата об управлении данными: предметом управления являются и данные, и информация; при этом качество и того и другого возрастает лишь при согласованном управлении с учетом потребностей конечных потребителей. Таким образом, когда мы говорим о преодолении разрыва межу данными и информацией, мы, по сути дела, подразумеваем плавный («бесшовный») переход одного в другое. Поэтому в дальнейшем в этой книге, как и в DAMA-DMBOK, термины «информация» и «данные» используются как взаимозаменяемые синонимы (за исключением тех случаев, когда это оговаривается особо).