Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СОВРЕМЕННЫЕ ТЕХНОЛОГИИ АНАЛИЗА - копия - копия.doc
Скачиваний:
21
Добавлен:
27.11.2019
Размер:
625.15 Кб
Скачать

Банковское дело

Достижения технологии Data Mining используются в бан­ковском деле для решения следующих распространенных за­дач.

Анализ кредитного риска. Анализ кредитного риска заклю­чается прежде всего в оценке кредитоспособности заемщика. Эта задача решается на основе анализа накопленной информа­ции, то есть кредитной истории «прошлых» клиентов. С помо­щью инструментов Data Mining банк может получить «профи­ли» добросовестных и неблагонадежных заемщиков.

Привлечение новых клиентов. Осуществив средствами Data Mining сегментацию клиентов, банк может найти наиболее выгодных из них и далее акцентировать свою маркетинговую политику на привлечение клиентов, соответствующих найден­ному «профилю». Помимо этого можно установить, какие группы клиентов предпочитают те или иные банковские услуги, и проводить рекламные и маркетинговые мероприятия бо­лее целенаправленно и эффективно.

Прогнозирование остатка на счетах клиентов. Применяя поэтапную статистическую обработку временного ряда с ис­пользованием различных алгоритмов Data Mining, возможно получить прогноз остатка на счетах на определенный период в будущем. Результаты прогнозирования могут использоваться для оценки ликвидности банка и управления его активами.

Выявление случаев мошенничества с кредитными карточками. В борьбе с мошенничеством технология Data Mining использует стереотипы подозрительных операций, созданные в результате анализа огромного количества транзакций — как законных, так и неправомерных. Исследуется не только отдельно взятая опе­рация, но и совокупность последовательных во времени тран­закций. Кроме того, имеющиеся в составе data mining-продук­тов алгоритмы и модели (например, нейронные сети) способны тестироваться и самообучаться. При попытке совершения подо­зрительной операции средства интеллектуального анализа дан­ных оперативно выдают предупреждение об этом, что позволя­ет банку предотвратить незаконные действия, а не устранять их последствия. Использование технологии Data Mining позволяет сократить число нарушений на 20—30%.

Страхование

Страховые компании в течение ряда лет накапливают большие объемы данных. Здесь обширное поле деятельности для методов Data Mining.

Выявление мошенничества. Страховые компании могут снизить уровень мошенничества, отыскивая определенные стереотипы в заявлениях о выплате страхового возмещения, характеризующих взаимоотношения между юристами, врача­ми и заявителями.

Анализ риска. Путем выявления сочетаний факторов, свя­занных с оплаченными заявлениями, страховщики могут уменьшить свои потери по обязательствам. Известен случай, когда в США крупная страховая компания обнаружила, что суммы, выплаченные по заявлениям людей, состоящих в бра­ке, вдвое превышают суммы по заявлениям одиноких людей. Компания отреагировала на это новое знание пересмотром своей общей политики предоставления скидок семейным кли­ентам. Телекоммуникации

В области телекоммуникаций методы Data Mining помога­ют компаниям более энергично продвигать свои программы маркетинга и ценообразования, чтобы удерживать существую­щих клиентов и привлекать новых. Среди типичных меропри­ятий следующие.

Анализ записей о подробных характеристиках вызовов. На­значение такого анализа — выявление категорий клиентов с похожими стереотипами пользования их услугами и разработ­ка привлекательных наборов цен и услуг. Такой анализ позво­ляет выделить скрытые и порой совсем не очевидные взаимо­связи в характеристиках клиентов.

Выявление лояльности клиентов. Data Mining можно ис­пользовать для определения характеристик клиентов, кото­рые, один раз воспользовавшись услугами данной компании, с большой долей вероятности останутся ей верными. В итоге средства, выделяемые на маркетинг, можно тратить там, где отдача больше всего.

Text mining

Технология добычи текстовых данных (text mining) предос­тавляет пользователям инструментарий, позволяющий анали­зировать большие собрания информации в поисках тенден­ций, шаблонов и взаимосвязей, способных помочь в принятии стратегических решений (Кузнецов С, 1998).

Программы и алгоритмы обработки текстовой информа­ции можно грубо разделить на две категории: системы лингви­стического анализа и анализа текстовых данных. Основными элементами Text Mining являются суммаризация (summariza­tion), тематический поиск (feature extraction), кластеризация (clustering), классификация (classification), ответ на запросы (question answering), тематическое индексирование (thematic indexing) и поиск по ключевым словам (keyword searching). Также в некоторых случаях набор дополняют средства под­держки и создания офтаксономии (oftaxonomies) и тезаурусов (thesauri) (Zornes А., 1998). Некоторые производители объеди­няют большинство средств в один программный комплекс, как, например, IBM Intelligent Miner for Text или Oracle InterMedia Text.

Все разработки и внедряемые алгоритмы Text Mining, a также задачи лингвистического анализа текста применялись в направлении добычи данных в крупных СУБД, базах знаний и информационных системах корпоративного масштаба.

ПРОВЕДЕНИЕ СТРАТЕГИЧЕСКОГО АНАЛИЗА В БАНКЕ С ИСПОЛЬЗОВАНИЕМ ТЕХНОЛОГИИ DATA MINING1

Настоящий пример стратегического анализа в банке пре­следует три цели:

  1. рассказать в общих чертах о методике анализа внешней среды как составной части методического обеспечения страте­гического управления во Внешэкономбанке;

  2. донести тезис о том, что многое из того (имеется в виду аналитический инструментарий), что разработано в рамках дисциплины «Стратегический анализ», при его конкретной реализации сводится к единой схеме последовательного при­менения стандартных аналитических процедур, широко при­меняемых в теориях распознавания образов и принятия реше­ний;

  3. продемонстрировать, как технология обработки данных Data Mining позволяет обеспечить новый, более глубокий уро­вень проработки классических вопросов стратегического ана­лиза.

Методика анализа внешней среды

Решение стратегических задач, направленных на реформи­рование Внешэкономбанка, поиск наиболее оптимальных пу­тей его развития сегодня невозможны без учета влияния внеш­ней среды, характерной своей нестабильностью и непредска­зуемостью. Как справедливо отмечает ряд авторов, современные банковские стратегии исходят из представления о банке как об «открытой системе», успех которой определяет­ся тем, насколько удачно она приспосабливается к изменени­ям, происходящим во внешней среде. В этих условиях главным критерием эффективности стратегического управления бан­ком становится своевременное распознавание угроз и преиму­ществ для его существования, способность устойчиво противостоять нестабильности внешней среды и рационально ис­пользовать возникающие возможности.

Краеугольным камнем стратегического управления бан­ком, наряду со стратегическим планированием и контролем, является стратегический анализ. Стратегический анализ пред­ставляет собой достаточно сложную систему составляющих его анализов, наиболее трудным из которых является анализ внешней среды, включающий в себя анализ макросреды и ана­лиз микросреды (отраслевой и конкурентный анализы). Каж­дый из перечисленных видов анализа распадается, в свою оче­редь, на еще более специфические анализы, что в итоге приво­дит к определенной системе логически взаимоувязанных методов анализа. В качестве примера можно привести разрабо­танную Управлением развития и стратегического планирова­ния Внешэкономбанка методику анализа внешней среды, со­стоящую из методов анализа двух уровней.

На первом уровне располагаются классические (базовые), традиционные для этой области методы стратегического ана­лиза:

  • PEST(Political, Economic, Social, Technological) — ана­лиз, состоящий из анализов политической, экономичес­кой, социальной и технологической сфер;

  • отраслевой анализ, состоящий из анализа жизненного цикла отрасли, анализа движущих сил отрасли, анализа фактора успехов в отрасли и др.;

  • конкурентный анализ, состоящий из оценки типа конку­ренции и степени ее интенсивности, анализа основных конкурентных сил, анализа стратегических групп конку­ренции и др.

В описании методов первого уровня освещаются следую­щие аспекты: «что делать», то есть общая схема метода, какие информационные источники использовать, Какие ресурсы (человеческие, алгоритмические, программные и др.) привле­кать. Однако для конкретной реализации базовых методов описаний на таком уровне детализации недостаточно. Для то­го чтобы раскрыть технику применения базового метода, необ­ходим второй уровень методов (вспомогательный), который уже объясняет не «что делать», а «как делать». На этом уровне описываются алгоритмы и модели решения задач, которые возникают при реализации базовых методов. Во второй части доклада приводится описание некоторых из этих задач, кото­рые по своей сути также являются типовыми, но уже в рамках других дисциплин — теорий обработки данных и принятия ре­шений.

Второй уровень анализа внешней среды включает методи­ки, описывающие вспомогательные методы анализа:

  • методика поиска новых факторов внешней среды на ос­нове технологии автоматического анализа текстов;

  • методика анализа и оценки однородных факторов внеш­ней среды на основе самоорганизующихся карт признаков;

  • методика анализа внешней среды в сложных ситуациях на основе когнитивных карт;

  • методика применения метода сценариев;

  • методика экспертного прогнозирования;

  • методика анализа нестабильности внешней среды;

  • методика построения стратегических групп конкурен­ции;

  • методика анализа степени интенсивности рыночной конкуренции;

  • методика отслеживания (мониторинга) конкурентов;

  • методика применения метода анализа иерархий.

Среди перечисленных выше методик большинство извест­ны в рамках теории принятия решений. Однако потребовались определенные усилия по их привязке к базовым методам ана­лиза внешней среды банка. Технологию Data Mining использу­ет методика 2.

Единый подход к методам анализа внешней среды

  • Предлагаемые в многочисленных изданиях по стратегиче­скому менеджменту методы анализа внешней среды практиче­ски можно свети к последовательности трех вложенных в себя по сферам применения типов анализа: анализ макросреды, от­раслевой анализ и конкурентный анализ. Объектами рассмот­рения этих анализов являются сферы политики, экономики, социальная, технологическая, а иногда и экологическая для макросреды; те или иные отрасли хозяйствования для отрасле­вого анализа, а также конкурентные силы, действующие на рынках товаров и услуг, для конкурентного анализа. Все три типа анализа преследуют три главные цели в отношении дан­ной организации (банка): оценить произошедшие изменения в рассматриваемой сфере;

  • выявить потенциальные угрозы для текущей и будущей деятельности;

  • обнаружить потенциальные возможности для реализа­ции стратегических целей.

  • Достижение этих трех целей осуществляется посред­ством последовательного решения следующих трех аналитиче­ских задач:

  • рассмотреть по возможности максимальное число фак­торов, релевантных поставленным целям, и отобрать среди них наиболее важные с точки зрения их влияния на конечные цели;

  • определить или оценить, в каком состоянии находятся эти факторы сейчас и каковы перспективы их развития в буду­щем (на горизонт стратегического планирования);

  • идентифицировать настоящие и будущие состояния факторов как угрозы или возможности для банка.

Методы анализа, которыми можно решать перечисленные аналитические задачи.

Сбор релевантных факторов, влияющих на цели, можно проводить тремя путями:

  • воспользоваться эталонным (типовым) списком факто­ров, разработанных заранее по данной проблеме. Эталонные списки факторов апробированы, широко известны и общедо­ступны, Но в силу своей универсальности могут оказаться впоследствии малопродуктивны;

  • привлечь опытных специалистов в данной предметной области, провести их опрос и составить экспертное заключе­ние. Этот метод в основном и используется на практике, но он сопряжен с известными в таких случаях издержками (затраты на привлечение экспертов, субъективизм экспертных оценок и

др.);

— применить технологию полуавтоматического поиска ре­левантных факторов путем использования технологии Text Data Mining, то есть извлечения полезных знаний из больших массивов текстовой информации по данной проблеме. Эта технология в настоящее время получает все большую популяр­ ность благодаря своей простоте и удобству для аналитика, вы­сочайшей скорости обработки огромных массивов исходной информации и объективности получаемых решений (более по дробно о применении этой технологии — в третьей части до­клада).

Последний метод более предпочтителен, так как требует (при наличии программных средств реализации) гораздо мень­шего времени и, главное, может обнаружить новые, неожидан­ные, скрытые в массивах исходной информации факторы вли­яния.

Отбор наиболее важных факторов можно проводить не­сколькими методами, хорошо разработанными в теории при­нятия решений.

Как правило, это линейное или групповое ранжирование факторов в условиях задания одного или нескольких критери­ев отбора (степень влияния фактора на цель, стоимость полу­чения информации о факторе, трудности оценки его состоя­ния и др.) и преференций аналитика, основанного на его лич­ных знаниях и опыте. При наличии формализованных критериев отбора (целевого функционала) и ограничений дан­ная задача сводится к проблеме комбинаторной оптимизации и хорошо решается методами генетических алгоритмов.

Другой, более сложный путь решения — это построение по исходной исторической информации о факторах регрессион­ной модели, на входе которой — значения всех релевантных факторов, а на выходе — уровень достижения заданной цели. После обучения (тренировки и тестирования) модели прово­дится анализ ее чувствительности, по которому и устанавлива­ется степень влияния (важности) каждого входного фактора на выходную целевую величину.

Вторая задача — отбор наиболее важных факторов — не менее значима, чем первая, так как позволяет существенно со­кратить пространство дальнейшего поиска и снизить трудоза­траты на выполнение последующих процедур.

Определение состояния факторов внешней среды пред­ставляет собой присвоение конкретных значений переменным внешней среды, описывающим данный фактор, а также про­верку условий относительно их соотношения между собой.

В простейшем случае определение состояния фактора яв­ляется тривиальной задачей, сводящейся к означиванию пере­менных фактора, вычислению по ним агрегированной скаляр­ной величины типа свертки (аддитивной или мультипликатив­ной) и сравнения с пороговыми величинами для присвоения уже качественного значения, определяющего состояния фактора. По существу используется скоринговая модель, когда экспертным или иным путем оцениваются значения перемен­ных фактора и рассчитывается взвешенная оценка по всем факторным переменным.

В более сложном случае, когда определяется состояние сложного комплексного фактора, представленного большим числом разноплановых переменных, использования простей­ших скоринговых моделей уже недостаточно. В этих случаях можно применить технологию самоорганизующихся карт признаков Кохонена, которая позволяет вначале на основе ис­торических данных строить карты многомерных состояний фактора, а затем с их помощью быстро определять текущее со­стояние фактора. Технология относится частично к аналити­ческому, а частично к визуальному Data Mining.

Идентификация состояния факторов представляет собой классическую классификационную задачу, содержанием кото­рой является отнесение данной совокупности состояний фак­торов к одной из нескольких категорий: угрозе, возможности или некоторой промежуточной величине, которая является нейтральным событием для банка. Кажущаяся на первый взгляд простота проблемы определения для банка, что есть фактор — угроза, возможность или ничего, является достаточ­но сложной и деликатной. Дело в том, что одни и те же состо­яния группы факторов, но в разных контекстах (временных, политических и др.) могут означать либо угрозу, либо возмож­ность для банка. С другой стороны, многочисленные силы, влияющие на банк (акционеры, учредители, менеджмент и др.) преследуют свои собственные, порой противоположные инте­ресы и, естественно, по-разному интерпретируют угрозу или возможность для банка. Наиболее правильный путь — избе­жать неоднозначности в трактовке влияния на банк событий внешней среды: оценить происходящее с точки зрения дости­жения принятых в банке стратегических целей.

Для решения сформулированной выше задачи имеется два принципиально разных подхода.

Первый подход основан на знаниях экспертов в данной об­ласти и реализуется либо методом экспертных оценок типа взвешенного голосования, либо с помощью экспертной систе­мы, в базу знаний которой включены диагностические прави­ла отнесения данной совокупности состояний факторов к од­ной из категорий (угроза, возможность, нейтральное событие).

Второй подход основан на использовании исторических данных о состоянии факторов внешней среды и соответствую­щих этому последствий для банка. Для реализации этого под­хода методом обучения на исторических данных строится мо­дель классификации, которая в дальнейшем используется для определения: угрозу или возможность представляет для банка текущее состояние факторов внешней среды.

Технология Data Mining как мощное средство реализации методов анализа внешней среды

Содержательное рассмотрение методов анализа внешней среды позволяет отметить ряд особенностей, создающих труд­ности для их реализации.

Большие массивы текстовой и числовой информации, ко­торая используется для анализа и прогноза. Определенная сте­пень неполноты, искаженности и противоречивости этой ин­формации.

Большое количество (влияющее на цели анализа) факто­ров, сложные причинно-следственные связи между ними. Важнейшие факторы внешней среды имеют комплексный ха­рактер и являются агрегатами многих экономических пере­менных различной природы (симптомы, индикаторы, показа­тели). Рабочее описание таких факторов требует специальных типов представлений, например, в виде сетевых или много­мерных баз данных.

Областью применения многих методов анализа внешней среды являются достаточно многочисленные (от десятков до десятков тысяч) совокупности однородных объектов, описан­ных в едином признаковом пространстве (например, конку­ренты банка или его клиенты).

Перечисленные особенности зачастую маскируют прин­ципиально важные для стратегических решений внутренние связи и закономерности, скрытые в больших и сложноорганизованных базах данных. Решением этой общей для многих аналитических аспектов бизнеса и финансов проблемы зани­мается специально разработанная информационная дисцип­лина Data Mining, переводимая как «извлечение знаний из данных» или иногда просто «углубленный анализ данных». В отличие от традиционных аналитических подходов, которые нацелены на подтверждение (статистическим методом инфор мационного поиска или иным) уже сформированных, выдви­нутых гипотез, технология Data Mining позволяет обнаружи­вать скрытые в больших массивах информации новые, ранее не известные связи и закономерности, которые могут быть ис­пользованы в бизнесе. В зависимости от типа исходной ин­формации и используемых методов извлечения из нее знаний различают текстовой, аналитический и визуальный Data Mining.

Программные пакеты текстового Data Mining (например, TextAnalyst) позволяют по большой совокупности текстов за­данной предметной области строить смысловую модель их об­щего содержания, автоматически устанавливая устойчивые ас­социативные связи между ключевыми понятиями, что помога­ет сформировать на этой основе базу знаний, с помощью которой осуществляются смысловые поисковые запросы, фор­мируются рефераты любой степени детализации и многое дру­гое из того, что, безусловно, необходимо при углубленном ана­лизе внешней среды и так или иначе приходится делать «вруч­ную».

Программные пакеты аналитического Data Mining (напри­мер, PolyAnalyst, NeuroShell и др.) позволяют строить по мас­сивам исходной информации методом адаптивного обучения на исторических данных модели распознавания, классифика­ции и кластеризации, которые затем можно использовать при анализе и прогнозировании внешней среды, в частности, по следующим проблемам:

Обнаружение наиболее важных факторов внешней среды и определения их текущего состояния.

Группировка банков-конкурентов в стратегические груп­пы с целью оценки интенсивности конкуренции и ближайших конкурентов.

Оценка степени прибыльности и лояльности клиентов банка с целью удержания прибыльного клиента и избавления от убыточного.

Поиск новых перспективных для банка клиентов, оптими­зация расходов (рекламных и др.) на их приобретение.

Обнаружение устойчивых совокупностей приобретаемых клиентами банка наборов банковских продуктов и услуг с це­лью увеличения прибыли за счет организации кросс- и супер­продаж. Программные пакеты визуального Data Mining (например, MineSet, VisCovery SOMine и др.) позволяют не только автома­тически строить вышеупомянутые аналитические модели, но и использовать «глазной анализатор» аналитика-эксперта, кото­рому предоставляется возможность увидеть огромные массивы исходных и преобразованных данных в различных формах многомерного представления с использованием кодирования цветом, формой, а также динамикой, благодаря развитым средствам визуализации и анимации.

Одним из наглядных примеров визуального Data Mining яв­ляются самоорганизующиеся карты признаков Кохонена, ко­торые позволяют переводить (с помощью специального алго­ритма кластеризации) стандартное табличное представление многомерных объектов (например, банков) в наглядную форму атласа двухмерных карт (карту кластеров и карт-признаков). Сохраняя на картах топологию и распределение банков, кото­рые они имели в исходном многомерном пространстве призна­ков, можно обнаружить принципиально новую информацию:

  • о структуре банковской среды, количестве и размере об­разовавшихся в результате кластеризации групп банков со схо­жими характеристиками (групп конкуренции);

  • о принципиально важных локальных свойствах отдель­ных групп банков или банков внутри группы;

  • об изменении стратегических позиций банков за опре­деленный период;'

  • о непосредственных конкурентах для каждого выбран­ного для исследования банка.

Кроме этого, с помощью самоорганизующихся карт при­знаков можно проводить макроэкономические исследования:

  • выявить устойчивые состояния макроэкономического развития страны;

  • определить, в каком состоянии находится макроэконо­мика сейчас и каковы тенденции ее развития;

  • искать сложные нелинейные зависимости между макро­экономическими показателями;

  • осуществлять анимационный мониторинг состояний;

  • прогнозировать макроэкономические показатели даже в условиях неполноты исходной базы данных.

ТЕХНОЛОГИИ КОНТРРАЗВЕДКИ

ПРОВЕРКИ КАНДИДАТА

Одна из технологий, позволяющих из потока кандидатов выбрать необходимых для предприятия сотрудников, — про­верка кандидата.

Целью проверки кандидата является выявление опасности данного кандидата для компании (явной и потенциальной). Фактически необходимо спрогнозировать поведение кандида­та в тех или иных условиях. Сделать это с какой-то долей веро­ятности можно посредством изучения истории кандидата. Вы­явление опасности осуществляется через:

  • выявление связей, способных навредить фирме;

  • выявление фактов биографии, способных навредить фирме;

  • получение информации об особенностях личности кан­дидата, его поведении в тех или иных обстоятельствах.

В процессе такого изучения необходимо фиксировать все этапы, все документы (в том числе переписку и переговоры). Все собеседования желательно фиксировать на диктофон (идеальный вариант — видео) для дальнейшего анализа пове­дения кандидата. Все анкеты, копии документов в обязатель­ном порядке накапливать в личном деле. Личное дело также должно иметь формализованную часть, которую можно запол­нять по мере поступления данных.

При этом прохождение кандидатом всех проверок еще не означает его абсолютную пригодность, поэтому нельзя сразу отдать в его руки все козыри. Целесообразнее договориться об испытательном сроке, в течение которого кандидат начнет ра­боту с менее проблемных узлов. И по тому, как он будет рабо­тать, можно судить и о его отношении к делу в целом.

ЭТАПЫ ПРОВЕРКИ