Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2047

.pdf
Скачиваний:
3
Добавлен:
07.01.2021
Размер:
2.77 Mб
Скачать

1

 

 

Пока дерево правил

 

 

выбрано

 

 

Перейти к корневому узлу

 

 

дерева правил

 

 

Пока узел дерева не

 

 

является листом

 

 

Итоговый набор

 

СЗП, определяющий

нет

 

СПП КЗ

Нет

 

 

 

Конец

БД

Заголовок правила

Нет

 

выполняется

нет

 

Перейти к дочернему узлу

 

дерева по ветке False

Перейти к дочернему узлу

 

 

дерева по ветке True

 

 

Выполнить тело правила

Сохранить

выбранного узла дерева

промежуточные

 

результаты

Есть дочерний узел

определения СПП

Нет

 

 

нет

Перейти к следующему

Перейти к дочернему узлу

дереву правил

дерева

 

 

Рис. 3.7. Схема алгоритма автоматизированного

формирования анкеты КЗ (окончание)

 

70

Нет

Нет

Да

Рис. 3.8. Схема алгоритма автоматизированного формирования анкеты КЗ

71

Таким образом, алгоритм извлечения и структурирования знаний, отражающих субъективное кредитное поведение заемщика, учитывает требования предметной области и отличительные особенности данных, полученных в результате ассоциативного эксперимента, свободного от навязывания стимулов респонденту (что приводит к наличию противоречий). Алгоритм базируется на актуальном анализе данных, представленных в форме графовой модели типологии КЗ с применением БП древовидной структуры, позволяет автоматизировать процесс идентификации и интерпретации типологии КЗ с целью автоматизированного формирования анкеты КЗ. Причем, предложенные решения учитывают возможность разрешения противоречий по умолчанию или действиями, согласно плану активного вмешательства ЛПР. Алгоритм предусматривает предварительную проверку достижимости результата (формирования СПП) согласно правилам ЛПР, что позволяет уйти от перебора данных, полученных в ходе эксперимента. Алгоритм является универсальным, не привязан к конкретному типу исследований, его можно использовать для широкого круга социальных, социально-экономических исследований.

72

Глава 4. РАЗРАБОТКА МЕТОДА ПОСТРОЕНИЯ МОДЕЛИ ЗНАНИЙ НА ОСНОВЕ ОЦЕНКИ КРЕДИТОСПОСОБНОСТИ

В четвертой главе для решения задачи оценки рисков на основании оценки субъективного кредитного поведения определен подход к методу оценки рисков, адаптирован и модифицирован метод ЛВмоделирования в целях построения модели знаний (МЗ), отражающих риски, связанные с субъективным кредитным поведением. На основе сформированной анкеты КЗ определено представление данных (классификация логических переменных), имеющих различное качественное представление в дихотомической шкале в терминологии ЛВмоделирования для построения МЗ, отражающих субъективное кредитное поведение. Предложены два метода оценки рисков на основе оценки субъективного кредитного поведения: метод на основе расчета рангового коэффициента корреляции Спирмена между типовым СПП m-й группы и индивидуальным СПП s-го соискателя и метод интервальной оценки рисков.

4.1. Определение подхода к решению задачи оценки рисков

Следующим этапом разработки интеллектуальной системы является разработка блока приобретения знаний и построение БЗ на основе сформированной анкеты КЗ, то есть решение задач диагностики субъективного кредитного поведения и прогнозирования рисков, связанных с ним.

На основе анализа литературы (глава 2) обоснованно выбраны методы приобретения знаний, построение БЗ и принятия решений, лежащие в основе модуля, решающего задачу оценки рисков розничного кредитования, которые ориентированы на аналитика с использованием методов психосемантики.

В результате проведения ассоциативного эксперимента и анализа данных получены СЗП, которые являются словами-стимулами для определения субъективного отношения к действию «кредит» [22].

На основе изученного материала [59, 137] для оценки рисков, связанных с субъективным кредитным поведением, базовым методом, отвечающим данной предметной области, выбран метод многомерного шкалирования.

Метод многомерного шкалирования – «система методических приемов и способов сбора и обработки психологической, социально-

73

психологической и социологической информации для получения объективных данных о скрытых или явных закономерностях поведения (функционирования) сложных, многомерных объектов» [59].

За последние годы в социологии и психологии активно развиваются методические приемы многомерного шкалирования для изучения субъективного опыта человека и построения субъективных пространственных моделей на основе данных прямых и косвенных числовых оценок, которые даются субъектом определенным сторонам воспринимаемых им объектов или событий. Специфика метода многомерного шкалирования определяется следующими основными постулатами, предположениями и допущениями. Постулируется, что субъективные проявления есть не что иное, как отражение состояния объективных процессов и явлений в сознании человека. Предполагается, во-первых, что в процессе жизнедеятельности у субъекта формируется определенный жизненный опыт в виде понятий, представлений, мнений, установок, знаний, на основе которых происходит оценка различного рода явлений и процессов. Предполагается, вовторых, что у каждого субъекта на базе его психологического образа окружающей действительности формируется определенное, объективно обусловленное пространство восприятия, в котором субъективно фиксируются различные предметы и явления по принципам схожести или различия. Третьим фундаментальным предположением для многомерного шкалирования является наличие определенной зависимости между оценками сходства и различия объектов в пространстве восприятия. Считается, что при субъективной оценке различного рода объектов окружающей действительности, субъект одновременно пользуется несколькими мерами, принимает в расчет не один, а целый набор признаков этих объектов. Задаваемая им оценка какого-либо из объектов есть интегрированное решение, которое часто просто не поддается словесному описанию самого оценивающего. Такого типа данные можно получить, предлагая, например, респондентам оценить сходство между объектами. Подобное положение исключает возможное влияние мнений и установок исследователя на характер ответов, даваемых респондентом. Помимо этого сама процедура многомерного шкалирования снижает возможные мотивационные влияния самого обследуемого на характер даваемых ответов, так как ему практически трудно определить значимость того или иного своего суждения для конечного вывода о нем, как о личности.

74

На основании рекомендаций, данных в работах [107, 128], сформированная анкета КЗ, содержащая СЗП, дополнена весами или значениями этих слов для респондентов. Приняты следующие условия: время заполнения психодиагностической анкеты не более 10 минут, т.е. количество слов от 30 до 50; словарь содержит наибольшее возможное число слов-признаков – 50 слов для осуществления дальнейшего выбора наиболее информативных признаков.

Соискателям предложены анкеты (прил. 3), содержащие 50 СЗП. Структура пространства СЗП дает возможность для измерения различий в интерпретации понятий, что позволяет использовать стандартный психодиагностический метод, впервые предложенный Ч. Осгудом и широко применяемый на сегодняшний день [107].

СЗП оцениваются путем соотнесения с одной из фиксированных точек шкалы. Пространство шкалы между противоположными значениями воспринимается испытуемым как континуум градаций выраженности признака. Весь континуум шкалы разбивается на 7 интервалов, и оцениваемый признак может принимать значения от - 3 до +3, для простоты восприятия респондентам предложено оценить предложенные слова-признаки в соответствии со шкалой от 0 до 6 включительно: стимулы – вербальные, выбранные на основании ассоциативного эксперимента; ответы – закрытые, типа «Оценивание значения признака по заданной шкале».

Таким образом, имеем описательные модели знаний отношения КЗ к действию «кредит», которые строятся на данных с известными результатами, как обнаружение сущности на основе найденных специфических зависимостей в соответствии с типологией КЗ. Типологический анализ заключается в выявлении степени значимости того или иного СЗП для определенного типа КЗ, классификации по типу путем соотнесения вновь обратившегося соискателя (объекта) с некоторым типом КЗ (классом объектов). Отклонение от определенного типа как «нормы» и есть прогнозирование рисков невозврата кредитных средств.

4.2. Определение формы представления данных для построения модели знаний

В работе [32] отмечено, что существуют десятки моделей представления знаний для различных предметных областей, которые могут быть сведены к следующим классам: продукционные модели, семантические сети, фреймы, формальные логические модели.

75

В случае когда предметную область возможно описать в виде набора аксиом, предпочтение следует отдать традиционным в представлении знаний формальным логическим моделям, основанным на классическом исчислении предикатов I-го порядка [146].

Определимся, что:

­в данной работе следует понимать риск как вероятность возможного убытка или ущерба в результате действия как субъективных, так и объективных факторов (определение риска основано на статистических данных об успехе или неуспехе кредитов банка);

­для оценки кредитного риска производится анализ кредитоспособности заемщика как желания, соединенного с возможностью своевременно погасить выданное обязательство;

­сценарий неуспеха кредита является ассоциативным и формулируется на основе здравого смысла: сочетание выявленных СЗП, полученных в результате семантического эксперимента, и традиционно анкетируемых социально-демографических признаков, наиболее тесно связанных с ненадежностью КЗ;

­перечисленные далее социально-демографические признаки соответствуют признакам, определяющим типологию КЗ: пол – «мужчина» и «женщина»; образование: высшее и среднеспециальное; семейное положение: «есть дети», «нет детей»; возраст

до 25 лет, от 25 до 35 лет, от 35 до 45 лет, старше 45 лет;

­для измерения признаков или характеристик кредита использованы шкалы: для оценки успеха события – логическая (истина или ложь); для оценки социально-демографических признаков – качественная; для психодиагностических признаков («вес» слов-признаков от 0 до 6 включительно) – качественная и числовая; для оценки риска: точечной – процентная, интервальной (интервалы допустимого риска)

числовая.

Следует отметить, что осуществление типологического анализа в целях описания моделей представления знаний, с учетом полученных данных методом многомерного шкалирования, полученные признаки имеют следующие отличительные особенности: «Кредит» – действие, отношение к которому проявляется через выявленные посредством ассоциативного эксперимента СЗП, определяющих СПП в связи с общепринятыми анкетируемыми признаками: демографическими (пол, возраст), социальными (семейное положение, образование), то есть однородность определяется принадлежностью к определенной типологии КЗ; полученные в результате семантического эксперимен-

76

та СЗП имеют градации или вес от 0 до 6 включительно; каждая компонента имеет разные параметры, имеет разную размерность, имеет дискретное непараметрическое распределение, которое задается таблично; информационная модель должна быть прозрачная и открытая, чтобы осуществить возможность оптимизации по управлению риском уже на этапе классификации посредством выявления более актуальных характеристик кредитоспособности; для анализа и управления риском следует учитывать возможность отсутствия некоторых СЗП; признаки и градации признаков не должны иметь преимуществ, то есть признак «мужчина» не лучше и не хуже признака «женщина» равно, как и полученные ответы на вопросы.

На основе анализа работ, посвященных типологическому анализу в социологии, социальной психологии и психодиагностике [137, 138], оценке рисков [123, 126, 127], для построения МЗ и построения БЗ были адаптированы и модифицированы методы логиковероятностного (ЛВ) моделирования, подробно изложенные (применительно к оценке рисков в кредитной сфере) в работах [13, 14, 19].

Подробное изучение проблем кредитного скоринга, начиная с выбора признаков «хорошего» и «плохого» КЗ, и анализ существующих методов решения задачи его классификации [18, 22] и оценки риска выдачи кредита c учетом субъективного кредитного поведения, дает право на следующие выводы, объясняющие основные причины использования логико-вероятностных методов для оценки риска кредитования физических лиц в данной работе: задание статистических данных позволяет вести вычисления с многомерными распределениями, в которых каждая компонента имеет свой закон распределения, не являющийся нормальным, что при оценке психологического аспекта отношения к действию «кредит» физических лиц является необходимым; оцениваемые параметры могут иметь разную размерность, могут быть заданы таблично, при этом осуществляется возможность вычислять вклады в риск объекта или всего множества объектов любых инициирующих событий-градаций и событийпризнаков, позволяющих соответственно в дальнейшем управлять риском, что объясняет прозрачность данного метода и возможность оценки степени влияния субъективного поведения на принятие решения соискателя; сценарий риска является ассоциативным и рассматривается только как гипотеза, что является большим преимуществом при оценке психологических аспектов, и решает проблему дискриминационного характера кредитного скоринга; инициирую-

77

щие признаки-события могут иметь не два состояния, а от 2 до 60 несовместных событий-градаций, что позволяет использовать достаточно большой список СЗП; возможность дополнения ЛВ-модели и совместного использования полученных статистических зависимостей делает данный метод универсальным.

Для осуществления типологического анализа на основе методов многомерного шкалирования перейдем к известному представлению данных в дихотомической шкале с учетом терминологии ЛВмоделирования. В табл. 4.1 приведена классификация соответствия бинарных логических переменных – градаций Zjr объектампризнакам. СЗП, полученные в результате ассоциативного эксперимента, являются событиями-признаками, характеризующими СПП соискателя. Такие события-признаки для удобства рассмотрения сгруппированы в соответствии с терминологией психодиагностики личности [27, 107] и представлены в табл. 4.1, 4.2.

 

Признаки i-го кредита

 

Таблица 4.1

 

 

 

 

 

 

 

 

 

 

 

 

Обозначение

 

Обозначение

Номер

 

Число

градаций в

Наименование признака

событий-

признака

градаций

событии

 

признаков

 

 

 

признаке

 

 

 

 

 

 

1

2

 

3

 

4

5

 

Успешность кредита

 

Y

 

2

Вернул

 

 

 

Не вернул

 

 

 

 

 

 

1

Пол

 

Z07

 

2

Z07 01

 

 

Z07 02

 

 

 

 

 

 

2

Образование

 

Z08

 

2

Z08 01

 

 

Z08 02

 

 

 

 

 

 

3

Семейное положение

 

Z09

 

2

Z09 01

 

 

Z09 02

 

 

 

 

 

 

 

 

 

 

 

4

Z10 01

4

Возраст

 

Z10

 

Z10 02

 

 

 

Z10 03

 

 

 

 

 

 

 

 

 

 

 

 

Z10 04

 

Сгруппированные СЗП:

 

 

 

 

 

Z01 01,

 

 

Z01 01 00,….

 

означающие, что по-

 

 

 

Z01 01 06

 

Z01 02,

Z01 03, Z01 04,

 

5

требности превышают

7

 

 

возможности (Z01)

Z01 05,

Z01 06,

Z01 07,

 

Z01 10 00,…

 

Z01 08,

Z01 09,

Z01 10.

 

 

 

 

Z01 10 06.

78

 

 

 

 

Окончание табл. 4.1

1

2

3

4

 

5

 

означающие преувели-

Z02 01,

 

 

Z02 01 00,…,

6

7

 

Z02 01 06

чение своих возможно-

Z02 02, Z02 03, Z02 04,

 

 

 

 

стей (Z02)

Z02 05, Z02 06.

 

 

 

 

 

Z02 06 06 .

 

 

 

 

 

 

 

Z03 01,

 

 

Z03 01 00,…,

7

означающих упрощение

Z03 02, Z03 03, Z03 04,

7

 

Z03 01 06

решения проблемы (Z03)

Z03 05, Z03 06,Z03 07,

 

 

 

 

 

 

 

Z03 08, Z03 09.

 

 

Z03 09 06.

 

означающие нейтраль-

Z04 01,

 

 

Z04 01 00,…,

 

Z04 02, Z04 03, Z04 04,

 

 

 

 

 

Z04 01 06

8

ный оттенок или отра-

Z04 05, Z04 06, Z04 07,

7

 

 

 

жающие рациональное

Z04 08, Z04 09, Z04 10,

 

 

 

 

Z04 14 00,…,

 

поведение (Z04)

Z04 11, Z04 12, Z04 13,

 

 

 

 

 

Z04 14 06.

 

 

Z04 14.

 

 

 

 

Z05 01,

 

 

Z05 01 00,…,

 

означающие, положи-

Z05 02, Z05 03, Z05 04,

 

 

Z05 01 06

9

тельный оттенок (Z05)

Z05 05, Z05 06, Z05 07,

7

 

 

 

 

Z05 8, Z05 09,

 

 

Z05 11 00,…,

 

 

Z05 10, Z05 11.

 

 

Z05 11 06.

 

 

Z06 01, Z06 02, Z 06 03,

 

 

Z06 01 00,…,

10

означающие негативное

Z06 04, Z06 05, Z06 06,

7

 

Z06 01 06

отношение (Z06)

Z06 07, Z06 08, Z06 09,

 

 

 

Z06 10, Z06 11, Z 06 12,

 

 

Z06 13 00,…,

 

 

 

 

 

 

Z06 13

 

 

Z06 13 06

Таблица 4.2

Градации в группах психологических признаков

Наименование

Номер

Наименование

Обозначение

Число

группы СЗП

признака

признака: СЗП

градаций

1

2

3

4

5

означающие, что

1

просто

Z01 01

7

потребности

2

желания

Z01 02

7

превышают воз-

3

имидж

Z01 03

7

можности

4

неудовлетворенность

Z01 04

7

 

5

блага

Z01 05,

7

 

6

новые вещи

Z01 06

7

 

7

необходимость

Z01 07

7

 

8

жизненная необхо-

Z01 08

7

 

димость

 

 

 

 

 

9

магазины

Z01 09

7

 

10

качество приобре-

Z01 10

7

 

таемой вещи

 

 

 

 

79

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]