В статье определена актуальность использования методов интеллектуального анализа данных, рассмотрен понятийный аппарат, а также рассмотрен и систематизирован зарубежный и российский опыт банков.
Ключевые слова: интеллектуальный анализ данных, банкбольшие данные, банковская сфера, Data mining, управление рисками, управление банковскими рисками, риск, наборы данных. искусственный интеллект, ИИ, кредитный портфель, выявление мошенничества.
В современном мире банковские риски являются одним из ключевых факторов, определяющих стабильность и успешность деятельности финансовых институтов. Они могут возникнуть из-за различных факторов, таких как изменения в экономической среде, нестабильность финансовых рынков, недостаточное управление кредитным портфелем и т. д. Важнейшим условием развития любого банка, в условиях жёсткой конкуренции, наблюдаемой в настоящее время на финансовом рынке, является использование передовых подходов и методов ведения деятельности, именно одним из таких методов и является интеллектуальный анализ данных.
Актуальность использования методов интеллектуального анализа данных в управление банковскими рисками нетрудно оценить в современном финансовом мире, т. к. применение инновационных технологий позволяет банкам быть более адаптивным, эффективно управлять своими рисками и обеспечивать стабильность своей деятельности в условиях изменчивой экономической среды.
Для лучшего понимания что из себя представляют методы ИАД следует разобраться что такое интеллектуальный анализ данных.
Японская компания-разработчик ПО для кибербезопасности Trend Micro определяет Интеллектуальный анализ данных (англ. Data mining) как процесс обнаружения информации в наборе данных; также известен как обнаружение знаний в базах данных (Knowledge Discovery in Databases, KDD). Благодаря интеллектуальному анализу данных можно достичь двух результатов: описать имеющиеся данные или сделать прогнозы на будущее. [2]
Российская компания ООО «Веб Креатор», входящая в реестр аккредитованных ИТ-компаний Минцифры России, определяет Data Mining (интеллектуальный анализ данных) как глубинный анализ данных или дословно «добыча данных» — это процесс обнаружения закономерностей в больших наборах данных, который включает в себя использование современных аналитических методов для извлечения ценной информации из структурированных и неструктурированных данных. [3]
То есть, Data Mining можно кратко описать как «процесс обнаружения и интерпретации закономерностей в данных для решения бизнес-задач». Таким образом, на основании данного определения, можно сделать вывод о том, что интеллектуальный анализ данных состоит из трех ключевых этапов: 1 — поиск шаблонов, 2 — их интерпретация с целью проверки их полезности, 3 — использование шаблонов для решения бизнес-задач.
Тема Data Mining на сегодняшний день, является достаточно изученной как в российском, так и в зарубежном опыте. Многие крупные банки и финансовые учреждения применяют эти методы для анализа кредитных рисков, мониторинга контрагентов и оценки репутационных рисков, но стоит отметить, что использование методов АИД в банковской сфере, в условиях развития цифровых технологий, полностью и чётко не определено в законодательстве, как в России, так и за рубежом. Это связано с тем, что только в 70-х гг. 20 века началась активная разработка и применение методов интеллектуального анализа в банковской сфере. [4]
Целью исследования в данной работе является анализ и систематизация методов интеллектуального анализа данных используемых для управления банковскими рисками
В Работе были рассмотрены следующие задачи:
– Рассмотреть понятийный аппарат
– изучить зарубежный и отечественный опыт применения методов ИАД в управление рисками банками
– систематизировать практику российских и зарубежных банков по использованию методов АИД в управлении рисками
– предложить наиболее эффективные методы ИАД совершенствования
Стоит отметить, что в зарубежных банках, таких как США и Европейский союз, методы интеллектуального анализа данных активно и успешно применяются для оптимизации управления рисками. Они используют технологии машинного обучения, искусственного интеллекта и анализа больших данных для прогнозирования вероятности дефолта клиента, оценки кредитоспособности заемщика, выявления мошенничества и т. д. Эти методы позволяют банкам принимать более обоснованные и точные решения в области кредитования и управления рисками.
В России, за последние 10–15 лет многие крупные банки активно внедряют и совершенствуют системы аналитики данных для автоматизации процессов выдачи кредитов, мониторинга рисков и прогнозирования поведения клиентов, оптимизации кредитного портфеля и улучшения качества принимаемых решений. Однако, в отличие от западных стран, в России еще есть ряд проблем, тормозящих инновационное развитие и практическое применение методов интеллектуального анализа данных и связано это с отсутствием высококвалифицированных специалистов и недостаточным инвестированием в развитие технологий анализа данных.
Рассмотрим и систематизируем практику российских и зарубежных банков по использованию методов АИД в управлении банковскими рисками. К сожалению, единого терминологического аппарата методов ИАД не определено, поэтому разные компании не всегда используют одни и те же термины, что в некоторых моментах усугубляет путаницу и кажущуюся и так сложной.
Одним из фундаментальных методов считается — Отслеживание паттернов (шаблонов). Данный метод предполагает распознавание и мониторинг тенденций в наборах данных для проведения интеллектуального анализа результатов. Так, например, банками данный метод используется при анализе заявок клиентов на кредиты и вклады и позволяет выявить однородные данные, которые в дальнейшем позволяют сделать вывод о популярности банковских продуктов, то у какой демографической группы наибольшую популярность имеет тот или иной продукт и в какой период времени, позволяя в дальнейшем оценить кредитоспособности клиентов, востребованность продуктов банка и т. п.
Противоположным методом, является метод обнаружение выбросов, выявляющий аномалии или «выбросы» в рассматриваемом наборе данных, чтобы понять конкретные причины или получить более точные прогнозы. Данный метод активно используется банками для выявления мошеннических действий, клиентов не из целевого сегмента и их потребностей и предпринять меры разработке новых механизмов защиты от мошеннических действий или новых банковских услуг и предложений.
Еще одним основополагающим способом является классификация данных и к ней можно отнести такие методы как классификация и кластеризация, дерево решений, которые используются для разделения больших наборов данных на целевые категории. Отличительной черной кластеризации является то, что она позволяет помочь пользователям визуализировать распределение данных и выявить тенденции в своих наборах данных, а метод Дерево решений, позволяет фокусируется на отношениях моделирования входных и выходных данных с использованием правил «если/то».
Классификация, по сути, позволяет банкам спрогнозировать изменение доходов клиентов, реакцию клиентов на какие-то внешнеэкономические и внутрибанковские изменения и разработать модель двоичной классификации для прогнозирования увеличения или уменьшения расходов по управлению процессами и рисками. Кластеризация, в свою очередь, позволяет сгруппировать аудиторию, заявки или операции в соответствующие пакеты наборов данных для дальнейшего их анализа и применения при разработке мер по управлению определенными рисками, адаптации свою маркетинговых мероприятий для максимизации охвата рынка. Результаты анализа кластерных данных, как правило, отображаются с помощью графиков, что позволяет визуализировать распределение данных и выявить тенденции в готовых наборах данных. Использование метода дерево решений позволяет банкам выстроить “от и до” процедуру распределения данных и прогнозировать исходы, а также подготовить данные для дальнейшего их применения, в т. ч. и в моделях классификации и регрессии.
Одним из самых популярных методов интеллектуального анализа данных в машинном обучении, который использует линейную зависимость между переменными считается Регрессионный анализ. Этот подход позволяет банкам предсказывать будущее значения переменных и применяется при прогнозировании и планировании ресурсов, принятии стратегических решений и т. д. Так, например, банками используется данный метод для выявления корреляции между параметрами клиентов, таких образование, доходы и привычки расходования средств.
Метод обработка долговременной памяти требует от банков наличие больших вычислительных мощностей, т. к. при анализе данных используются наборы за длительные периоды, что позволяет более эффективно выявлять закономерности данных, основанных на времени, например, курсов валют или ключевых ставок. Данный метод предназначен для масштабирования данных в системной памяти и использования дополнительной информации при анализе. Так банки разрабатывают прогнозирующую модель для выявления мошеннических транзакций путем назначения вероятностей, вначале для существующих транзакций, а затем, через некоторое время, при обновлении модели новыми данными, транзакциями для улучшения процесса принятия решений.
Последним и самым молодым является инновационный метод нейронные сети, который лишь в 2010 году благодаря большим объемам данных начал применяться для машинного обучения и позволил решать задачи прогнозирования, классификации и управления, в т. ч. и финансового класса. [5] Практическое использование данного метода предоставило банкам возможность производить оценку вероятности банкротства как самого банка, так и клиентов, кредитоспособности, операций на финансовом рынке и осуществлять качественный контроль за инвестициями и размещенными займами с учетом воздействия различных факторов.
Все эти методы позволяют выявлять скрытые причинно-следственные связи между различными факторами в больших объемах данных, формировать шаблоны и паттерны, отражающие особенности многоаспектных отношений в данных, что дает возможность банкам определить, оценить и прогнозировать риски в реальном времени.
Рассмотренные методы АИД применяются банками на всех этапах управления рисками для выделения основных видов рисков, анализа процессов управления рисками и рассмотрения структуры управления рисками. Стоит также отметить и то, что процесс применения методов АИД представляет собой комплексный набор этапов, которые включают в себя систематическое извлечение и анализ данных с целью выявления скрытых закономерностей, а также получение ценной информации.
Стоит отметить, что текущее состояние использования методов ИАД в управлении банковскими рисками характеризуется высокой степенью вовлеченности банков в деятельность своих клиентов и контрагентов, что предполагает регулярный мониторинг и анализ результатов их деятельности. В таблице 1 представлены примеры практического использования отечественными и зарубежными банками методов ИАД и их результаты.
Таблица 1
Практическое применение банками методов Data Mining
Параметр |
Отечественный опыт |
Зарубежный опыт |
Кредитный скоринг |
Сбербанк впервые использовал ИИ в 2018 году, тем самым за счет внедрения ИИ удалось существенно увеличить показатели прибыли. По состоянию на март 2024 года Сбербанк в 100 % случаев принимает кредитные решения в отношении физических лиц с использованием искусственного интеллекта, а по юридическим лицам планируется до конца 2024 года достичь принятия решений таким образом на 70 %. |
Prime Bank при поддержке международной неправительственной организации Swiss Contact в 2022 году запустил цифровую платформу кредитования PrimeAgrim для людей и компаний без кредитного рейтинга. Алгоритм в основе платформы позволяет подтвердить свою кредитоспособность с помощью новой динамической системы кредитного скоринга, которая основывается на поведенческом анализе. В итоге клиенты могут получать кредиты всего за несколько минут. |
Выявление мошенничества |
Весной 2024 года Тинькофф банк запустил в тестирование новой ML-модели по оценке финансового здоровья, в результате применения которой было пресечено 90 % мошеннических запросов с кредитами на этапе подтверждения заявки. [6] |
Датский банк Danske Bank по результатам внедрения ИИ сократил количество ложноположительных срабатываний на случаи мошенничества на 60 %, что существенно снизило нагрузку на сотрудников. При этом выявление реальных случаев мошенничества увеличилось на 50 %. [7] |
Несмотря на изложенные выше положительные стороны использования методов ИАД, необходимо также рассмотреть и их недостатки. Проблемы применения методов ИАД банками связывают со следующими причинами:
– необходимость больших объёмов данных для получения достоверных результатов анализа;
– потребность в больших технологических, финансовых и кадровых мощностях;
– качественность данных в исследуемых наборах;
– сложность данных по причине их разнородности и получения из различных источников;
– сохранение конфиденциальности и безопасности полученных данных;
– соответствие данных нормальному закону распределения;
– профессиональной интерпретацией получаемых результатов;
– согласование управления активами и пассивами, риск-ориентированного и клиентоориентированного подходов.
Для преодоления этих проблем банки используют методы по
– очистки данных, выявляя и исправляя ошибки;
– предварительной обработки данных, т. е. преобразование данных с целью их лучшей пригодности для интеллектуального анализа;
– направленные на повышение их качества.
Для этого применяются методы кластеризации, классификации и анализа ассоциативных правил. Также, для сохранения конфиденциальности и безопасности полученных данных используются метод анонимизации, что предполагает удаление личной информации из данных. Помимо этого метода применяются методы по шифрованию данных, что делает их непригодными для прочтения неавторизованными пользователями и препятствует мошенническим операциям.
Применение методов ИАД банками дает широкие возможности для выявления скрытых причинно-следственные взаимосвязей между различными факторами в больших объёмах данных, что обеспечивает более глубокое понимание данных и оценку их с количественной и качественной точек зрения.
В заключение, стоит отметить то, что использование методов ИАД в управлении банковскими рисками является актуальным и перспективным направлением развития для банковской системы как в зарубежных странах, так и в России. Их применение позволяет анализировать большие объемы данных, выявлять скрытые закономерности и прогнозировать кредитный риск, оптимизировать процессы управления рисками, снизить вероятность дефолтов и увеличить прибыльность бизнеса, что позволяет банкам принимать обоснованные решения и управлять рисками более эффективно. Дальнейшее изучение и применение инновационных технологий в области анализа больших данных поможет банкам успешно справляться с вызовами современной рыночной среды, в достижении их стратегических целей и обеспечении конкурентоспособности на рынке финансовых услуг. Однако, для успешной реализации проектов по внедрению аналитических систем необходимо уделить внимание кадровому потенциалу и технологической оснащенности банков.
Таким образом, их эффективное управление имеет решающее значение для обеспечения финансовой устойчивости и успешности как банков, так и экономики страны в целом.
Литература:
- Кирилюк, И. Л. Методы интеллектуального анализа данных и регулирование цифровой трансформации финансового сектора в России и в мире / И. Л. Кирилюк. — Текст: электронный // КиберЛенинка: [сайт]. — URL: https://cyberleninka.ru/article/n/metody-intellektualnogo-analiza-dannyh-i-regulirovanie-tsifrovoy-transformatsii-finansovogo-sektora-v-rossii-i-v-mire (дата обращения: 14.09.2024).
- Что такое интеллектуальный анализ данных? — Текст: электронный // Trend Micro: [сайт]. — URL: https://www.trendmicro.com/ru_ru/what-is/machine-learning/data-mining.html (дата обращения: 14.09.2024).
- Data Mining — интеллектуальный или глубинный анализ данных. — Текст: электронный // Веб Креатор: [сайт]. — URL: https://web-creator.ru/articles/data-mining (дата обращения: 18.09.2024).
- Что такое интеллектуальный анализ данных?. — Текст: электронный // DECO Systems (Copyright): [сайт]. — URL: https://www.decosystems.ru/intellektualniy-analiz-dannykh-ili-data-mining/ (дата обращения: 18.09.2024).
- Нейронные сети, перцептрон. — Текст: электронный // ИТМО: [сайт]. — URL: https://neerc.ifmo.ru/wiki/index.php (дата обращения: 13.11.2024).
- Т-Банк запустил проект «Кибершквал» для нейтрализации лжеброкеров и финансовых пирамид. — Текст: электронный // ТБанк: [сайт]. — URL: https://www.tbank.ru/about/news/17102024-t-bank-launched-the-cybershkval-project-to-neutralize-fake-brokers-and-financial-pyramids/ (дата обращения: 20.10.2024).
- Решения на основе данных для финансовых услуг. — Текст: электронный // Teradata: [сайт]. — URL: https://www.teradata.com/industries/financial-services (дата обращения: 14.09.2024).
- Единов, В. А. Использование методов интеллектуального анализа данных в процессе банковского кредитования: зарубежный и российский опыт / В. А. Единов. — Текст: непосредственный // Молодой ученый. — 2024. — № 22 (521). — С. 266–268. — URL: https://moluch.ru/archive/521/115111/ (дата обращения: 08.11.2024).