О чём эта история

«Уральский банк реконструкции и развития» (УБРиР) с 2017 года задумывался о создании централизованной функции Data Science для увеличения прибыли и оптимизации бизнес‑процессов. В 2020 году в банке был создан Центр математического моделирования, и инициирован проект по выведению Data Science на промышленный уровень. Создана единая технологическая платформа на основе гибридной архитектуры on‑prem и Yandex Cloud с сервисами Yandex DataSphere, Yandex Data Proc, Managed Service for PostgreSQL, DataLens и Compute Cloud.

Задача компании

«УБРиР» входит в ТОП‑30 крупнейших банков РФ по размеру активов. Один из самых популярных банков Уральского региона. Банк делает упор на цифровизацию, и в 2020 году вывел Data Science в отдельное направление, создав Центр математического моделирования. Сперва специалисты Центра работали на локальных машинах и не имели доступа к сырым данным. Не было единой методологии работы с моделями машинного обучения, стандартов и прочих атрибутов, которые обеспечивают  единый бизнес‑процесс. При такой организации модели не могли выйти в продакшн и начать приносить реальную пользу.

Первой задачей Центра стало создание работающей системы управления сервисами на основе моделей машинного обучения, единой методологии и профессиональной команды. Методология была основана на применении подходов Data Driven для анализа клиентского поведения и оптимизации ключевых бизнес‑метрик, а также подходов MLOps для управления жизненным циклом моделей машинного обучения. Система должна была помочь точнее и быстрее проектировать новые аналитические продукты, сократить показатель time‑to‑market, обеспечивать мониторинг метрик и деплоя моделей и при этом окупать сама себя.

Центр попытался развернуть систему на собственных серверах, но в итоге эффективнее оказалось применить гибридный подход, при котором основные операции идут на внешней облачной платформе.

Как выбрать облако для обучения моделей

Чтобы выбрать подходящую облачную платформу, банк выделил основные критерии оценки:

  • время внедрения;
  • цена внедрения;
  • цена аренды или сопровождения;
  • готовность решения.

Проведя анализ рынка, специалисты Центра остановились на сервисе Yandex DataSphere от Yandex Cloud. Это сервис для ML‑разработки, предоставляющий все необходимые инструменты и динамически масштабируемые ресурсы для полного цикла разработки машинного обучения.

Других готовых облачных решений в виде PaaS на тот момент просто не было. Этот формат был выбран и потому, что стоимость аренды облачных мощностей легко прогнозировать. Если разворачивать обучение на виртуальных машинах на других облачных платформах, то стоимость платформы была бы дороже в 1,7 раза. В случае реализации проекта на своих серверах — удорожание в 20 раз. У Yandex Cloud были и другие плюсы: низкая стоимость сопровождения, актуальные инструменты и соответствие ФЗ № 152 о персональных данных.

«УБРиР» начал работу с сервисами Yandex Cloud в декабре 2020 года.

Трудности запуска: внедрили и переубедили

Сервисы Yandex Cloud (DataSphere, Data Proc и другие) созданы специально для ML‑разработки, они предоставляют популярные инструменты и могут быстро масштабироваться для полного цикла машинного обучения. Например, возможности Yandex DataSphere позволяют разворачивать и обучать модели на полных датасетах быстро и без дополнительных затрат, что совместно с другими сервисами Yandex Cloud покрывает весь жизненный цикл ML‑моделей для бизнеса.

В банке постарались минимизировать кастомизацию настроек, поэтому у проекта не было ни системного архитектора, ни DevOps-инженера. Настройки технического стека команда «УБРиР» делегировала специалистам из DataSphere. Быстрый запуск, обеспеченный работой специалистов DataSphere Yandex Cloud, помог совсем молодой ML‑команде «УБРиР» быстрее сработаться.

Вся конфигурация была развернута сразу на инфраструктуре Yandex Cloud, там же выполняются все операции с данными. Например, банк собирает данные в Data Lake на базе Hadoop, производит предобработку, каталогизацию и реплицирует данные в облако.

Платформа AS IS 2021

За 2021 год было разработано 19 моделей для розничного бизнеса, 14 из них вышли в продакшн. Каждая модель — это микросервис, который полностью решает одну задачу клиента и даёт финансовый эффект. Первое время основным заказчиком был маркетинг банка (модели таргетирования: response, uplift, отток), но затем подключились команды транзакционного бизнеса (модели увеличения POS-активности и предоттока), были введены в эксплуатацию несколько моделей для b2b‑клиентов.

Единственная сложность, с которой столкнулись специалисты «УБРиР», — сотрудники банка сомневались в практической пользе машинного обучения для бизнеса. Однако стоимость внедрения всей системы на Yandex Cloud окупилась за первый год ещё до окончания внедрения. Это поменяло отношение к машинному обучению в коллективе с отрицания на принятие.

Первые миллионы

В итоге стоимость всего внедрения была сопоставима с зарплатой сотрудников Центра, арендой оборудования и стоимостью консультаций. Прибыль от работы Центра составила сумму, в пять раз превышающую стоимость внедрения облачной инфраструктуры. Работа по модели PaaS прозрачная и позволяет точно прогнозировать расходы на поддержку.

Один из основных показателей эффективности работы Центра математического моделирования — рост чистого операционного дохода. Этого удалось достичь в том числе благодаря использованию облачных сервисов Yandex Cloud. Пока это десятки миллионов рублей, но у Центра математического моделирования «УБРиР» в планах рост финансового эффекта до сотен миллионов рублей.

Сейчас в банке начали реализовывать полноценную аналитическую lambda‑архитектуру с эффективной стриминговой веткой. В планах — расширение круга задач, например, управление динамическим ценообразованием, оптимизация клиентского пути в мобильном приложении, создание моделей управления наличными деньгами в банкоматах и кассах отделений.

Мнение

Александр Павлюк,
руководитель Центра математического моделирования ПАО КБ «УБРиР»
Александр Павлюк,
руководитель Центра математического моделирования ПАО КБ «УБРиР»

Если у вас нет армии инженеров, DeVOps‑специалистов и культуры разработки, а ML‑обучение надо внедрять, то ваше спасение — это платформенные решения. Я смог делегировать настройку и кастомизацию большинства инструментов и сосредоточился на смысловой части, росте финансового эффекта и развитии функции Data Science в банке.

Есть похожая задача?

Напишите нам

И мы оперативно расскажем о возможностях Yandex Cloud для вашего бизнеса или подберём партнёра, который полностью реализует ваш ИТ-проект.

Связаться со специалистом Yandex Cloud
Как к вам обращаться?
Телефон
Email
Компания
Частное лицо
Должность
Размер компании
Индустрия
Какую задачу вы хотели бы решить? (Опционально)