Мероприятия
Запись

Единый источник данных в data-driven компаниях

13 апреля 2021 г., 19:00Online
  • Managed Service for ClickHouse

Запись

О мероприятии

На митапе поговорим о методах и инструментах скоринга входных данных, их агрегации и создании единой системы в офлайн- и онлайн-ритейле, банкинге и облачных сервисах. На примерах покажем, как с помощью данных оптимизируются устоявшиеся бизнес-процессы в компаниях.

Поделимся опытом того, как:

  • Yandex.Cloud производит поддержку хранения и обработки данных в СУБД ClickHouse в S3;
  • Авито упростил и консолидировал работу дата-специалистов с витринами данных;
  • Райффайзенбанк решил задачу расположения банкоматов с помощью JupyterHub и создал модель оптимизации ценообразования в тендерах при помощи Jupyter на Mac;
  • Леруа Мерлен обучил модель контролировать качество товара от поставщиков на складах на основе lightGBM.

Докладчики

Дмитрий Ибрагимов
Леруа Мерлен
Всеволод Грабельников
Yandex.Cloud
Илья Салманов
Авито
Михаил Сеткин
Райффайзенбанк
Ксения Блажевич
Леруа Мерлен

Программа

19:00
Начало регистрации
19:00
Создание Data Platform в Леруа Мерлен

Расскажу об архитектуре Data Platform Леруа Мерлен, а также сделаю обзор новинок и инструментов для работы с данными и их обработки, покажу, как мы пользуемся ими. Детально обсудим: способы

...читать ещё
Дмитрий Ибрагимов
19:20
Данные в S3: поддержка S3 storage в ClickHouse, а также как выполнить select-запрос к файлу, не имея никакой СУБД

Расскажу о поддержке хранения и обработки данных в СУБД ClickHouse в S3. Впервые представлю новый функционал по поддержке select-запросов для parquet/csv файлов в S3 (Yandex Object Storage).

...читать ещё
Всеволод Грабельников
19:40
Витрины данных в Авито и их применение в бизнес-задачах

Расскажу о витринах данных в Авито и о том, как упростить жизнь аналитиков и дата-инженеров. Детально обсудим, какие бывают витрины; как создать/поправить витрину (отличия от вью, код

...читать ещё
Илья Салманов
20:00
От анализа данных до внедрения в прод: как инфраструктура помогает обучать и внедрять ML-модели

Расскажу о платформе данных Райффайзенбанка Data Lake. Обсудим, как с ее помощью произвести моделирование тендеров для закупок — моделирование разных параметров и подходов к ценообразованию

...читать ещё
Михаил Сеткин
20:20
Cветофор 2.0: страх и ненависть на пути от экселя к градиентному бустингу

Расскажу о «Светофоре» — сервисе по точечному выявлению проблемных поставок от поставщиков, работающему для оптимизации приемки в магазинах и распределительных центрах Леруа Мерлен Россия.

...читать ещё
Ксения Блажевич

Как добраться

Online