Мероприятия
Запись

Data Open Source Day

11 июля 2023 г. в 15:00Москва, Экстрополис
  • Managed Service for ClickHouse®
  • +4

Запись

О мероприятии

Первая конференция Yandex Cloud про Open Source инструменты для обработки данных и создания корпоративных хранилищ.

Data Open Source Day — это доклады экспертов, которые создают решения с открытым исходным кодом для реальных задач бизнеса. Это дискуссии о применении Open Source на практике, о безопасности технологий, о развитии сообщества и о социально-значимых проектах на базе открытых технологий.

Что обсудили:

  • Какие реальные бизнес-задачи можно решать с помощью Open Source продуктов Яндекса, например, YDB и YTsaurus.

  • Как большие компании строят работу по хранению и обработке данных, развивают аналитические системы и решают задачи машинного обучения на основе продуктов с открытым исходным кодом. Опытом поделится Ozon и не только.

  • Какой вклад команда Yandex Cloud вносит в развитие Greenplum® и ClickHouse®.

  • Как Open Source комьюнити помогает делать технологии и проекты на их базе лучше.

  • Как сделать социально-значимый проект с открытым кодом и помочь научному сообществу во всем мире.

Встреча была полезна всем, кто интересуется разработкой систем на базе Open Source технологий, архитекторам, ML-разработчикам, CDO, CTO, IT-директорам.

Докладчики

Сергей Бережной
Сергей Бережной
Яндекс
Олег Бондарь
Олег Бондарь
Yandex Cloud
Андрей Ривкин
Андрей Ривкин
Яндекс
Алексей Дмитриев
Алексей Дмитриев
Yandex Cloud
Виктор Корейша
Виктор Корейша
Ozon
Александр Сербул
Александр Сербул
Битрикc24
Николай Никитин
Николай Никитин
ИТМО
Алексей Миртов
Алексей Миртов
Yandex Cloud
Алексей Дудин
Алексей Дудин
Яндекс Игры
Андрей Бородин
Андрей Бородин
Yandex Cloud
Александр Бурмак
Александр Бурмак
Yandex Cloud
Сергей Бехтин
Сергей Бехтин
MaritimeAI

Программа

14:00

Начало регистрации

15:00

Вводное слово

Сергей Бережной
15:05

Платформа YDB: год после выхода в Open Source и перспективы развития

Поговорим о том, как мы вышли в Open Source, как взаимодействуем с сообществом и контрибьюторами. Покажем роадмап развития платформы, а также поделимся результатами сравнения YDB с другими СУБД с открытым исходным кодом. Ещё поговорим о том, как высоконагруженные сервисы Яндекса, например Метрика, используют YDB.

Олег Бондарь
15:35

YTsaurus: как устроена платформа обработки больших данных Яндекса

Расскажем про основные возможности YTsaurus и отличия от экосистемы Apache Hadoop®. Рассмотрим, как Яндекс Такси строит хранилище данных с YTsaurus.

Андрей Ривкин
16:05

Yandex Data Streams: как передавать 80/120 ГБ данных в секунду

Расскажем про корпоративную шину данных с открытым исходным кодом, зачем мы придумали этот сервис, и как устроена поставка данных в Яндексе. Как 5 инженеров управляют тысячами серверов с помощью Yandex Data Streams. Наш опыт может быть полезен компаниям, которые поддерживают большой парк оборудования и стремятся сократить усилия на его сопровождение.

Алексей Дмитриев
16:35

Сбор данных о сервисах, которые используют Kafka в Ozon

Расскажем, зачем нам понадобилось знать, как клиенты используют Kafka, а также о том, как мы выбирали решение и почему решили форкнуть Kafka, чтобы добавить свой счётчик операций.

Виктор Корейша
17:05

Использование Open Source технологий для резервирования данных клиентов

Расскажем, какие архитектуры резервирования данных мы используем в Yandex Cloud на основе Open Source технологий, и почему так важна парадигма loosely coupled. Покажем, как работаем с хранилищем, базами данных и сервисами очередей для решения бизнес-задач.

Александр Сербул
17:35

Дискуссия Open Source для решения реальных задач по обработке данных

В дискуссии примут участие руководители команд разработки Яндекса и других крупных технологических компаний, а также архитекторы продуктов безопасности.
Обсудим, зачем Яндекс выпускает продукты в открытый доступ, как Open Source решения используются для аналитических систем и продакшн-нагрузок, как сообщество помогает развивать продукт и на что обратить внимание при создании безопасных систем для работы с данными.

Олег Бондарь
Андрей Ривкин
Виктор Корейша
Николай Никитин
Сергей Бережной
Алексей Миртов
18:05

Перерыв

18:35

Как сохранить время ответа при пятикратном росте RPS: опыт Яндекс Игр в Yandex Cloud

Как бэкенд Яндекс Игр живёт в Yandex Cloud и использует управляемые сервисы PostgreSQL, Redis, YDB. Расскажем о процессе миграции в YDB и нашем опыте работы с ней, как мы храним огромные объёмы данных и обрабатываем тысячи запросов в секунду.

Алексей Дудин
18:55

Невероятные идеи по развитию GreenPlum от инженеров Yandex Cloud

Расскажем, как мы сделали фиксы и мониторинговые фичи в GreenPlum, а также о нашей крупнейшей разработке — point-in-time recovery, которую мы принесли из мира Postgres и сделали доступной для всех пользователей GreenPlum. Поговорим про реализованные фичи, которые уже работают на стендах разработчиков, и поделимся планами.

Андрей Бородин
19:15

Как Yandex Cloud развивает Open Source ClickHouse для пользователей платформы

Мы активно контрибьютим в развитие СУБД ClickHouse. Расскажем про сделанные фичи, поделимся идеями и планами на будущее.

Александр Бурмак
19:35

Открытые данные: как Open Source помогает науке

Вы узнаете, как датасеты из открытого доступа помогают продвигать научные и социальные проекты с применением ML. На реальном примере с задачей по мониторингу озера Байкал покажем, почему правильно собранные данные важнее параметров модели их обработки.

Сергей Бехтин
19:55

Нетворкинг

Как добраться

Россия, Москва, улица Льва Толстого, 16, подъезд Экстрополис