
Yandex DataSphere
Сервис для ML-разработки, предоставляющий все необходимые инструменты и динамически масштабируемые ресурсы для полного цикла разработки машинного обучения.
Привычная среда для разработки
Бессерверные вычисления
Гибкий выбор ресурсов
Популярные библиотеки
Распределённое обучениеPreview
Развёртывание по кнопкеNew
С чего начать
Создайте в консоли управления свой проект и работайте в привычном интерфейсе Jupyter® Notebook, используя вычислительные мощности Yandex Cloud.

Полный цикл машинного обучения в облаке
От экспериментов к внедрению: возможности Yandex DataSphere покрывают весь жизненный цикл ML-моделей для бизнеса.
- Собирайте и анализируйте данные
- Создавайте десятки ML-моделей и выбирайте лучшие
- Обучайте модели на полных датасетах
- Разворачивайте модель быстро и без дополнительных затрат

Training as a Service
Бесшовная оптимизация обучения в облачном окружении: сервис организует вычисления, понижая порог входа в High Performance Computing (HPC).
Вместо параллелизации экспериментов можно пропорционально их ускорять!

Вопросы и ответы
Что такое Yandex DataSphere?
DataSphere — это облачная среда, которая объединяет наиболее востребованные инструменты и ресурсы, необходимые для разработки машинного обучения. Сервис помогает пройти полный цикл создания модели: от эксперимента и разработки до запуска готовой версии в эксплуатацию на вычислительных мощностях Yandex Cloud.
DataSphere — это облачная среда, которая объединяет наиболее востребованные инструменты и ресурсы, необходимые для разработки машинного обучения. Сервис помогает пройти полный цикл создания модели: от эксперимента и разработки до запуска готовой версии в эксплуатацию на вычислительных мощностях Yandex Cloud.
В чём преимущества бессерверной среды Yandex DataSphere?
- Вам не нужно тратить время на создание и обслуживание виртуальных машин — вычислительные ресурсы выделяются автоматически при создании нового проекта или запуске вычислений.
- Вы можете масштабировать ресурсы, необходимые для работы с данными и обучения моделей, не прерывая вычислительные процессы.
- В сервисе доступны различные конфигурации вычислительных машин, в том числе ВМ с GPU NVIDIA® V100 и NVIDIA® A100, а также распределенные вычисления на кластере SPARK.
- В качестве среды разработки в сервисе доступен широко распространённый интерфейс JupyterLab.
- Основные пакеты для анализа данных и машинного обучения уже доступны в сервисе в момент старта — TensorFlow, Keras, NumPy, PyTorch, CatBoost, LightGBM и другие.
Всё это помогает значительно сократить стоимость машинного обучения по сравнению с вычислениями на собственном оборудовании или на других облачных платформах, а также уменьшить время на разработку и ускорить перевод моделей из стадии эксперимента в стадию промышленного использования.
- Вам не нужно тратить время на создание и обслуживание виртуальных машин — вычислительные ресурсы выделяются автоматически при создании нового проекта или запуске вычислений.
- Вы можете масштабировать ресурсы, необходимые для работы с данными и обучения моделей, не прерывая вычислительные процессы.
- В сервисе доступны различные конфигурации вычислительных машин, в том числе ВМ с GPU NVIDIA® V100 и NVIDIA® A100, а также распределенные вычисления на кластере SPARK.
- В качестве среды разработки в сервисе доступен широко распространённый интерфейс JupyterLab.
- Основные пакеты для анализа данных и машинного обучения уже доступны в сервисе в момент старта — TensorFlow, Keras, NumPy, PyTorch, CatBoost, LightGBM и другие.
Всё это помогает значительно сократить стоимость машинного обучения по сравнению с вычислениями на собственном оборудовании или на других облачных платформах, а также уменьшить время на разработку и ускорить перевод моделей из стадии эксперимента в стадию промышленного использования.
Начните пользоваться DataSphere
Полезные ссылки
⚹ TensorFlow является зарегистрированным товарным знаком, принадлежащим Google Inc.
⚹ PyTorch является зарегистрированным товарным знаком, принадлежащим Facebook, Inc.