Yandex DataSphere

Сервис для ML-разработки с удобным интерфейсом, в котором легко начать работу.

В DataSphere есть все необходимые инструменты и динамически масштабируемые облачные ресурсы для полного цикла разработки машинного обучения.

Гибкость и масштабируемость облака

Выберите необходимую конфигурацию вычислительных ресурсов и начните использовать их для обучения моделей уже через несколько секунд.

Бессерверные вычисления

Выберите опцию Serverless, определите конфигурации вычислительных ресурсов для конкретных ячеек кода и платите только за время вычислений.

Знакомые IDE

Используйте знакомый интерфейс Jupyter® Notebook в качестве среды для решения задач, подключайте TensorFlow, PyTorch* и другие популярные библиотеки для анализа данных и машинного обучения.

Гибкое управление ресурсами

Управляйте данными в проекте, сохраняйте их в датасеты, настраивайте подключения к базам данных, Object Storage или другим хранилищам в едином интерфейсе.

Командная работа

Совместно работайте над созданием ML-модели с коллегами из любой точки мира, делитесь кодом проекта, а также настраивайте бюджеты для команд в организации.

Развёртывание по кнопке

Запускайте ML‑модели в эксплуатацию за несколько минут без необходимости управлять инфраструктурой — всё будет создано автоматически.

Новый интерфейс DataSphere

Сообщества для совместной работы и обмена ресурсами, инструменты развёртывания сервисов, обновленный дизайн и другие новые возможности

Перейти

С чего начать

Создайте свой проект и работайте в новом интерфейсе DataSphere, который объединяет привычный Jupyter® Notebook и вычислительные мощности Yandex Cloud.

Полный цикл машинного обучения в облаке

От экспериментов к внедрению: возможности Yandex DataSphere покрывают весь жизненный цикл ML-моделей для бизнеса.

  • Собирайте и анализируйте данные
  • Создавайте десятки ML-моделей и выбирайте лучшие
  • Обучайте модели на полных датасетах
  • Разворачивайте модель быстро и без дополнительных затрат

Training as a Service

Бесшовная оптимизация обучения в облачном окружении: сервис организует вычисления, снижая порог входа в High Performance Computing (HPC).

Вместо параллелизации экспериментов их можно пропорционально ускорять!

Для кого этот сервис

card-image

Data Scientist

DataSphere развивает концепцию Mighty Data Science: для релиза модели вам не нужна помощь других специалистов. Добавьте модель в DataSphere и опубликуйте её за пару кликов.

card-image

Руководитель разработки

Гибко управляйте бюджетами на команду, восстановите проект и окружение в два клика даже без автора, централизовано храните ресурсы и управляйте ими.

card-image

Дата-инженер и аналитик

Вам доступны популярные библиотеки анализа и обработки данных, а также возможность организовать работу в одном контуре с Data Scientist’ами.

MLOps в DataSphere на примере SpeechKit

Какие фичи нам потребовались от платформы для эксплуатации SpeechKit и какие типичные проблемы ML-сервисов позволяет решать реализованная функциональность.

Рекомендательная система на базе DataSphere

Как на базе собранных сведений с использованием Yandex DataSphere создать кастомизированную рекомендательную систему и предлагать своим клиентам наиболее подходящие товары и услуги.

Облачное поколение ноутбуков — от тетрадок к сфере данных

Как в интерфейсе интерфейс DataSphere запускать и использовать ML-модели в промышленных масштабах.

Облачные инструменты для ML-разработчиков

Анализ возможных направлений развития облачного инструментария для ML.

Программа содействия образованию и науке в области Computer Science

Гранты на вычислительные ресурсы для учебно-исследовательской работы по машинному обучению, компьютерному зрению и анализу данных.

Подать заявку на грант

Вопросы и ответы

Что такое Yandex DataSphere?

DataSphere — это облачная среда, которая объединяет наиболее востребованные инструменты и ресурсы, необходимые для машинного обучения. Сервис помогает пройти полный цикл создания модели: от эксперимента и разработки до запуска готовой версии в эксплуатацию на вычислительных мощностях Yandex Cloud.

DataSphere — это облачная среда, которая объединяет наиболее востребованные инструменты и ресурсы, необходимые для машинного обучения. Сервис помогает пройти полный цикл создания модели: от эксперимента и разработки до запуска готовой версии в эксплуатацию на вычислительных мощностях Yandex Cloud.

В чём преимущества бессерверной среды Yandex DataSphere?

  • Вам не нужно тратить время на создание и обслуживание виртуальных машин — вычислительные ресурсы выделяются автоматически при создании нового проекта или запуске вычислений.
  • Вы можете масштабировать ресурсы, необходимые для работы с данными и обучения моделей, не прерывая вычислительные процессы.
  • В сервисе доступны различные конфигурации вычислительных машин, в том числе ВМ с GPU NVIDIA® V100 и NVIDIA® A100, а также распределённые вычисления на кластере SPARK.
  • В качестве среды разработки в сервисе доступен широко распространённый интерфейс JupyterLab.
  • Основные пакеты для анализа данных и машинного обучения уже доступны в сервисе в момент старта — TensorFlow, Keras, NumPy, PyTorch, CatBoost, LightGBM и другие.

Всё это помогает значительно сократить стоимость машинного обучения по сравнению с вычислениями на собственном оборудовании или на других облачных платформах, а также уменьшить время на разработку и ускорить перевод моделей из стадии эксперимента в стадию промышленного использования.

  • Вам не нужно тратить время на создание и обслуживание виртуальных машин — вычислительные ресурсы выделяются автоматически при создании нового проекта или запуске вычислений.
  • Вы можете масштабировать ресурсы, необходимые для работы с данными и обучения моделей, не прерывая вычислительные процессы.
  • В сервисе доступны различные конфигурации вычислительных машин, в том числе ВМ с GPU NVIDIA® V100 и NVIDIA® A100, а также распределённые вычисления на кластере SPARK.
  • В качестве среды разработки в сервисе доступен широко распространённый интерфейс JupyterLab.
  • Основные пакеты для анализа данных и машинного обучения уже доступны в сервисе в момент старта — TensorFlow, Keras, NumPy, PyTorch, CatBoost, LightGBM и другие.

Всё это помогает значительно сократить стоимость машинного обучения по сравнению с вычислениями на собственном оборудовании или на других облачных платформах, а также уменьшить время на разработку и ускорить перевод моделей из стадии эксперимента в стадию промышленного использования.

Начните пользоваться DataSphere

⚹ TensorFlow является зарегистрированным товарным знаком, принадлежащим Google Inc.
⚹ PyTorch является зарегистрированным товарным знаком, принадлежащим Facebook, Inc.