Image alt

Yandex DataSphere

Сервис для ML-разработки с удобным интерфейсом, в котором легко начать работу.

В DataSphere есть все необходимые инструменты и динамически масштабируемые облачные ресурсы для полного цикла разработки машинного обучения.

Гибкость и масштабируемость облака

Выберите необходимую конфигурацию вычислительных ресурсов и начните использовать их для обучения моделей уже через несколько секунд.

Режимы Serverless и Dedicated

Выберите опцию Serverless, определите конфигурации вычислительных ресурсов для конкретных ячеек кода и платите только за время вычислений. Или зарезервируйте виртуальные машины с режимом Dedicated и ускорьте разработку.

Знакомые IDE

Используйте знакомый интерфейс Jupyter® Notebook в качестве среды для решения задач, подключайте TensorFlow, PyTorch* и другие популярные библиотеки для анализа данных и машинного обучения.

Гибкое управление ресурсами

Управляйте данными в проекте, сохраняйте их в датасеты, настраивайте подключения к базам данных, Object Storage или другим хранилищам в едином интерфейсе.

Командная работа

Совместно работайте над созданием ML-модели с коллегами из любой точки мира, делитесь кодом проекта, а также настраивайте бюджеты для команд в организации.

Развёртывание по кнопке

Запускайте ML‑модели в эксплуатацию за несколько минут без необходимости управлять инфраструктурой — всё будет создано автоматически.

DataSphere Dedicated

Режим Dedicated позволит зарезервировать виртуальную машину при запуске Jupyter Notebook и работать с ней столько, сколько потребуется.

Image alt

С чего начать

Создайте свой проект и работайте в новом интерфейсе DataSphere, который объединяет привычный Jupyter® Notebook и вычислительные мощности Yandex Cloud.

Full screen image

Полный цикл машинного обучения в облаке

От экспериментов к внедрению: возможности Yandex DataSphere покрывают весь жизненный цикл ML-моделей для бизнеса.

  • Собирайте и анализируйте данные
  • Создавайте десятки ML-моделей и выбирайте лучшие
  • Обучайте модели на полных датасетах
  • Разворачивайте модель быстро и без дополнительных затрат
Image alt

Для кого этот сервис

Image alt

Data Scientist

DataSphere развивает концепцию Mighty Data Science: для релиза модели вам не нужна помощь других специалистов. Добавьте модель в DataSphere и опубликуйте её за пару кликов.

Image alt

Руководитель разработки

Гибко управляйте бюджетами на команду, восстановите проект и окружение в два клика даже без автора, централизовано храните ресурсы и управляйте ими.

Image alt

Дата-инженер и аналитик

Вам доступны популярные библиотеки анализа и обработки данных, а также возможность организовать работу в одном контуре с Data Scientist’ами.

Программа содействия образованию и науке в области Computer Science

Гранты на вычислительные ресурсы для учебно-исследовательской работы по машинному обучению, компьютерному зрению и анализу данных.

Подать заявку на грант
Image alt

Вопросы и ответы

Что такое Yandex DataSphere?

DataSphere — это облачная среда, которая объединяет наиболее востребованные инструменты и ресурсы, необходимые для машинного обучения. Сервис помогает пройти полный цикл создания модели: от эксперимента и разработки до запуска готовой версии в эксплуатацию на вычислительных мощностях Yandex Cloud.

В чём преимущества бессерверной среды Yandex DataSphere?

  • Вам не нужно тратить время на создание и обслуживание виртуальных машин — вычислительные ресурсы выделяются автоматически при создании нового проекта или запуске вычислений.
  • Вы можете масштабировать ресурсы, необходимые для работы с данными и обучения моделей, не прерывая вычислительные процессы.
  • В сервисе доступны различные конфигурации вычислительных машин, в том числе ВМ с GPU NVIDIA® V100 и NVIDIA® A100, а также распределённые вычисления на кластере SPARK.
  • В качестве среды разработки в сервисе доступен широко распространённый интерфейс JupyterLab.
  • Основные пакеты для анализа данных и машинного обучения уже доступны в сервисе в момент старта — TensorFlow, Keras, NumPy, PyTorch, CatBoost, LightGBM и другие.

Всё это помогает значительно сократить стоимость машинного обучения по сравнению с вычислениями на собственном оборудовании или на других облачных платформах, а также уменьшить время на разработку и ускорить перевод моделей из стадии эксперимента в стадию промышленного использования.

В чём преимущества Dedicated-режима?

Dedicated-режим аналогичен локальной работе с Jupyter-ноутбуком, но на облачной виртуальной машине. Вы можете выбрать вычислительную мощность виртуальной машины, которая будет зарезервирована только под ваш проект.

  • В Dedicated-режиме нет сериализации, стейт-коммита и долгого ожидания. Но, как и в обычном Jupyter-ноутбуке, нужно не забывать сохранять результаты.
  • Вы можете зарезервировать машину при запуске Jupyter Notebook и работать с ней столько, сколько потребуется. Машину нужно вернуть в конце работы или настроить условия для автоматического возврата.

Начните пользоваться DataSphere

⚹ TensorFlow является зарегистрированным товарным знаком, принадлежащим Google Inc.
⚹ PyTorch является зарегистрированным товарным знаком, принадлежащим Facebook, Inc.