Yandex DataSphere

Сервис для ML-разработки, предоставляющий все необходимые инструменты и динамически масштабируемые ресурсы для полного цикла разработки машинного обучения.

Привычная среда для разработки
Используйте удобный интерфейс Jupyter® Notebook в качестве среды для решения множества задач: анализ данных, разработка моделей, запуск сложных вычислений и многие другие.
Бессерверные вычисления
Выбирайте конфигурации вычислительных ресурсов для конкретных ячеек и запускайте код без необходимости настраивать серверы и виртуальные машины.
Гибкий выбор ресурсов
В запущенном проекте выбирайте конфигурацию и необходимые ресурсы под конкретные части кода. Изменения происходят за секунды, в рамках одного сценария обучения и с сохранением результата работы.
Популярные библиотеки
В DataSphere уже предустановлены TensorFlow, PyTorch* и другие популярные библиотеки для анализа данных и машинного обучения. Также вы всегда можете дополнительно установить необходимые для работы пакеты.
Распределённые вычисления
Среда позволяет выполнять распределённые вычисления на кластере Apache Spark, запущенном в сервисе Yandex Data Proc.

С чего начать

Создайте в консоли управления свой проект и работайте в привычном интерфейсе Jupyter® Notebook, используя вычислительные мощности Yandex.Cloud.

Создать проект

Вопросы и ответы

Что такое Yandex DataSphere?

DataSphere — это облачная среда, которая объединяет наиболее востребованные инструменты и ресурсы, необходимые для разработки машинного обучения. Сервис помогает пройти полный цикл создания модели: от эксперимента и разработки до запуска готовой версии в эксплуатацию на вычислительных мощностях Yandex.Cloud.

DataSphere — это облачная среда, которая объединяет наиболее востребованные инструменты и ресурсы, необходимые для разработки машинного обучения. Сервис помогает пройти полный цикл создания модели: от эксперимента и разработки до запуска готовой версии в эксплуатацию на вычислительных мощностях Yandex.Cloud.

В чём преимущества бессерверной среды Yandex DataSphere?

  • Вам не нужно тратить время на создание и обслуживание виртуальных машин — вычислительные ресурсы выделяются автоматически при создании нового проекта или запуске вычислений.
  • Вы можете масштабировать ресурсы, необходимые для работы с данными и обучения моделей, не прерывая вычислительные процессы.
  • В сервисе доступны различные конфигурации вычислительных машин, в том числе ВМ с GPU Nvidia v100, а также распределенные вычисления на кластере SPARK.
  • В качестве среды разработки в сервисе доступен широко распространённый интерфейс JupyterLab.
  • Основные пакеты для анализа данных и машинного обучения уже доступны в сервисе в момент старта — TensorFlow, Keras, NumPy, PyTorch, CatBoost, LightGBM и другие.

Всё это помогает значительно сократить стоимость машинного обучения по сравнению с вычислениями на собственном оборудовании или на других облачных платформах, а также уменьшить время на разработку и ускорить перевод моделей из стадии эксперимента в стадию промышленного использования.

  • Вам не нужно тратить время на создание и обслуживание виртуальных машин — вычислительные ресурсы выделяются автоматически при создании нового проекта или запуске вычислений.
  • Вы можете масштабировать ресурсы, необходимые для работы с данными и обучения моделей, не прерывая вычислительные процессы.
  • В сервисе доступны различные конфигурации вычислительных машин, в том числе ВМ с GPU Nvidia v100, а также распределенные вычисления на кластере SPARK.
  • В качестве среды разработки в сервисе доступен широко распространённый интерфейс JupyterLab.
  • Основные пакеты для анализа данных и машинного обучения уже доступны в сервисе в момент старта — TensorFlow, Keras, NumPy, PyTorch, CatBoost, LightGBM и другие.

Всё это помогает значительно сократить стоимость машинного обучения по сравнению с вычислениями на собственном оборудовании или на других облачных платформах, а также уменьшить время на разработку и ускорить перевод моделей из стадии эксперимента в стадию промышленного использования.

Начните пользоваться DataSphere

  1. TensorFlow является зарегистрированным товарным знаком, принадлежащим Google Inc.
    PyTorch является зарегистрированным товарным знаком, принадлежащим Facebook, Inc.