Yandex.Cloud
  • Сервисы
  • Почему Yandex.Cloud
  • Сообщество
  • Тарифы
  • Документация
  • Связаться с нами
Подключиться
Yandex DataSphere
  • Начало работы
  • Пошаговые инструкции
    • Все инструкции
    • Создание проекта
    • Установка зависимостей
    • Запуск примеров кода в ноутбуке
    • Версионирование. Работа с контрольными точками
    • Управление вычислительными ресурсами
    • Очистка состояния интерпретатора
    • Поделиться ноутбуком
      • Публикация ноутбука
      • Экспорт проекта
    • Изменение имени или описания
    • Удаление проекта
    • Работа с Git
    • Настройка интеграции с Data Proc
  • Концепции
    • Обзор
    • Проект
    • Список предустановленного ПО
    • Доступные команды
    • Конфигурации вычислительных ресурсов
    • Интеграция с системами контроля версий и данных
    • Интеграция с Data Proc
    • Квоты и лимиты
  • Управление доступом
  • Правила тарификации
  • Вопросы и ответы
  1. Концепции
  2. Обзор

О сервисе DataSphere

  • Преимущества сервиса
    • Среда разработки, готовая к использованию
    • Автоматическое обслуживание вычислительных ресурсов
    • Сохранение состояния при завершении работы
    • Управление вычислительными ресурсами
    • Вы сможете поделиться вашими результатами
  • Существующие ограничения сервиса

Yandex DataSphere — среда для ML-разработки, которая сочетает в себе привычный интерфейс Jupyter® Notebook, технологию бессерверных вычислений и возможность бесшовного использования разных конфигураций вычислительных ресурсов. Yandex DataSphere помогает значительно сократить стоимость машинного обучения по сравнению с вычислениями на собственном оборудовании или на других облачных платформах.

Если вы ещё не пользовались Jupyter Notebook, то попробуйте: ноутбуки удобны тем, что позволяют вам исполнять код последовательно и сразу визуализировать результаты. Ноутбуки также удобно использовать для подготовки аналитических отчетов и статей: между ячейками кода вы можете добавлять пояснения на языке Markdown.

Преимущества сервиса

Среда разработки, готовая к использованию

Вам не нужно тратить время на создание и обслуживание виртуальных машин — при создании нового проекта, автоматически выделяются вычислительные ресурсы для решения ваших задач.

На виртуальной машине уже установлена среда разработки JupyterLab и пакеты для анализа данных и машинного обучения (TensorFlow, Keras, NumPy и другие) — вы можете сразу начать их использовать. Полный список предустановленных пакетов.

Если какого-то пакета вам не хватает, вы можете установить его прямо из ноутбука.

Автоматическое обслуживание вычислительных ресурсов

Сервис автоматически управляет выделением ресурсов. Если вы не будете производить вычисления, сервис не будет выделять ресурсы.

Сохранение состояния при завершении работы

Если вы закроете вкладку с ноутбуком, состояние интерпретатора, все переменные и результаты вычислений сохранятся. Вы сможете продолжить работу, когда снова откроете проект.

Примечание

Некоторые переменные не сериализуются и поэтому не могут сохраниться. Например, переменная с файлом открытым на запись: f = open("file.txt", "w").

Для таких переменных в момент выполнения присваивания будет показано предупреждение: The following variables cannot be serialized:.

Управление вычислительными ресурсами

Для разных задач нужны разные вычислительные ресурсы. Для одних задач достаточно обычного процессора, а для других нужен графический процессор.

В DataSphere доступны разные конфигурации вычислительных ресурсов. По умолчанию проект запускается с минимальной конфигурацией S (32 ГБ RAM и 2 vCPU).

Вы можете изменить конфигурацию в любой момент в процессе работы. Состояние интерпретатора сохранится.

Вы сможете поделиться вашими результатами

Вы можете экспортировать ноутбук в формат HTML со всеми результатами расчетов и пояснениями к ячейкам и поделиться ссылкой на отчет в этом формате. Экспорт в других форматах сейчас недоступен.

Существующие ограничения сервиса

Подробнее об ограничениях сервиса читайте в разделе Квоты и лимиты.

См. также

  • Все инструкции
  • Квоты и лимиты
  • Правила тарификации для DataSphere
В этой статье:
  • Преимущества сервиса
  • Среда разработки, готовая к использованию
  • Автоматическое обслуживание вычислительных ресурсов
  • Сохранение состояния при завершении работы
  • Управление вычислительными ресурсами
  • Вы сможете поделиться вашими результатами
  • Существующие ограничения сервиса
Language
Вакансии
Политика конфиденциальности
Условия использования
© 2021 ООО «Яндекс.Облако»