О сервисе DataSphere
Yandex DataSphere — среда для ML-разработки, которая сочетает в себе привычный интерфейс Jupyter® Notebook, технологию бессерверных вычислений и возможность бесшовного использования разных конфигураций вычислительных ресурсов. Yandex DataSphere помогает значительно сократить стоимость машинного обучения по сравнению с вычислениями на собственном оборудовании или на других облачных платформах.
Если вы ещё не пользовались Jupyter Notebook, то попробуйте: ноутбуки удобны тем, что позволяют вам исполнять код последовательно и сразу визуализировать результаты. Ноутбуки также удобно использовать для подготовки аналитических отчетов и статей: между ячейками кода вы можете добавлять пояснения на языке Markdown.
Преимущества сервиса
Среда разработки, готовая к использованию
Вам не нужно тратить время на создание и обслуживание виртуальных машин — при создании нового проекта, автоматически выделяются вычислительные ресурсы для решения ваших задач.
На виртуальной машине уже установлена среда разработки JupyterLab и пакеты для анализа данных и машинного обучения (TensorFlow, Keras, NumPy и другие) — вы можете сразу начать их использовать. Полный список предустановленных пакетов.
Если какого-то пакета вам не хватает, вы можете установить его прямо из ноутбука.
Автоматическое обслуживание вычислительных ресурсов
Сервис автоматически управляет выделением ресурсов. Если вы не будете производить вычисления, сервис не будет выделять ресурсы.
Сохранение состояния при завершении работы
Если вы закроете вкладку с ноутбуком, состояние интерпретатора, все переменные и результаты вычислений сохранятся. Вы сможете продолжить работу, когда снова откроете проект.
Примечание
Некоторые переменные не сериализуются и поэтому не могут сохраниться. Например, переменная с файлом открытым на запись: f = open("file.txt", "w")
.
Для таких переменных в момент выполнения присваивания будет показано предупреждение: The following variables cannot be serialized:
.
Управление вычислительными ресурсами
Для разных задач нужны разные вычислительные ресурсы. Для одних задач достаточно обычного процессора, а для других нужен графический процессор.
В DataSphere доступны разные конфигурации вычислительных ресурсов. По умолчанию проект запускается с минимальной конфигурацией S
(32 ГБ RAM и 2 vCPU).
Вы можете изменить конфигурацию в любой момент в процессе работы. Состояние интерпретатора сохранится.
Вы сможете поделиться вашими результатами
Вы можете экспортировать ноутбук в формат HTML со всеми результатами расчетов и пояснениями к ячейкам и поделиться ссылкой на отчет в этом формате. Экспорт в других форматах сейчас недоступен.
Существующие ограничения сервиса
Подробнее об ограничениях сервиса читайте в разделе Квоты и лимиты.