Yandex Cloud выложила нейросеть для мониторинга экосистемы Байкала в опенсорс

Также компания представила документальный фильм о проекте.

Облачная платформа Yandex Cloud опубликовала исходный код алгоритма машинного обучения для экомониторинга Байкала. Технология помогает анализировать пробы воды: определять и классифицировать содержащиеся в ней микроорганизмы. Теперь биологи и ML-специалисты по всему миру смогут использовать нейросеть для разработки собственных систем мониторинга водоёмов и отслеживать важные экологические тренды. Алгоритм опубликован на GitHub по открытой лицензии Apache 2.0.

В открытый доступ выложены датасеты, модели машинного обучения и документация для мониторинга. Такой набор поможет тестировать гипотезы по детекции, сегментации и классификации объектов в разных научных проектах. В частности разработчики смогут выявлять проблемы в балансе микроорганизмов водных объектов, и следовательно — помогать сохранять водоёмы в неизменном состоянии дольше.

author
Команда Yandex Cloud

Изначально нейросеть разрабатывалась для проекта «Точка № 1», который длится с 1945 года. Учёные НИИ биологии Иркутского государственного университета более 75 лет анализируют фито- и зоопланктон Байкала для мониторинга состояния озера вручную. Нейросеть помогла автоматизировать и ускорить весь цикл исследований. Сейчас алгоритм умеет работать с 70 формами планктона и продолжает обучаться в облачном сервисе для разработки и эксплуатации ML-алгоритмов Yandex DataSphere. В создании технологии также участвовали компания MaritimeAI и Фонд поддержки прикладных экологических разработок и исследований «Озеро Байкал».

О том, как учёные и разработчики прошли путь от решения локальной задачи на Байкале до выкладки нейросети в опенсорс, рассказывает документальный фильм. В основе сюжета — беседы со специалистами НИИ биологии, разработчиками MaritimeAI и сотрудниками Яндекса. Участники рассказали, почему иногда непросто найти общий язык людям из науки и ИТ, как они боролись с основными сложностями в проекте и зачем облачные технологии и искусственный интеллект решают научные задачи. Фильм «Двенадцать тысяч проб» можно бесплатно посмотреть на канале Яндекса на YouTube и Кинопоиске.

Узнать больше о Yandex DataSphere

«Доступность технологий — один из наших ключевых приоритетов. Яндекс не только систематически выкладывает в опенсорс свои собственные решения, но и помогает развивать открытый исходный код в совместных проектах со сторонними разработчиками. Яндекс является лидером среди российских компаний по вкладу в опенсорс, по данным ossindex. Публикуя алгоритм экомониторинга с MaritimeAI, мы продолжаем следовать нашим главным принципам. Разработка поможет не просто решить задачу конкретной научной группы, а тестировать гипотезы о состоянии водных объектов повсюду. Ведь Байкал — далеко не единственное место на планете, где ведётся подобный мониторинг».

author
Алексей Башкеев
Генеральный директор (Chief Executive Officer) платформы Yandex Cloud с июня 2020-го. В Яндексе с 2009 года, отвечал за разработку систем хранения и обработки данных, инструменты разработки и аналитику. Под руководством Алексея была создана общая инфраструктура, которой пользуются все сервисы Яндекса, включая Yandex Cloud. Окончил МИФИ, имеет степень кандидата физико-математических наук.

Напишите нам

Начать пользоваться Yandex Cloud

Тарифы

Узнать цены и рассчитать стоимость

Мероприятия

Календарь событий Yandex Cloud
Yandex Cloud выложила нейросеть для мониторинга экосистемы Байкала в опенсорс