OpenSearch — поисковая и аналитическая система с открытым исходным кодом в облаке

Рассказываем про OpenSearch — систему с открытым исходным кодом. С её помощью вы можете хранить и анализировать логи, организовывать поиск по сайту и визуализировать полученную информацию.

Что такое OpenSearch

OpenSearch — это легко масштабируемая система поисковых и аналитических инструментов с открытым исходным кодом. Она была ответвлена от кодовой базы Elasticsearch 7.10.2. Из OpenSearch убрали компоненты, распространяемые не под лицензией Apache 2.0. В систему включены: движок хранения и поиска, веб‑интерфейс, среда визуализации данных OpenSearch Dashboards, а также дополнения, которые ранее поставлялись в продукте Open Distro for Elasticsearch. Плагины позволяют использовать ряд возможностей движка Elasticsearch:

  • функциональность машинного обучения;

  • быстрый поиск по векторам с помощью k‑NN (k‑Nearest Neighbor);

  • управление безопасностью, индексами;

  • поиск и обнаружение аномалий;

  • поддержка SQL;

  • генерация уведомлений;

  • диагностика производительности кластера;

  • шифрование трафика;

  • разграничение доступа на основе ролей (RBAC);

  • аутентификация через SAML и другие внешние источники авторизации;

  • реализация единой точки входа (SSO);

  • ведение детального лога для аудита.

OpenSearch развивают при участии сообщества и крупных компаний: Red Hat, SAP, Capital One и т. д. Систему применяют для полнотекстового поиска по сайту, хранения и анализа журналов, для визуализации и анализа полученной информации.

Вместе с платформой доставки данных Beat (Filebeat, Winlogbeat и т. д.) OpenSearch позволяет построить полный цикл управления логами: сбор, систематизация, поиск. Возможности визуализации реализованы в Dashboards.

Сценарии применения плагинов OpenSearch

Обнаружение аномалий

Плагин для поиска аномалий даёт возможность анализировать ваши журналы. Для этого он использует алгоритмы, основанные на машинном обучении. Например, плагин позволит обнаружить и настроить оповещение об аномалии в данных метрики использования памяти. Уведомления предупредят о ранних признаках сбоя IT‑инфраструктуры.

Единый вход в OpenSearch с помощью SAML

Плагин безопасности SAML (Security Assertion Markup Language) поддерживает аутентификацию пользователей. Он использует профиль SSO веб‑браузера по протоколу SAML 2.0.

SAML позволяет пользователю получить доступ в несколько приложений, используя для авторизации один набор учётных данных. В основе его работы — обмен аутентификационной информацией между участниками. Например, между системой управления доступами и веб‑приложением.

Векторный поиск

Быстрый поиск с помощью k‑NN (по векторам по сходству признаков в документах, логах, журналах и запросах) позволяет реализовать такие сценарии, как построение рекомендательных систем, обнаружение мошенничества, поиск изображений, видео и связанных документов, а также многое другое.

Плагин OpenSearch k‑NN выполняет быстрый поиск ближайших соседей в миллиардах документов по тысячам измерений. Чтобы сделать поиск по сходству более точным, вы можете использовать агрегации и условия фильтрации.

author
Команда Yandex Cloud

OpenSearch в Yandex Cloud

Managed Service for OpenSearch имеет все преимущества управляемых сервисов в облаке. С выходом общедоступной версии сервиса появилась возможность использовать расширенный набор операций с кластером. Теперь вы можете:

  • создать кластер сразу с нужным количеством групп хостов, а не добавлять их после создания;

  • полноценно работать с группой хостов;

  • восстановить данные из бэкапа;

  • проводить мониторинг кластера, групп хостов или отдельных хостов;

  • использовать SAML как внешний источник авторизации.

Чтобы вы легко перенесли данные в сервис Yandex Managed Service for OpenSearch, мы подготовили специальную инструкцию по миграции.

В новом сервисе появилась поддержка «холодных» и «горячих» зон кластера. Она стала возможной благодаря созданию разноранговых узлов. Теперь пользователи смогут сэкономить на хранении архивных данных, настроить удобные и экономичные конфигурации под какие‑либо специфичные задачи, например ML. А ещё им не нужно будет тратить силы и время на создание ранее обязательных ресурсов, например узлов Dashboards.

Мы отказались от прямого управления отдельными хостами. Все свойства, которые были внутри отдельных хостов, один в один переносятся на группу: зоны доступности, роли, сервис и т. д. Хосты в рамках группы можно добавлять и удалять как раньше.

В OpenSearch пользователи могут отслеживать узкие места в производительности. А в будущем мы планируем настроить полноценный интерфейс для оценки производительности на основе данных встроенного анализатора.

Yandex Managed Service for OpenSearch

Обучение

Освойте инструменты Yandex Cloud

Вакансии

Все актуальные вакансии Yandex Cloud

Мероприятия

Календарь событий Yandex Cloud
OpenSearch — поисковая и аналитическая система с открытым исходным кодом в облаке
Войдите, чтобы сохранить пост