Yandex Cloud
  • Сервисы
  • Решения
  • Почему Yandex Cloud
  • Сообщество
  • Тарифы
  • Документация
  • Связаться с нами
Подключиться
Language / Region
Проект Яндекса
© 2023 ООО «Яндекс.Облако»
Yandex Managed Service for Greenplum®
  • Начало работы
  • Пошаговые инструкции
    • Все инструкции
    • Информация об имеющихся кластерах
    • Расчет конфигурации кластера
    • Создание кластера
    • Подключение к базе данных
    • Остановка и запуск кластера
    • Управление хостами кластера
      • Просмотр хостов кластера
      • Расширение кластера
    • Изменение настроек кластера
    • Управление ролями и пользователями
    • Управление клиентскими процессами
    • Использование внешних таблиц
    • Расширения Greenplum
      • Управление расширениями
      • pgcrypto
      • uuid-cb
    • Управление резервными копиями
    • Просмотр логов кластера
    • Удаление кластера
    • Диагностика производительности
    • Мониторинг состояния кластера и хостов
    • Управление ресурсными группами
  • Практические руководства
    • Миграция базы данных в Managed Service for Greenplum®
    • Создание внешней таблицы на базе таблицы из бакета Yandex Object Storage с помощью конфигурационного файла
    • Миграция базы данных из Greenplum® в PostgreSQL
    • Миграция базы данных из Greenplum® в ClickHouse
  • Концепции
    • Взаимосвязь ресурсов сервиса
    • Классы хостов
    • Сеть в Managed Service for Greenplum®
    • Квоты и лимиты
    • Типы дисков
    • Резервные копии
    • Ресурсные группы
    • Шардирование
    • Типы хранения данных
    • Пользователи и роли
    • Техническое обслуживание
    • Настройки Greenplum®
  • Управление доступом
  • Правила тарификации
  • Справочник API
    • Аутентификация в API
    • gRPC (англ.)
      • Overview
      • BackupService
      • ClusterService
      • ResourcePresetService
      • OperationService
    • REST (англ.)
      • Overview
      • Backup
        • Overview
        • get
        • list
      • Cluster
        • Overview
        • create
        • delete
        • expand
        • get
        • list
        • listBackups
        • listLogs
        • listMasterHosts
        • listOperations
        • listSegmentHosts
        • restore
        • start
        • stop
        • streamLogs
        • update
      • ResourcePreset
        • Overview
        • get
        • list
      • Operation
        • Overview
        • get
  • История изменений
  • Вопросы и ответы
    • Общие вопросы
    • Подключение
    • Резервное копирование
    • Изменение кластера
    • Кластер и хосты Managed Service for Greenplum®
    • Работа с внешними таблицами
    • Управление пользователями
    • Мониторинг и логи
    • Все вопросы на одной странице
  1. Пошаговые инструкции
  2. Мониторинг состояния кластера и хостов

Мониторинг состояния Greenplum®-кластера и хостов

Статья создана
Yandex Cloud
  • Мониторинг состояния кластера
  • Мониторинг состояния хостов
  • Интеграция с Yandex Monitoring
  • Состояние и статус кластера
    • Состояния кластера
    • Статусы кластера

Данные о состоянии кластера и его хостов доступны в консоли управления. Их можно посмотреть на вкладке Мониторинг страницы управления кластером или в сервисе Yandex Monitoring.

Диагностическая информация о состоянии кластера представлена в виде графиков.

Новые данные для графиков поступают каждые 15 секунд.

Примечание

На графиках автоматически применяются наиболее подходящие кратные единицы измерения (мегабайты, гигабайты и т. д.).

Мониторинг состояния кластера

Для просмотра детальной информации о состоянии кластера Managed Service for Greenplum®:

Консоль управления
  1. Перейдите на страницу каталога и выберите сервис Managed Service for Greenplum®.
  2. Нажмите на имя нужного кластера и выберите вкладку Мониторинг.
  3. Чтобы перейти к работе с метриками, дашбордами или алертами в сервисе Yandex Monitoring, нажмите кнопку Открыть в мониторинге на панели сверху.

На странице отображаются следующие графики:

  • Alive hosts — работоспособность хостов кластера.

  • Alive segments — работоспособность первичного и резервного мастеров, основных и зеркальных сегментов.

  • Connections — количество подключений к БД в каждом из состояний:

    • Active — активные;
    • Waiting — ожидают;
    • Idle — простаивают;
    • Idle in transaction — простаивают в транзакции;
    • Aborted — прерванные.
  • Group resource cpu — загрузка процессорных ядер по группам процессов:

    • admin_group — в административной группе;
    • default_group — в группе по умолчанию.
  • Group resource memory — использование оперативной памяти (в байтах) по группам процессов:

    • admin_group — в административной группе;
    • default_group — в группе по умолчанию.
  • Master — определение первичного хоста-мастера.

  • Master replication lag — отставание репликации мастера (в байтах).

  • Master replication state — работоспособность репликации мастера.

  • Segment health — количество сегментов с различной работоспособностью:

    • total — все;
    • not sync — несинхронизированные;
    • down — недоступные;
    • not prefer role — непредпочтительные.
  • Spill files count — количество временных файлов.

  • Spill files size — суммарный размер временных файлов (в байтах).

  • Xid wraparound — использование последовательности идентификаторов транзакций (в процентах).

Мониторинг состояния хостов

Для просмотра детальной информации о состоянии отдельных хостов Managed Service for Greenplum®:

Консоль управления
  1. Перейдите на страницу каталога и выберите сервис Managed Service for Greenplum®.
  2. Нажмите на имя нужного кластера и выберите вкладку Хосты → Мониторинги.
  3. Выберите нужный хост из выпадающего списка.

На этой странице выводятся графики, показывающие нагрузку на отдельный хост кластера (мастер или сегмент):

  • CPU — загрузка процессорных ядер. При повышении нагрузки значение Idle уменьшается.
  • Disk IOPS in progress — количество незавершенных дисковых операций.
  • Disk io time — длительность дисковых операций.
  • Disk read and write — объем дисковых операций (в байтах).
  • Disk read and write time — длительность дисковых операций чтения и записи.
  • Disk usage — использование дискового пространства (выводится два графика: в байтах и в процентах).
  • Memory usage — использование оперативной памяти (в байтах). При высоких нагрузках значение параметра Free уменьшается, а значения остальных — растут.
  • Network — объем данных, переданных по сети (в байтах).

Интеграция с Yandex Monitoring

Чтобы настроить алерты показателей состояния кластера и хостов:

Консоль управления
  1. В консоли управления выберите каталог с кластером, для которого нужно настроить алерты.
  2. В списке сервисов выберите  Monitoring.
  3. В блоке Сервисные дашборды выберите:
    • Managed Service for Elasticsearch — Cluster Overview для настройки алертов кластера;
    • Managed Service for Elasticsearch — Host Overview для настройки алертов хостов.
  4. На нужном графике с показателями нажмите на значок и выберите пункт Создать алерт.
  5. Если показателей на графике больше одного, выберите запрос данных для формирования метрики и нажмите Продолжить. Подробнее о языке запросов см. в документации Yandex Monitoring.
  6. Задайте значения порогов Alarm и Warning для оповещения.
  7. Нажмите кнопку Создать алерт.

Чтобы настроить автоматический мониторинг других показателей состояния кластера:

Консоль управления
  1. Создайте алерт.
  2. Добавьте метрику состояния.
  3. Задайте в параметрах алерта значения порогов для оповещения.

Полный список поддерживаемых метрик см. в документации Yandex Monitoring.

Состояние и статус кластера

Состояние кластера указывает на исправность его хостов, а статус показывает, запущен кластер, остановлен или находится в промежуточном состоянии.

Для просмотра состояния и статуса кластера:

  1. Перейдите на страницу каталога и выберите сервис Managed Service for Greenplum®.
  2. Наведите курсор на индикатор в столбце Доступность в строке нужного кластера.

Состояния кластера

Состояние Описание Предлагаемые действия
ALIVE Кластер работает в штатном режиме. Действий не требуется.
DEGRADED Кластер работает не на полную мощность: минимум один из хостов имеет состояние, отличное от ALIVE. Выполните диагностику:
  • Перейдите на вкладку Хосты и посмотрите, какие из них в нерабочем состоянии.
  • Перейдите на вкладку Операции и убедитесь, что все операции завершились.
  • Убедитесь, что кластер не находится в процессе технического обслуживания.
Если причины не удалось выяснить самостоятельно, обратитесь в службу поддержки.
DEAD Кластер неработоспособен: все его хосты не работают. Составьте обращение в службу поддержки, указав:
  • Идентификатор кластера.
  • Идентификаторы последних операций, которые на нем выполнялись.
  • Время по графикам доступности, когда кластер перешел в состояние DEAD.
UNKNOWN Состояние кластера неизвестно. Составьте обращение в службу поддержки, указав:
  • Идентификатор кластера.
  • Идентификаторы последних операций, которые на нем выполнялись.
  • Время по графикам доступности, когда кластер перешел в состояние UNKNOWN.

Статусы кластера

Статус Описание Предлагаемые действия
CREATING Идет подготовка к первому запуску Подождите немного и приступайте к работе. Время создания кластера зависит от класса хостов.
RUNNING Кластер работает в штатном режиме Действий не требуется.
STOPPING Кластер останавливается Через некоторое время кластеру будет присвоен статус STOPPED, и он будет выведен из работы. Действий не требуется.
STOPPED Кластер остановлен Чтобы вернуть его в работу, обратитесь к разделу Остановка и запуск кластера.
STARTING Остановленный ранее кластер запускается Через некоторое время кластеру будет присвоен статус RUNNING. Подождите немного и приступайте к работе.
UPDATING Выполняется обновление состояния кластера По завершении обновления ему будет присвоен статус RUNNING. Подождите немного и приступайте к работе.
ERROR Произошла ошибка, которая не позволяет кластеру продолжить работу Выполните начальную диагностику:
  • Проанализируйте графики мониторинга кластера и просмотрите операции, которые на нем выполнялись.
  • Соберите список из идентификаторов проблемных ресурсов.
Если причины ошибки не удалось выяснить самостоятельно, обратитесь в службу поддержки.
STATUS_UNKNOWN Кластер не может определить свой статус Выполните начальную диагностику:
  • Проанализируйте графики мониторинга кластера и просмотрите операции, которые на нем выполнялись.
  • Соберите список из идентификаторов проблемных ресурсов.
Если причины ошибки не удалось выяснить самостоятельно, обратитесь в службу поддержки.

Greenplum® и Greenplum Database® являются зарегистрированными товарными знаками или товарными знаками VMware, Inc в США и/или других странах.

Была ли статья полезна?

Language / Region
Проект Яндекса
© 2023 ООО «Яндекс.Облако»
В этой статье:
  • Мониторинг состояния кластера
  • Мониторинг состояния хостов
  • Интеграция с Yandex Monitoring
  • Состояние и статус кластера
  • Состояния кластера
  • Статусы кластера