Декомиссия подкластеров и хостов
Декомиссия — процедура уменьшения мощности кластера (числа хостов и их класса) без его остановки и прерывания рабочей нагрузки. Декомиссия поддерживается для кластеров Data Proc версии 1.2 и выше.
В Data Proc декомиссия реализована на основе YARN и HDFS. При выполнении декомиссии уже запущенные пользовательские задания не будут прерваны, а данные на HDFS не будут потеряны.
Для декомиссии подкластеров в кластере YARN вы можете задать таймаут ожидания. В этом случае кластер будет ждать завершения текущих операций, но не более указанного времени. Выводимые из состава хосты не будут брать новые операции и данные.
Декомиссия ресурсов под YARN применяется при:
- изменении класса хостов;
- увеличении размера диска;
- уменьшении числа хостов в подкластерах для обработки данных.
Декомиссия ресурсов под HDFS применяется при:
- уменьшении числа хостов в подкластерах для хранения данных;
- удалении подкластеров для хранения данных.
В случае, если изменение кластера требует перезагрузку хостов, сервис действует по следующему сценарию:
- Редактируемые или удаляемые хосты добавляются в список
excluded
в YARN. - На хостах из списка
excluded
не запускаются новые задания. По мере того, как запущенные задания завершаются, хосты обновляются и перезагружаются. - Если задания не успевают завершиться до окончания таймаута декомиссии, они завершаются принудительно и хост обновляется и перезагружается.
- После перезагрузки хосты удаляются из списка
excluded
. - Сервис ждет, пока все хосты перейдут в статус
Alive
.
Время операции декомиссии складывается из таймаута на декомиссию и времени операций по модификации кластера. Максимальное время таймаута декомиссии - 24 часа. Максимальное время операций над кластером - 1 час.
Более подробно о декомиссиии кластеров YARN можно ознакомиться на странице Graceful Decommission of YARN Nodes в документации для Apache Hadoop.