Вопросы о ClickHouse
Почему стоит использовать ClickHouse в Managed Service for ClickHouse, а не собственную установку на виртуальной машине?
Managed Service for ClickHouse автоматизирует рутинное обслуживание БД:
-
быстрое развертывание БД с необходимыми доступными ресурсами;
-
резервное копирование данных;
-
регулярное обновление ПО;
-
обеспечение отказоустойчивости кластеров БД;
-
мониторинг и статистика использования БД.
Когда стоит использовать ClickHouse вместо PostgreSQL?
ClickHouse поддерживает только добавление и чтение данных, так как предназначен прежде всего для аналитики (OLAP). В остальных случаях, скорее всего, удобнее использовать PostgreSQL.
Как загружать данные в ClickHouse?
Используйте запрос INSERT
, описанный в документации ClickHouse.
Как загрузить в ClickHouse очень большое количество данных?
Используйте CLI для эффективного сжатия данных при передаче (рекомендуемая частота — не больше 1 команды INSERT
в секунду).
Перенос данных с физических носителей пока не поддерживается.
Что случится с кластером, если выйдет из строя одна из нод?
Кластеры БД состоят минимум из 2 реплик, поэтому при потере одной ноды кластер продолжит работу.
Данные могут потеряться только если вышла из строя нода с нереплицируемой таблицей.
Можно ли развернуть кластер БД ClickHouse в нескольких зонах доступности?
Да. Кластер БД может состоять из хостов, расположенных как в разных зонах, так и в разных регионах доступности.
Как устроена репликация для ClickHouse?
Кластеры Managed Service for ClickHouse используют репликацию с помощью ClickHouse Keeper или ZooKeeper. В первом случае никаких дополнительных настроек не требуется — репликация и отказоустойчивость включены по умолчанию. Во втором для каждого кластера ClickHouse создается кластер ZooKeeper минимум из трех хостов.
Для пользователей Yandex Cloud доступ к ZooKeeper и его настройка недоступны.
Почему кластер ClickHouse занимает на 3 хоста больше, чем должен?
При создании кластера ClickHouse из 2 и более хостов Managed Service for ClickHouse автоматически создает кластер из 3 хостов ZooKeeper для управления репликацией и отказоустойчивостью, если не включена поддержка ClickHouse Keeper. Эти хосты учитываются в расчете использованной квоты ресурсов в облаке и в расчете стоимости кластера. По умолчанию хосты ZooKeeper создаются с минимальным классом хостов.
Подробнее об использовании ZooKeeper см. документацию ClickHouse.