Перейти к основному содержимому
Перейти к основному содержимому

Повторная синхронизация ClickPipe для базы данных

Что делает повторная синхронизация?

повторная синхронизация включает следующие операции в таком порядке:

  1. Существующий ClickPipe удаляется, и запускается новый ClickPipe для повторной синхронизации. Поэтому при повторной синхронизации будут учтены изменения в структуре таблиц источника.
  2. ClickPipe для повторной синхронизации создает (или заменяет) новый набор целевых таблиц с теми же именами, что и у исходных таблиц, но с суффиксом _resync.
  3. Для таблиц _resync выполняется первоначальная загрузка.
  4. Затем таблицы _resync меняются местами с исходными таблицами. Перед заменой строки, помеченные как удаленные, переносятся из исходных таблиц в таблицы _resync.

Все настройки исходного ClickPipe сохраняются в ClickPipe для повторной синхронизации. Статистика исходного ClickPipe очищается в UI.

Сценарии использования повторной синхронизации ClickPipe

Вот несколько сценариев:

  1. Вам может потребоваться внести существенные изменения в схему исходных таблиц, из-за которых существующий ClickPipe перестанет работать и его придется перезапустить. После внесения изменений можно просто нажать Resync.
  2. В частности, в ClickHouse может потребоваться изменить ключи ORDER BY в целевых таблицах. В этом случае можно выполнить Resync, чтобы повторно загрузить данные в новую таблицу с правильным ключом сортировки.

Руководство по повторной синхронизации ClickPipe

  1. На вкладке Data Sources нажмите на MongoDB ClickPipe, который нужно повторно синхронизировать.
  2. Перейдите на вкладку Settings.
  3. Нажмите кнопку Resync.
  1. Появится диалоговое окно подтверждения. Ещё раз нажмите Resync.
  2. Перейдите на вкладку Metrics.
  3. Дождитесь, пока статус пайплайна не станет Setup или Snapshot.
  4. Первоначальную загрузку при повторной синхронизации можно мониторить на вкладке Tables — в разделе Initial Load Stats.
  5. После завершения первоначальной загрузки пайплайн атомарно поменяет местами таблицы _resync и исходные таблицы. Во время этой операции статус будет Resync.
  6. После завершения замены пайплайн перейдёт в состояние Running и будет выполнять CDC, если параметр включён.