Однонаправленная репликация между двумя базами (постановка)
SYSDBA (обсуждение | вклад) (→Структура сообщения) |
SYSDBA (обсуждение | вклад) (→Структура сообщения) |
||
| Строка 186: | Строка 186: | ||
** '''"Подтверждение передачи объекта"''' | ** '''"Подтверждение передачи объекта"''' | ||
*** ??? | *** ??? | ||
| + | |||
| + | == Особенности физической реализации == | ||
| + | |||
| + | === Очередность сохранения объектов и формирование потока === | ||
| + | |||
| + | |||
[[Category:Постановка]] | [[Category:Постановка]] | ||
Версия 13:05, 24 августа 2009
Рассмотрим вариант однонаправленной репликации между двумя базами A и B. Все изменения осуществляются на базе A. База B работает в режиме только для чтения. В дальнейшем, мы будем использовать термины "Удаленная база данных (УБД)" для базы А и "Центральная база данных (ЦБД)" для B.
Базы обмениваются между собой сообщениями. Канал связи между базами может быть непостоянным. Т.е. база A может посылать сообщения в тот момент, когда база B недоступна и наоборот. Порядок выполнения действий над объектами на базе A должен сохраняться при переносе на базу B. Транспорт передачи сообщений не гарантирует нам ни сохранности и целости конкретного сообщения, ни сохранения порядка при передаче нескольких сообщений.
Состояния объекта в УБД
Каждый объект в УБД находится в определенном состоянии. В таблице ниже перечислены возможные состояния, а также определены допустимые переходы из одного состояния в другое.
| Состояние | Описание | Блокировка | Переход |
|---|---|---|---|
| I | Каждый объект, который существовал до настройки схемы репликации (т.е. до создания УБД на основе изначально существовавшей ЦБД), имеет состояние I. В начальный момент времени такой объект присутствует как в УБД, так и в ЦБД. | Нет | L |
| L | Изменение объекта занесено в лог. Используется для информирования системы о необходимости отсылки сообщения "Передача объекта" на ЦБД. | Объект в состоянии L может быть изменен только в том случае, если после него в логе нет никаких других записей. Последовательные изменения (в смысле порядка записей в логе) одного и того же объекта допускаются. | S, B |
| B | Используется для остановки процесса передачи данных на ЦБД. При обработке объекта в состоянии B, процесс формирования сообщений останавливается с уведомлением пользователя о том, какая именно запись вызвала остановку. | Аналогично состоянию L. | L |
| S | Объект был отослан на ЦБД. | Аналогично состоянию L. | C |
| C | Изменение объекта успешно записано в ЦБД. | Нет | L |
Состояния объекта в ЦБД
Поскольку данные передаются только в одном направлении, для объектов в ЦБД мы выделяем только три состояния.
| Состояние | Описание | Переход |
|---|---|---|
| I | Объект существовал до настройки схемы репликации. | R |
| R | Объект получен и записан в базу данных. | |
| F | Объект получен, но не может быть записан в базу данных. Необходимо срочное вмешательство системного администратора для ручного разрешения конфликта данных. | R |
Лог изменений
Фиксирование изменений состояния объекта осуществляется в логе, который заполняется триггерами и содержит:
- целочисленный порядковый номер изменения (начиная с единицы),
- идентификатор объекта,
- тип объекта,
- вид операции (создание, изменение, удаление),
- состояние объекта,
- дата и время изменения состояния.
В дальнейшем, символом N мы будем обозначать номер изменения, а символом М -- максимальный номер изменения в логе. М принимается равным нулю, если лог пуст.
Состояние базы данных
Мы будем называть целое число S состоянием базы данных. Если S = М, значит все изменения переданы на ЦБД. Если S < M, -- необходимо осуществить передачу. Ситуация, когда S > M означает серьезный сбой в данных репликации, нарушение логической целостности.
В начальный момент времени:
S = M = 0
Базы данных А и B находятся в идентичном состоянии, если Ma = Sb.
Состояние УБД увеличивается на единицу каждый раз, когда подтверждается передача очередного объекта. Sa равно максимальному номеру записи в логе в состоянии C.
Состояние ЦБД увеличивается на единицу каждый раз, когда успешно принимается и записывается в базу очередной объект. Sb равно максимальному номеру записи в логе в состоянии R.
В начальный момент времени базы данных находятся в идентичном состоянии и выполняется равенство:
Sa = Sb = Мa = Мb = 0
Связь в асинхронном режиме
В том случае, если при обмене данными между УБД и ЦБД нет постоянного канала связи, мы будем использовать следующие параметры:
Tr -- Допустимое время ожидания ответа на посланное сообщение. Ts -- Время простоя ЦБД с момента обработки последнего сообщения до отсылки запроса о состоянии УБД. Ti -- Период с которым УБД осуществляет проверку очереди сообщений и отсылку изменений на ЦБД.
Критерий идентичности УБД и ЦБД в асинхронном режиме
УБД знает о том, что она идентична ЦБД, если Sa=Ma. Т.е. нет объектов в состоянии L, B или S.
ЦБД знает о том, что она идентичная УБД, если получен ответ на сообщение "Запрос состояния УБД" из которого следует что Ma=Sb.
Запрос состояния УБД
Когда база B хочет узнать текущее состояние синхронизации с базой А, она посылает специальное сообщение "Запрос состояния УБД" и фиксирует время его отправки. Получив данное сообщение, база А действует в соответствии со своим логом. Если он содержит записи, подлежащие отправке, то формируются и посылаются соответствующие сообщения. Непосредственного ответа на "Запрос состояния УБД" в этом случае не отсылается. Если лог не содержит записей для отправки, то формируется специальное сообщение "Состояние УБД", которым передается число Sa. После отсылки запроса База B периодически проверяет свою очередь сообщений. Если в течение заданного тайм-аута в очередь не поступило ни одного ответа от базы А, то системный администратор оповещается о возможном нарушении канала связи или неполадках на УБД. Если поступил ответ "Состояние УБД", то Sa сверяется с Sb. При их равенстве базы данных считаются идентичными (синхронизированными). Если Sa > Sb, то база B отсылает сообщение "Запрос на передачу объекта" с указанием номера Sb + 1. Состояние, когда Sa < Sb, свидетельствует о серьезной рассинхронизации двух баз данных и требует немедленного информирования системного администратора.
"Запрос состояния УБД" отсылается автоматически по истечении заданного интервала времени с момента обработки последнего сообщения от УБД или с момента отправки предыдущего запроса на состояние, на который не поступило ответа.
Журнал репликации
Журнал используется системным администратором для выявления проблем и/или профилирования репликации. В журнал заносятся:
- Информативные сообщения
- Предупреждения
- Критические ошибки
Последовательность обмена сообщениями
Последовательность обмена сообщениями между исходной и конечной базами данных выглядит следующим образом:
База А
Проверяется очередь сообщений:
- Очередь сообщений пуста:
- Для объектов в состоянии S, с момента отправки которых прошло времени больше чем Tr, на ЦБД отсылаем сообщение "Запрос подтверждения передачи объекта" с указанием идентификаторов объектов. Одновременно в журнале отражаем факт превышения времени ожидания ответа на сообщение "Передача объекта".
- Для каждого объекта в состоянии L формируется и посылается отдельное сообщение "Передача объекта". После формирования и успешной отправки сообщения, запись в логе переводится в состояние S.
- Если в очереди присутствуют только сообщения типа "Запрос состояния УБД", отвечаем сообщением "Состояние УБД" и очищаем очередь.
- Если в очереди присутствуют сообщения, сортируем их по порядковому номеру. В процессе сортировки удаляем сообщения типа "Запрос состояния УБД". Обрабатываем последовательно:
- "Подтверждение передачи объекта":
- Если номер изменения из сообщения соответствует номеру первого объекта со статусом S (в порядке очередности записей в логе), то переводим объект в состояние C. Удаляем сообщение из очереди и продолжаем обрабатывать список.
- Если номер из сообщения меньше номера первого объекта со статусом S, то игнорируем такое сообщение. Удаляем сообщение из очереди и продолжаем обрабатывать список. Заносим в журнал информацию о получении лишнего подтверждения.
- Если номер из сообщения больше номера первого объекта со статусом S:
- Еще не истек допустимый интервал времени с момента отправки первого объекта в состоянии S. Сообщение из очереди не удаляем. Продолжаем обрабатывать список, пропуская все последующие сообщения типа "Подтверждение передачи объекта".
- Истекло время, отпущенное ЦБД на ответ. Отсылаем на сервер сообщение "Запрос подтверждения передачи объекта" с указанием идентификаторов всех объектов, для которых с момента отправки прошло времени больше чем Tr. Сообщение из очереди не удаляем. Продолжаем обрабатывать список, пропуская все сообщения типа "Подтверждение передачи объекта". Помещаем информацию о недошедшем подтверждении в журнал.
- "Запрос на передачу объекта":
- Если запрашиваемый объект находится в состоянии S, то передаем его на ЦБД. Удаляем сообщение из очереди и продолжаем обрабатывать список. Помещаем в журнал информацию о повторной передаче объекта.
- Если запрашиваемый объкт находится в состоянии L или C, или вообще отсутствует в списке, то игнорируем сообщение и удаляем его из очереди, а в журнал помещаем запись с информацией о запросе на передачу ранее переданного и подтвержденного объекта.
- "Подтверждение передачи объекта":
База B
Если в логе ЦБД присутствует запись в состоянии F, т.е. была ошибка при загрузке объекта, то репликация останавливается. Обработка очереди сообщений не производится.
Проверяется наличие сообщений в очереди.
- Очередь пуста:
- Ранее было отправлено сообщение "Запрос состояния УБД":
- Если интервал времени на ответ не истек, то продолжаем ожидать.
- Интервал времени истек. Информируем системного администратора. Повторяем "Запрос состояния УБД".
- Если истек интервал проверки связи и состояния УБД, то отсылаем "Запрос состояния УБД".
- Ранее было отправлено сообщение "Запрос состояния УБД":
- Очередь содержит только сообщения типа "Состояние УБД". Берем последнее из них в хронологическом порядке:
- Если Ma = Sb, базы в идентичном состоянии. Очищаем очередь сообщений.
- Если Ma > Sb, есть объекты к передаче с УБД на ЦБД. Отсылаем запрос на передачу объекта. Очищаем очередь сообщений.
- Если Ma < Sb, серьезный сбой. Информируем системного администратора.
- Очередь не пуста.
- Сортируем сообщения в порядке номеров изменений. Выкидываем все сообщения "Состояние УБД". Обрабатываем в порядке очередности.
- Если номер изменения первого сообщения в очереди равен Sb + 1, то загружаем объект. Удаляем текущее сообщение и продолжаем обрабатывать очередь.
- Если номер изменения первого сообщения в очереди меньше Sb + 1, то игнорируем такое сообщение. Удаляем его и продолжаем обрабатывать очередь. В журнал помещаем запись о несанкционированной повторной передаче уже принятого объекта.
- Если номер изменения первого сообщения в очереди больше Sb + 1, то прекращаем обработку очереди. Текущее сообщение не удаляем. На УБД отсылаем сообщение "Запрос на передачу объекта", где указываем диапазон изменений, которые нас интересуют: с Sb до номера изменения первого сообщения в очереди, не включая границы.
- По окончании обработки очереди (успешном или не успешном), отсылаем на УБД сообщение "Подтверждение передачи объектов" с указанием номеров изменений, успешно записаных в ЦБД.
- При возникновении конфликта записи объекта в ЦБД останавливаем обработку очереди. В лог ЦБД заносим пометку номера изменения и ставим ему статус F. Информируем системного администратор о серьезном сбое репликации.
- Сортируем сообщения в порядке номеров изменений. Выкидываем все сообщения "Состояние УБД". Обрабатываем в порядке очередности.
Структура сообщения
Каждое сообщение содержит постоянную часть (заголовок) и данные, которые зависят от типа сообщения:
- Заголовок
- Тип сообщения
- Дата и время отправки
- Отправитель
- Получатель
- Номер изменения
- Контрольная сумма
- Данные, в зависимости от типа сообщения. Для сообщений некоторых типов данные могут отсутствовать:
- "Передача объекта"
- Поток данных объекта.
- "Запрос подтверждения передачи объекта"
- ???
- "Состояние УБД"
- ???
- "Запрос состояния УБД"
- Нет данных.
- "Подтверждение передачи объекта"
- ???
- "Передача объекта"