УДК 004.453.2

Характерные проблемы репликаций в распределенных базах данных

Котиков Павел Евгеньевич – кандидат технических наук, доцент кафедры Медицинской информатики Санкт-Петербургского государственного педиатрического медицинского университета.

Тихомирова Александра Александровна – кандидат экономических наук, заведующая кафедрой Медицинской информатики Санкт-Петербургского государственного педиатрического медицинского университета.

Аннотация: Статья рассматривает проблемы развития технологий распределенных баз данных. Основное внимание уделено проблемам репликаций. Показаны некоторые возможности их решения.

Ключевые слова: распределенные базы данных, гетерогенные данные, репликации, транзакции, непротиворечивость данных.

Введение

В настоящее время, вполне очевидна перспективность развития технологии распределенных баз данных (РБД). Это убедительно показано в ряде работ [1], [3], [8]. В медицинских информационных системах новые технологии работы с данными представлены широко и масштабно [2]. В гетерогенных (неоднородных) РБД, при реализации взаимодействия, возникает множество технологических проблем [2], [3]. Значительная часть их связана с репликациями.

Репликации в базах данных не только обеспечивают процесс автоматического копирования и передачи данных в базах, но и обеспечивает высокую доступность данных.

Резервные копии на других серверах гарантируют доступность данных при сбоях основного сервера. При взаимодействии обеспечивается работа с репликацией баз данных без простоев и каких либо потерь. Другой эффект репликаций, – улучшение производительности системы благодаря перераспределению нагрузки между серверами.

Правильно и эффективно построенная репликация дает возможность облегчить масштабирование путем последующего дополнения и добавления иных серверов и распределения данных по репликам. В целом создаются благоприятные возможности горизонтального масштабирования при росте объемов данных и росте числа пользователей.

Недостатки организации работы систем управления базами данных (СУБД) и репликационные проблемы могут существенно сдерживать развитие технологий управления научными данными [8]. Недостатки, как правило, переносятся и в область защиты информации специализированных систем [9].

Сами проблемы репликаций обычно рассматривают ограниченно. Их анализируют как проблемы выбора типа репликации (транзакционная, снимками, смешанная), как проблемы определения роли серверов (сервер-мастер, серверы-реплики) или как проблемы механизмов синхронизации (логическое или физическое реплицирование). Нередко рассматриваются только собственно проблемы топологии (мастер-мастер, мастер-реплика, каскадная репликация).

Важнейшие проблемы сейчас сосредоточены в настройке механизма обработки и разрешения конфликтов. Определить сам механизм разрешения конфликтов необходимо для исключения повреждения данных, обеспечения их согласованности и непротиворечивости.

Проблемы репликаций в РБД

Остановимся на результатах анализа. В статье [5] показан ряд репликационных архитектур в условиях секторного размещения информации и все преимущества распространения многочисленных копий по подписке серверами. В этом решении реализуется подписка по запросу. Агенты рассылки находятся на серверах подписки. При принудительной подписке они находятся на сервере рассылки. Все реализуется пятью агентами.

Такой подход выполним эффективно в РБД геоинформационных систем (ГИС). В базах данных ГИС, чтобы во всех местах данные обновлялись одновременно целесообразно использовать именно механизм распределенных транзакций. Исключается двойное закрепление данных. Вместе с тем, такое решение не во всех иных случаях может быть рациональным и эффективным.

В последующей работе [4], рассмотрена подробно реализация компонента DIRECTUM Over Doc в системе «Галактика ERP» с использованием механизма IS-Bulder.

Показано, что преимущества репликаций очевидны, однако этот процесс может сопровождаться рядом проблем. Все локальные БД в РБД постоянно обновляются. В них поступают новые данные. Старые данные могут при этом меняться или исключаться. Это приводит к тому, что через определенный период времени копия базы становится неактуальной. Ее использование может привести к ошибочным результатам запросов.

Выход может состоять в том, чтобы одновременно с локальной базой данных обновлять и все копии этой базы данных или всех ее фрагментов. В таком случае приме-няются синхронные и асинхронные репликации.

Наилучшей с точки зрения актуальности копий является определенно синхронная репликация. При этом все обновления (исходной базы и копий) произвоятся как часть одной транзакции обновления. Это значит практически одновременно. Обновление исходной базы не считается завершенным, пока не произведены изменения во всех копиях [4], [7].

Все случаи, рассмотренные в работах [4], [5], приводят к итоговому выводу о том, что система оказывается успешной в репликациях, главным образом, в результате реализации строгой договоренности о порядке взаимодействия серверов. В этом убеждает и, так называемая, «Концепция баз данных ORACLE», где администратору БД прямо указано на необходимость координации управления транзакциями в РБД по сети и поддержки согласования данных, даже если происходит сетевой или системный сбой.

Другой основой успешного решения репликационных проблем в РБД может стать протокол двухфазного подтверждения транзакций [7]. Он имеет исключительное ключевое значение для предупреждения опасной противоречивости данных, нередко возникающей при их распределенном (сегментированном или секторном) хранении [6]. 

Залогом обеспечения корректного завершения всеми взаимодействующими узлами хранения данных выполнения своих частей транзакции является именно строгое следование протиколу двухфазного подтверждения (закрепления) транзакций при параллельном выполнении в распределенной среде [6], [7].

Некоторые выводы

  1. Репликационные проблемы, возникающие в современных информационных системах неизбежны, как проблемы роста и развития.
  2. Наиболее характерно они проявляются в распределенных базах данных и системах распределенного управления ими.
  3. В гетерогенных (неоднородных) РБД проблемы приобретают определенное своеобразие и могут усугубляться.
  4. По мнению авторов одними из наиболее эффективных средств разрешения указанных проблем могли бы стать:
  • применение протокола двухфазного закрепления в транзактном методе;
  • создание системы строгих правил во всех случаях.

Список литературы

  1. Комков Д.К. Особенности, сферы применения и направления развития распределенных баз данных // Решетневские чтения. 2017. №21-2.
  2. Белышев Д.В., Гулиев Я.И., Михеев А.Е. Развитие медицинских информационных системна современном этапе - как объединить многолетний опыт и новые технологии? // Врач и информационные технологии. 2017. №4.
  3. Горобец Валерий Владимирович Модель архитектуры транзакционных систем с репликацией фрагментов базы данных для развертывания в рамках облачной среды // Известия вузов. Северо-Кавказский регион. Серия: Технические науки. 2013. №2 (171).
  4. Калиниченко С.В., Котиков П.Е., Нечай А.А. Решение репликационных проблем в базах данных для повышения устойчивости программного обеспечения автоматизированных систем // Вестник Российского нового университета. Серия «Сложные системы: модели, анализ и управление». 2017. Вып. 4. С. 18-21.
  5. Котиков П.Е., Нечай А.А. Репликация данных между серверами баз данных в среде геоинформационных систем / П.Е. Котиков, А.А. Нечай // Вестник Российского нового университета. Сер. Сложные системы: модели, анализ и управление. 2015. № 1. С. 88-91. 
  6. Котиков П.Е., Нечай А.А. Решение проблемы управления параллельным выполнением транзакций в распределенных базах данных для устранения опасной противоречивости / П.Е. Котиков, А.А. Нечай // Вестник Российского нового университета. Сер. Сложные системы: модели, анализ и управление. 2015. № 2. С. 62-64
  7. Калиниченко С.В., Котиков П.Е., Свинарчук А.А. Применение протокола двухфазного подтверждения транзакций в распределенных базах данных / С.В. Калиниченко, П.Е. Котиков, А.А. Свинарчук // Вестник Российского нового университета. Серия: Сложные системы: модели, анализ и управление. 2017. № 3. С. 38-40.
  8. Котиков П.Е. Базы данных и управление научными данными // Научный аспект.- 2015. Том 2 - № 1.- С. 204-206.
  9. Котиков П.Е., Тихомирова А.А. Некоторые аспекты безопасности медицинских данных в системах их хранения/ П.Е. Котиков, А.А. Тихомирова // Педиатр.- 2017.Т8.№51.С. М165.

Интересная статья? Поделись ей с другими: