УДК 004

Особенности организации безопасности данных в облачных вычислениях

Иванов Артем Александрович – студент Санкт-Петербургского государственного университета аэрокосмического приборостроения

Аннотация: Данная статья затронет одну из самых важных проблем облачных вычислений, а в частности, организации безопасности. Будут рассмотрены самые последние исследования в этом направлении, которые сделали некоторые заключения. Есть выводы, что невозможно корректно управлять разделением доступности, устойчивости и согласованности. Но есть некоторые решения, которые позволяют формировать необходимую модель доступа к данным в распределенной системе хранения.

Ключевые слова: облачное хранилище, информационная безопасность, базы данных.

Стоит окунуться немного в историю происхождения такого термина, как «облачные технологии». В 1997 году, известный профессор Ramnath K. Chellappa, дал определение, которое используется и по сей день. «Облачные вычисления – это парадигма, при которой границы вычислений будут определяться не техническими ограничениями, а экономическими». «Облачные вычисления» стали уже больше, чем просто новая технология, способная нарушать технические ограничения вычислений. Сейчас ее рассматривают, как одну из бизнес-моделей, которая может сгруппировать смежные между собой технологии и сделать единый продукт.

“Национальный институт стандартов и технологий” (NIST) дал более наглядные характеристики облачных вычислений. Они описывают следующее: способность самообслуживания по различным требованиям, более “просторный” доступ к сети, возможность объединять различные ресурсы, довольно сильная автономность.

Для поддержки новой технологии требуются новые решения. Новую модель вычислений сложно будет поддерживать “устоявшимися” методами. Для новых приложений и ПО в “облаке” можно рассмотреть теорему Брюера (САР). Тем самым создадим баланс между важными критериями: доступностью в распределенных системах, согласованностью. Также можно объединить полученные реализации в популярные базы данных.

САР. Теорема Брюера

Эрик Брюер выступил с интересной гипотезой. В 2000 году он сделал заявление по ключевым свойствам распределенных систем, которое доказали в MIT. После этих событий появилась теорема САР (Consistency-Availability-Partition tolerance). Теорема говорит о том, что в распределенной системе невозможно одновременно обеспечить согласованность, доступность и устойчивость к разделению. Для обеспечения согласованности все копии данных в системе должны согласованно поддерживаться внешними пользователями. Система должна иметь свойство выдерживать большие неполадки узла (оборудование претерпело сбой), а также отвечать на поступающие запросы. Суть устойчивости заключается в том, что при разделении система должна продолжать обрабатывать данные при различных сбоях. Данная система может быть реализованы следующим образом: в секционных сетях могут храниться копии, и они не поддерживают синхронизацию, что отрицает два основных условия, доступность и согласованность. При этом все равно можно достичь любых двух условий из трех.

Доказанная теорема САР стала основой для построения баз данных NoSQL. Для примера, будут рассмотрены самые популярные базы данных: Google BigTable, Amazon Dynamo и Apache Cassandra. Данные реализации использую теорему Брюера.

Устойчивость и доступность

DynamoDB одна из самых популярных систем управления базами данных, работает с классами «ключ – значение», что обеспечивает отличную надежность и легко поддерживает масштабируемость на Amazon.com. Для того чтобы масштабировать систему и доступность, DynamoDB реализует последовательное хеширование, что позволяет организовать гибкое индексирование данных и управление версиями объектов. Dynamo легко поддерживает синхронизацию, клиент имеет возможность получать доступ к этим данным. «Последняя запись выигрывает» – является политикой разрешения конфликтов, она была выбрана из-за личного предпочтения и имеющего опыта. Механизм децентрализации DynamoDB старается адаптировать кольцевую структурированную одноранговую систему, каждый узел имеет набор правил. Одна из самых популярных архитектур P2P рассматриваемая система позволяет принимать отказы для реализации более высокой доступности и дает возможность владельцам легко масштабировать систему в различных направлениях.

Устойчивость и согласованность

Следующая база данных, построенная на основе Google File System (GFS), Chubby Lock Service и некоторых других продуктах Google – Bigtable. Динамическая компоновка данных (от URL-адресов до веб-страниц и спутниковых изображений) и эффективная задержка доступа данных СУБД была реализована в различных приложения Google (например, Google Reader, Google Maps, Google Book Search, YouTube). Основная суть модели Bigtable заключается в следующем: строки, столбцы, временные метки. Адреса документов могут служить именами строк в базе поисковой системы в Интернете, а именами столбцов являются особенностью эти документов. Также Bigtable хорошо интегрируется с MapReduce (платформой для запуска параллельных вычислений, разработана компанией Google, чтобы расширить возможности базы данных пользователей).

Устойчивость, доступность и согласованность

Напоследок рассмотрим распределенную систему управления базами данных под названием Apache Cassandra. Она разрабатывалась для формирования высокомасштабируемых хранилищ массивов данных, которые представляются в виде хэша. Разработка является гибридом от DynamoDB и основная модель хранения организуется на базе семейства столбцов – ColumnFamily (Google BigTable). Cassandra может иметь режим «Доступности + Устойчивость к разделению» или «Согласованность + Устойчивость к разделению». Пользователи имеют возможность выбрать уровень согласованности (все, кворум, один, ноль) для каждой операции чтения или записи. Нулевой уровень согласованности позволяет обеспечить наименьшую задержку, операции выполняются в синхронном режиме. Следствием является, что гарантии согласованности данных нет. Уровень один гарантирует, что передача будет записана в журнал фиксации (хотя бы на одном сервере). Два кворума требуют хотя бы одну реплику, связанную на сервере. Уровень согласованности «все» организует полный режим согласованности в системе Cassandra.

Заключение

В данной статье были затронуты вопросы надежности и безопасности облачных вычислений. Технология с каждым годом получает все больше развития. Но по сей день существуют ограничения в распределенных системах хранения, которые были рассмотрены и доказаны Эриком Брюером в своей теореме САР. Доказано, что невозможно одновременно реализовать согласованность, доступность и допуск секционирования. Но ответом на эту проблему являются гибридные модели, которые может выбрать пользователь, чтобы использовать для распределенной системы хранения.

Список литературы

  1. Маркина И.А. Безопасность облачных технологий. // Безопасность бизнеса. – 2015. – №2. – С. 22-25.
  2. Рудаков А.О., Журба С.В. Информационная безопасность в облачных вычислениях: современное состояние и перспективы. // Молодежь и наука: сб. тезисов Междунар. науч. конф. – М.: МЦНМО, 2016. – С. 315-316.
  3. Шаров А.Н., Жарикова Е.В. Оценка уровня защищенности информационных ресурсов при использовании облачных технологий. // Новые информационные технологии. – 2014. – Т. 6. – №3. – С. 129-133.
  4. Almorsy M., Grundy J., Ibrahim A.S. "Increasing Security and Privacy in Cloud Computing through Interface Monitoring." Proceedings of the 2011 6th International Conference on Availability, Reliability and Security, 2011, p. 46-51.
  5. Rong C., Nguyen S., Jaatun M.G. "Beyond lightning: A survey on security challenges in cloud computing." Computers & Electrical Engineering, vol. 39, no. 1, 2013, p. 47-54.
  6. Subashini S., Kavitha V. "A survey on security issues in service delivery models of cloud computing." Journal of Network and Computer Applications, vol. 34, no. 1, 2011, p. 1-11.

Интересная статья? Поделись ей с другими: