Перспективы использования RAID в пользовательских и коммерческих ИС

Титов Антон Андреевич – студент МИРЭА - Российского технологического университета; младший инженер ЗАО «КРОК ИНКОРПОРЕЙТЕД».

Аннотация: Последнее время доступность и надежное хранения данных в информационных системах приобретает все большее и большее значение. Растет количество компаний (особенно представителей малого бизнеса), у которых бизнес-процессы глубоко интегрированы в информационные системы. С темпами роста объема хранимой информации растет риск потери данных, что в условиях интеграции бизнеса в ИС грозит простоями всей инфраструктуры. Возрастает необходимость защиты данных. Ключевым элементом защиты хранимой информации выступают отказоустойчивые конфигурации оборудования, и особенно дисковых подсистем, используя избыточные массивы - RAID. Они хорошо зарекомендовали себя в качестве средства защиты от потери данных и доказали свою эффективность. Компании, имеющие необходимость высокого уровня доступа информации, повсеместно используют RAID в своих ИС. Созданы международные стандарты и классификация RAID, а также многие вендоры создают проприетарные уровни массивов. В связи с ростом потока информации без использования избыточных массивов в будущем, имея собственные программно-аппаратные ИС, будет обойтись невозможно.

Ключевые слова: Контрольная сумма, RAID, ИС, бэкап, страйп, размер страйпа, IOPS.

Ввиду увеличения объема хранимой информации последние несколько лет происходит активное развитие надежности систем хранения данных. Этот процесс ведет к усложнению и совершенствованию технологий защиты данных путем создания резервных копий (бэкапов), и создания избыточных массивов независимых дисков (RAID). Использование избыточных массивов помимо ряда преимуществ имеет также и недостатки, главным из которых является рост показателя стоимости хранения гигабайта информации – $/Gb. Проблема защиты информации от ее потери актуальна для всех компаний и организаций, имеющих базы данных, реестры, файловые хранилища, репозитории и хранилища. Ранее проблему доступности информации решали в первую очередь созданием резервных копий, и в случае потери данных инициализировался процесс восстановления информации до последнего сохраненного состояния. Данный способ имел два главных недостатка: приходилось восстанавливаться до пусть и немного, но устаревшей информации, не содержащей самые актуальные записи, а также процесс восстановления имел иногда достаточно большую продолжительность, а информационные процессы приостанавливались до окончания процесса. В эпоху цифровой трансформации даже малый бизнес очень чувствителен к простою бизнес процессов из-за недоступности сервисов, в связи с чем многократно повышается необходимость в отказоустойчивой инфраструктуре хранения информации. Одним из таких средств выступают избыточные массивы. Они представляет собой массив, объединяющий несколько дисков в логический элемент для избыточности, отказоустойчивости и повышения производительности. Для отказоустойчивости, в общем случае, диски логического тома содержат помимо данных так же контрольные суммы данных, благодаря чему, в случае выхода одного или нескольких дисков и строя, потерянные данные вычисляются из контрольных сумм и восстанавливаются при замене дисков на исправные. Операции вычисления контрольных сумм выполняет центральный процессор, либо вылеленный процессор RAID контроллера.

Для классификации по надежности и производительности RAID уровней приняты международные обозначения, которых придерживаются и в России. Крупные вендоры, занимающиеся производством серверов и систем хранения данных так же придерживаются международных стандартов, к тому же создают собственные, предназначенные для определенных задач, так как в разных отраслях меняется значение производительности и отказоустойчивости. 

Основные термины и механизм работы RAID

RAID – технология виртуализации данных, которая объединяет несколько дисков в логический элемент для избыточности и повышения производительности.

Механизм работы избыточного массива подразумевает использование избыточного объема данных, который превышает фактически хранимые данные. Для этого используется зеркалирование (запись одной и той же информации на два и более физических диска), или вычисление контрольной суммы, основанной на четности или корректирующем коде. Избыточные данные равномерно распределены по пространству логического тома.

Так как данные могут иметь большой объем, то вычисление их контрольных сумм может занять достаточно продолжительное время. Такая ситуация недопустима для актуальности контрольных сумм в массиве. Для этого к вычислениям привлекается процессор. Существует две концепции построения RAID массива: программная и аппаратная. Программная подразумевает что массив создается на основе существующей аппаратной конфигурации системы, а для вычислений используется часть ресурсов центрального процессора. Данный подход хорош тем, что на корпоративной инфраструктуре (серверах и системах хранения данных) системы уже поддерживают создание массивов, затраты на приобретение контроллера не требуются. Аппаратная конфигурация массива подразумевает использование выделенного контроллера для дисков, микропроцессор которого полностью обслуживает дисковую подсистему. Данный подход более приоритетен для производительных вычислительных комплексов, где скорость работы и скорость восстановления имеет критическое значение. К тому же, при аппаратном подходе не затрагивается центральный процессор, что положительно сказывается на производительности системы.

Контрольная сумма – значение, рассчитанное по набору данных путем применения определенного алгоритма и используемое для восстановления потерянных данных. Контрольная сумма в массивах, преимущественно, представляет из себя контроль по четности или корректирующий код. Контроль по четности – операция по дополнению последовательности двоичных битов до четной последовательности.

Таблица 1. Пример контроля по четности для массива RAID.

Диск 1:

бит 1

Диск 2:

бит 1

Диск 3:

бит 1

Диск 4:

бит 1

Диск 5:

бит контроля по четности

Сумма битов

0

1

1

1

1

4 (четная)

Массивы, использующие корректирующий код для отказоустойчивости основаны на развитии идеи корректирующего кода Хемминга. Код Хемминга построен применительно к двоичной системе счисления и позволяет исправлять одиночную ошибку. Построение такого кода основано на принципе проверки на четность, однако, по сравнению с контролем по четности, занимает сравнительно много пространства на дисках.

Контроллер массива независимых дисков

RAID контроллер представляет собой физический модуль системы, который выполняет функции вычисления контрольной суммы, операции взаимодействия массива с кеш-памятью, управления дисковой подсистемой, повышения ее производительности и автоматизацией процесса восстановления сбойных дисков.

Кеш-память - это элемент RAID контроллера, используемый для промежуточной записи данных, с помощью которой ускоряется работа чтения, записи и восстановления данных массива. Ускорение работы достигается путем записи сначала в быструю кеш-память, с дальнейшей записью на более медленные физические диски. Ускорение восстановления – путем вычисления контрольных сумм в быстрой кеш-памяти, в обход избыточных операций чтения записи с дисков. Кеш-память представляет собой энергозависимый модуль памяти, в связи с чем, во избежание риска потери данных при аварийном отключении питания, оснащается батареей резервного питания, позволяющей в случае аварии переместить данные в энергонезависимую память.

Уровни RAID массивов

В связи с непрекращающимся развитием технологии избыточных массивов, существует ряд разных концепций RAID, отвечающих требованиям разных информационных систем. Условно уровни RAID делают упор либо на производительность, либо на отказоустойчивость, при том без потери обоих качеств.

RAID 0

Называемый так же «Лента». Два или более жестких дисков объединяются в один логический путем параллельной сбалансированной записи данных на оба. Таким образом, объем логического диска равен сумме объемов физических дисков, входящих в рейд группу. При этом скорость операций чтения и записи у этого массива будет вдвое больше, нежели у одного диска, так как операции чтения и записи можно вести одновременно на оба диска, что в идеальных условиях позволяет использовать максимальную скорость передачи данных каждого диска. В то время как в случае расположения данных на одном диске, физический жесткий диск будет балансировать нагрузку чтения и записи по доступной физической скорости передачи данных.

Массив уровня 0 так называется, потому что отсутствует избыточность, поэтому несмотря на очевидное преимущество в скорости передачи данных он имеет недостаток, присущий дискам вне массива – это риск потери данных в случае выхода из строя.

RAID 1

Называемый так же "Зеркало". Два или более жестких дисков объединяются в один путем параллелизации данных, то есть одни и те же данные записываются на все диски, входящие в массив. При этом скорость записи будет равна скорости записи на один физический диск, а скорость чтения может быть незначительно выше скорости физического диска за счет того, что при множестве запросов на чтение, их можно реализовать с разных дисков, используя их максимальную скорость.

Отказоустойчивость при этом весьма высока, так как в случае если из массива из 2 дисков один выйдет из строя – все данные будут доступны на другом диске.

RAID 5

Развитие идеи RAID 0. Суть уровня RAID 5 в том, что несколько дисков объединятся в RAID 0, а на последнем диске хранится контрольная сумма - служебная информация, предназначенная для восстановления одного из дисков массива, в случае выхода его из строя. Скорость записи в RAID 5 несколько ниже чем в уровнях RAID 0 и RAID 1, так как необходимо совершать операции вычисления контрольных сумм, однако скорость чтения на полностью исправном массиве достойная. Производительность массива резко падает, когда один из дисков выходит из строя, и недостающую информацию контроллер массива вычисляет из записанных ранее контрольных сумм. В случае одновременного выхода из строя более одного диска, происходит потеря данных всего массива.

RAID 6

Является развитием идей, заложенных в RAID-5. Разница в том, что контрольные суммы вычисляются дважды, что позволяет массиву сохранить работоспособность в условиях выхода из строя двух дисков, так как контрольные суммы вычисляются двумя разными алгоритмами. RAID-6 собирается минимум из четырех дисков.

Скорость операций чтения и записи RAID-6 ниже чем у RAID-5 примерно на 10-15%, что обусловлено дополнительными временными затратами на расчет и запись контрольных сумм. Особенно это ощутимо при выходе из строя двух дисков.

RAID 10

Так же иногда называется RAID 0+1 или RAID 1+0. Представляет собой массив смешанного типа, который использует преимущества RAID-0 и RAID-1. Массив строится минимум из четырех дисков: на первом канале RAID-0, на втором RAID-0 для повышения скорости чтения/записи и между собой они в зеркале RAID-1 для повышения отказоустойчивости. Таким образом, RAID-10 является быстрым и отказоустойчивым одновременно.

RAID 50

Является массивом смешанного типа из RAID-0 и RAID-5 - фактически строится RAID-5, только его составляющими элементами являются не самостоятельные жесткие диски, а массивы RAID-0. Таким образом, RAID-50 дает очень хорошую скорость чтения и записи и содержит устойчивость и надежность RAID-5.

RAID DP

Проприетарный уровень массива независимых дисков компании NetApp, массив дисков с двойной четностью. Контрольные суммы занимают пространство двух дисков. При этом скорость операций чтения и записи выше, чем на уровне 5 и 6. Отличается высокой скоростью и в то же время надежностью, выдерживающей выход из строя двух дисков. Предпочтителен для использования на массивах с быстрыми дисками небольшого объема, в том числе твердотельных накопителях. Однако имеет недостатки, главный из которых – возможность использования только на системах хранения данных NetApp, а так же эффективность использования дискового пространства, которая ниже чем у RAID 5.

RAID TEC

Отказоустойчивый массив независимых дисков с тройной четностью. Из преимуществ, обладает приемлемой скоростью операций, эффективно использует пространство в больших массивах дисков и хорошо подходит для объединения медленных и больших по объему дисков. Из недостатков, как и RAID DP, может использоваться только на системах производства NetApp.

Требования к RAID массивам

В настоящее время требования к возможностям RAID массивов основаны на использовании пространства массива.

Для операционных систем предпочтительна максимальная отказоустойчивость, и наиболее подходящими являются группы RAID 1 и RAID10, массивы чаще всего находятся во встроенном в вычислительную систему хранилище, при этом в отказоустойчивый массив возможно включить как диски, так и флеш-накопители.

В случае размещения на массиве критических данных, например базы данных или аналитических сервисов, требующих отказоустойчивость и высокую доступность, чаще используется RAID10 в случае если данным требуется доступность, близкая к 100%, и RAID5, в случае если скорость работы является основополагающим фактором организации RAID группы, при том без потери отказоустойчивости.

С развитием RAID технологий возрастают требования к наличию диска (или дисков) горячего резерва (hot spare), на который данные, с вышедшего из строя диска, восстанавливаются в автоматическом режиме. Так как зачастую вычислительные системы крупных компаний расположены в центрах обработки данных, заменить неисправный диск сразу бывает невозможно, и благодаря резервному диску значительно снижается риск потери данных.

Перспективы использования и развития RAID

Использование избыточных массивов независимых дисков в последнее время стало отраслевым стандартом повышения эффективности работы хранилищ данных. Помимо традиционного подхода защиты данных в виде резервных копий данных, компании, чьи бизнес-процессы зависят непосредственно от доступности сервисов и работоспособности вычислительных систем, повсеместно используют RAID массивы различных уровней в качестве инструмента повышения производительности и создания отказоустойчивости дискового массива.

Несмотря на то, что на первый взгляд кажется, что RAID массивы прерогатива коммерческих информационных систем, в настоящее время наблюдается тенденция к внедрению использования отказоустойчивых массивов и в сфере пользовательских ИС. Производители рабочих станций и персональных компьютеров включают функционал RAID в базовую конфигурацию систем без выделенного контроллера массива, что не приводит, что самое главное для пользовательского сегмента, к удорожанию систем. Так как требования к персональным системам невысоки, используются массивы из двух дисков RAID 1, в редких случаях трех дисков RAID 5. При этом нагрузка на центральный процессор возрастает несущественно, но появляется базовая отказоустойчивость системы, благодаря чему при выходе из строя одного из дисков пользователю достаточно обратиться в сервисный центр, и в случае отсутствия гарантии просто поменять вышедший из строя диск, без необходимости дорогостоящей услуги восстановления данных с неисправного диска, которая потребовалась бы, в случае отсутствия массива дисков.

Помимо распространения RAID массивов в пользовательский сектор информационных систем, так же высоки перспективы избыточных массивов в иных элементах информационных систем. Производители вычислительных систем предоставляют возможность использования зеркалирования (RAID 1) для оперативной памяти. Это ощутимо увеличивает время непрерывной работы вычислительных систем, и в случае выхода из строя одного из элементов оперативного запоминающего устройства, копия данных, хранящихся на нем уже имеются на элементе, который входит в избыточный массив, а элемент вышедший из строя просто выводится из работы. При этом работоспособность вычислительной системы сохраняется, а неисправный элемент может быть заменен в подходящее для остановки вычислительной системы время.

Глобальный рост цифровой интеграции демонстрирует, что избыточные массивы независимых дисков – необходимость. Рост количества информационных систем из года в год диктует все более и более высокие требования к надежности, скорости и доступности данных.

Список литературы

  1. RAID technology NetApp. RAID DP [Электронный ресурс]. – URL: https://www.netapp.com/us/products/platform-os/raid-dp.aspx (дата обращения09.2019).
  2. RAID – теоретические сведения [Электронный ресурс]. – URL: https://www.nix.ru/computer_hardware_news/hardware_news_viewer.html?id=187685 (дата обращения 22.09.2019).
  3. Краткий обзор технологии RAID [Электронный ресурс]. – URL: https://parallel.ru/computers/reviews/raid-technology.html (дата обращения 23.09.2019).
  4. Уровни RAID [Электронный ресурс]. – URL: https://dic.academic.ru/dic.nsf/ruwiki/86359 (дата обращения 27.09.2019).