Конфигурации хранения данных: DAS, SAN, NAS

Tags: хранилище данных, data center

Современные IT-команды используют различные технологии для реализации процесса хранения.  Это касается не только HDD и SSD дисков, но также технологий облачного хранения, программно-определяемого хранения и даже конвергентных, гиперконвергентных или комбинированных инфраструктур.

Несмотря на различные варианты, многие дата-центры продолжают опираться на три традиционные конфигурации: непосредственно подключаемая система хранения данных (DAS), сетевое хранилище (NAS) и сеть хранения данных (SAN).  У каждого подхода есть как преимущества, так и недостатки, но всегда понятны ситуации применения каждой.

Непосредственно подключаемая система хранения данных (DAS)

Как видно из названия, DAS - это конфигурация хранения, при которой HDD и SSD диски подключаются напрямую к компьютеру, а не через сеть.  Обычно DAS относится к HDD и SSD дискам.  Другие типы хранения, такие как ленточный накопитель или оптический диск, теоретически могут относиться к DAS, если они напрямую подключаются к компьютеру.

DAS может подключаться к компьютеру как внутри, так и снаружи. Внешний DAS может быть одним диском или частью массива или конфигурацией RAID.  Неважно внутреннее или внешнее подключение, устройство DAS относится и управляется главным компьютером.

Диск DAS используется таким образом, чтобы другие системы могли получать к нему доступ сети. Но даже в таком случае, компьютер, подключенный к диску, по-прежнему им управляет.  Другие системы не могут быть подключены напрямую к диску, но должны взаимодействовать с главным компьютером для получения доступа к хранимым данным.

DAS подключается к компьютеру через такие интерфейсы, как SAS, SATA, SCSI, PCIe. Наряду с другими технологиями, интерфейс может оказывать значительное влияние на производительность диска, что является важным фактором при выборе DAS диска.

Некоторые IT команды используют DAS из-за лучшей производительности, в отличие от сетевых хранилищ NAS и SAN.  При использовании DAS главному компьютеру не нужно бороться с потенциально узкими местами сети, такими как медленная скорость сети или перегрузка сети, а данные находятся в непосредственной близости к серверу. Другие системы, которые подключены к главному компьютеру могут столкнуться с проблемами сети, но сам главный компьютер имеет беспрепятственный доступ к данным, размещенным на DAS.

Также DAS дешевле и проще для внедрения и администрирования, чем сетевые системы: часто внедряется через простой режим работы plug-and-play с небольшими административными расходами.  Так как хранилище DAS обладает минимальным набором компонентов, его стоимость обычно ниже, чем сетевых альтернатив.

Но у DAS есть свои недостатки.  Из-за того, что сервер может поддерживать определенное количество слотов расширения или внешних портов, у DAS ограниченная масштабируемость.  Кроме того, ограничения вычислительных ресурсов сервера могут также оказывать влияние на производительность при совместном использовании диска.  В DAS нет расширенных функций управления и резервного копирования.

DAS также используют в гипермасштабируемых системах, например, Apache Hadoop или Apache Kafka для поддержки больших интенсивных рабочих нагрузок, которые могут быть расширены по сети распределенных компьютеров.  В последнее время DAS стали чаще использовать в комплексе HCI, состоящих из вычислительных ресурсов и ресурсов хранения информации.  Используемое хранилище в каждом узле объединено в пул виртуальной памяти для поддержки необходимых рабочих нагрузок.

Сетевое хранилище (NAS)

NAS — это устройство файлового хранения, предоставляющее возможность доступа к данным нескольким пользователям и приложениям из централизованной системы через сеть.  С помощью NAS пользователи получают масштабируемую, простую в настройке и более дешевую (например, в сравнении с SAN) единую точку доступа. У NAS также есть встроенная система отказоустойчивости, возможности управления и обеспечение безопасности, такие функции, как репликация и дедубликация данных.

Устройство NAS — это независимый узел в локальной сети со своим IP адресом.  Фактически, это сервер, который содержит несколько HDD и SSD дисков, ресурсы процессора и памяти. 

Пользователи и приложения подключаются к устройству NAS по сети TCP/IP. Для более простой передачи данных NAS использует протокол передачи файла.  Вот несколько из наиболее распространенных протоколов: Network File System (NFS), Common Internet File System (CIFS), и Server Message Block (SMB). Но устройство NAS может также поддерживать Internetwork Packet Exchange (IPX), NetBIOS Extended User Interface (NetBEUI), Apple Filing Protocol (AFP), Gigabit Ethernet (GigE).  Большинство устройств NAS поддерживают несколько протоколов.

Устройства NAS обычно несложное в развертывании, работе и относительно недороги.   Кроме того, пользователи и приложения, работающие в одной сети, могут легко получить доступ к файлам, без ограничений, с которыми они могут столкнуться при извлечении данных из DAS. Устройства NAS также можно масштабировать или интегрировать с облачными сервисами. 

Однако, из-за проблем с сетью и параллелизмом, NAS используют в малых и средних компаниях, или подразделениях больших организаций, для распределения электронной почты, совместной работы над табличными программами или передачи медиа файлов.  NAS также используют для сетевой печати частных облаков, аварийного восстановления, резервного копирования, файловых архивов и других случаев, которые могут работать, не перегружая сеть или файловую систему.

Если Вы приняли решение о внедрении устройства NAS, необходимо проанализировать количество пользователей, тип приложений, доступную пропускную способность сети и другие факторы, характерные именно для вашей среды. DAS может быть оптимальным выбором, т.к. он производителен, дешев и прост в настройке в отличии от NAS. С другой стороны, Вы можете использовать SAN для увеличения масштабируемости и дополнительных функций управления.

Сеть хранения данных

SAN — это выделенная, высокоскоростная сеть, которая связывает одну или несколько систем хранения и представляет их как пул ресурсов блочного хранения.   В дополнении к самим массивам хранения, в SAN входят несколько серверов приложений для управления доступом к данным, программное обеспечение управления устройствами хранения данных, адаптеры системной шины для подключения к выделенной сети и физические компоненты, составляющие инфраструктуру сети (высокоскоростной кабель и специальные переключатели для маршрутизации трафика).

Массивы хранения SAN могут состоять из HDD или SSD дисков или их комбинаций в гибридных конфигурациях, а также одного или более ленточных или оптических накопителей.  Программное обеспечение управления объединяет различные устройства хранения в единый пул ресурсов, которые дают возможность каждому серверу получить доступ к устройствам, словно они напрямую подключены к этому серверу. Каждый сервер связывается с главной LAN, чтобы клиентские системы и приложения могли получить доступ к хранилищу.

Существует миф, что SAN — это высокопроизводительные системы, но, как показывает практика, это редко становилось правдой. На самом деле, малоэффективный SAN широко распространен в дата-центрах и, прежде всего, оптимизирован для управления данными, а не для производительности.  Однако, сейчас, когда SSD диски получают повсеместное распространение, гибридные или all-flash системы ставят производительность на первое место.

Для эффективного SAN - решения важным является надежность, высокопроизводительная сеть, подходящая под требования рабочей нагрузки. По этой причине многие современные сети SAN основаны на Fibre Channel, технологии для построения топологий сети, которые могут обеспечить высокую и исключительную пропускную способность  со скоростью до 128 гигабит (16Гб) в секунду.  К сожалению, Fibre Channel известен своей сложностью и высокой ценой, что заставляет многие организации использовать такие альтернативы, как Internet SCSI (iSCSI), Fibre Channel over Ethernet (FCoE), или даже NVMe over Fabrics (NVMe-oF).

С правильной внутренней конфигурацией и топологией сети, SAN предоставляет решение блочного хранения с высокой доступностью, масштабируемостью, и даже производительностью.  SAN имеет в своем составе централизованное управление, защиту от сбоев, аварийное восстановление, а также может улучшить использование ресурсов хранения.  Так как SAN работает на выделенной сети, локальная сеть LAN не должна занимать трафик, устраняя возможный конфликт. 

Однако, SAN — это комплексная среда, развертывание и администрирование которой может быть сложными, часто требующая участие профессионалов со специальным набором знаний.  Этого уже достаточно для высокой стоимости, но сами по себе компоненты SAN также могут быть дорогостоящими. 

Для многих компаний, особенно крупных корпораций, сложные ситуации оправдывают вложения, особенно, когда дело касается многочисленных и больших наборов данных и приложений с немалым количеством пользователей.  SAN  с успехом можно использовать в таких случаях, как почтовые программы, медиа библиотеки, системы управления базами данных, распределенные приложения, которые требуют централизованного хранения и управления.

Организации в поисках решения сетевого хранения часто сравнивают SAN и NAS по сложности, надежности, производительности, функциям управления и стоимости.  NAS дешевле и проще в развертывании и администрировании, но он не так масштабируем и быстр, как хотелось бы.  Например, NAS использует файловое хранилище, а SAN - блочное, которое несет меньше расходов, хотя более сложное в работе.  Наиболее подходящая Вас система хранения может выбрана только на основании индивидуальных обстоятельств и потребностей. Как и другие технологии хранения, SAN претерпевает изменения.  Например, сейчас производители предлагают универсальную SAN, которая может поддерживать как блочное хранение, так и файловое в едином решении.    Другие технологии также направлены на преодоление расхождений между NAS и SAN.  Одним из подходов к хранению является конвергетная SAN, которая внедряет среду SAN в той же сети, используемой для другого трафика, таким образом устраняя избыточность сети, которая является частью более стандартной SAN.

Для большинства компаний правильно подобранные и настроенные решения DAS,NAS,SAN будут легко  справляться с рабочими нагрузками.  Если этого недостаточно, они могут рассмотреть более новые технологии (конвергентные или гиперконвергентные инфраструктуры), которые улучшают основные конфигурации. Современные компании также могут воспользоваться преимуществами таких технологий, как облачное хранение, объектное хранение, программно-определяемое хранилище, а также различными формами интеллектуального хранения.

На самом деле недостатка в способах хранения данных нет, и эти варианты с каждым днем становятся все более сложными и разнообразными, поскольку технологии стремятся удовлетворить потребности современных интенсивных рабочих нагрузок.

 

No Comments

Add a Comment