NASの仮想化

著者Jacob Gsoedl
Storage Magazine 2010年9月号より


規模の大小を問わず、企業には非構造化データがあふれかえっており、これが従来のストレージ容量を圧迫している。ファイル仮想化は、このような圧迫したリソースの負担を軽減するものであり、将来のデータ容量増加にも対応できる利点がある。

 

現在は、どの業界においても非構造化データがかつてないほどの勢いで増加し、IT部門を悩ませる最大の課題の1つになっている。この点について、さまざまなアナリストや市場調査会社の見解は一致しており、「ほとんどの企業で、非構造化データの量が(ファイルベース)で構造化データの量を上回っている」「部門を問わず、企業全体に非構造化データが存在する」「あちこちのデータストアに非構造化データが分散して存在し、保存媒体も、ファイルサーバからネットワーク接続型ストレージ(NAS)まで多岐にわたる傾向にある」といった問題点が指摘されている。しかも、管理者の立場からすれば、課題は緊急を要する状態にまで達していて、関連費用も高騰の一途を辿っているのが現状だ。

 

なぜ、このような事態になったのかと言えば、理由は単純明快だ。簡単だという理由から、WindowsやLinuxのファイルサーバを介したデータストレージを実装し、直接接続されたストレージやストレージエリアネットワーク(SAN)型のストレージに、非構造化データを保存していたからだ。その一方で、従来のスケールアップ型アーキテクチャをベースにしたNASシステムもネックになっていて、こちらは拡張性に固有の限界がある。たとえば、NetAppのストレージも、ONTAP 8までは先進のクラスタリング機能やグローバル名前空間機能を装備していなかった。つまり、単一のNetAppファイラーを超えて拡張するには、より大きなファイラーを購入するか、既存のシステムとは独立して動作する別のシステムを導入するしか方法がなかったのである。

ただ、データストレージ業界もこの状況を鋭く察知し、ベンダ各社が、それぞれに異なるアプローチで、この問題をすぐに解決できるファイルシステムやNAS仮想化製品をリリースしている。たしかに、これで技術は進歩した。しかし、導入がなかなか進まない。StorageIO Group(ミネソタ州スティルウォーター)の創業者でありシニアアナリストでもあるGreg Schulz氏は、次のように述べている。「ブロックベースの仮想化が定着するのに10年近くかかった。NAS仮想化はまだ初期段階にあり、これが普及するにはもう少し時間がかかるだろう」

 

ファイルアクセスを仮想化する4つの方法

 

非構造化データ問題を解決しようと思えば、間違いなく、バックエンドのファイルストアとクライアント間に論理レイヤを置き、グローバル名前空間を設定することで、ファイルアクセスを仮想化すればいい。やり方としては、ブロックベースのストレージ仮想化に似ているが、ファイルアクセス仮想化の場合、実装方法に決まったメソッドというものがない。したがって、アーキテクチャに関して複数のアプローチがあり、大きな利益を生みそうなファイルアクセス仮想化市場で、各社が有望性を競っている。

 

1. ファイルシステム仮想化(集約)は、ファイルアクセス仮想化の第1の方法として挙げられる。ファイルシステム仮想化は、高いレベルで個々のファイルシステムを仮想プールに蓄積し、クライアントがこれを単一のユニットと見なしてアクセスする、というものだ。言い換えると、クライアントは、その下のファイルストアを意識することなく、大きな単一の名前空間を見ている、ということになる。下にぶら下がっているファイルストアは、単一のNASの場合もあるし、さまざまなファイルサーバとNASシステムが混在する場合もある。ファイルシステム仮想化製品は、非構造化データの2つの大きな問題点を解決する。まず、単一の仮想ファイルストアをユーザに提供する。そして、スムーズなデータ移行やファイルパスの固定などのストレージ管理機能を備えて、異なる物理ファイルストアへのファイルの移行を支援する。

ファイルシステム仮想化の大きな利点の1つは、既存のサーバやNASストレージを手放すことなく、今ある環境にそのまま組み込める点だ。一方、ファイルシステム集約では、各ファイルストアを個別に管理しなければならないという問題点を解決できないことが、欠点として挙げられる。


2. クラスタ化ファイルシステムは、ファイルアクセス仮想化の第2の方法である。クラスタ化ファイルシステムは、従来のスケールアップ型NASの限界を克服しようと開発された次世代NASシステムの1つだ。これは通常ブロックベースのストレージノードで構成され、たいていは3ノードから始めて、単純にノードを追加していきファイルストレージをペタバイト規模にまで拡張していく。クラスタ化ファイルシステムは、単一のグローバル名前空間を備えた単一のファイルシステムをクライアントに提供し、ノードを1つにまとめる。クラスタ化ファイルシステムをベースにしたNASシステムのベンダ、および製品には、FalconStor SoftwareのHyperFS、Hewlett-Packard(HP)のStorageWorks X9000 Network Storage Systems、IBMのScale Out Network Attached Storage(SONAS)、Isilon Systems、OracleのSun Storage 7000 Unified Series、Panasas、QuantumのStorNext、SymantecのFileStoreなどがある。

3. クラスタ化NASは、ファイルアクセス仮想化の第3の方法となる。クラスタ化NASは、アーキテクチャの面で、クラスタ化ファイルシステムベースのNASと多くの利点を共有している。ただ、クラスタ化NASシステムは、全ノード横断的に単一のファイルシステムを稼働させるのではなく、ノードごとに完全なファイルシステムを稼働させ、それらを単一のルート下に集約して、単一のグローバル名前空間として接続クライアントに提供する、という手法を採る。ある意味、クラスタ化NASは、スケールアウト型とマルチノードのストレージアーキテクチャ、それにファイルシステム集約を組み合わせた手法と言える。異種ファイルストアの組み合わせによるファイルシステムを集約する代わりに、クラスタ化NASでは、ファイルシステムをネイティブのストレージノード上に集約する。クラスタ化NASシステムとしては、BlueArcのスケールアウト型NASシステム、Titanシリーズ、およびMercuryシリーズなどが、代表に挙げられる。

4. NASゲートウェイもまた、ファイルシステム仮想化デバイスの1つになり得る。NASゲートウェイは、ブロックベースのストレージの前に置かれ、後段のブロックベースのストレージへNFSおよびCIFSアクセスを提供する。大半のNASベンダが提供しているこのアプローチでは、サードパーティが提供するブロックベースのストレージをNASに組み込めることが多く、場合によっては、グローバル名前空間への組み込みをサポートしているNASベンダもある。

クラスタ化ファイルシステムあるいはクラスタ化NASアーキテクチャをベースにしたNASシステムおよびNASゲートウェイは、次世代のNASシステムであり、今あるレガシーのファイルストアに統合することはできない。これらのシステムは、置換または別個に併用する形での運用が中心となる。そのため、ファイルシステム仮想化製品と比べると、採用も困難で、費用も高くついてしまう。しかし、単純に、単一の名前空間にいくつものデータサイロを集約するだけのファイルシステム仮想化製品と違って、単一のNASだけを管理すればよい利便性は、導入の困難や追加コストを補って余りあるケースも少なくない。

NAS仮想化用語集
名前空間とは、ディレクトリ構造やファイルなど、ファイルシステムにあるデータの所属や表し方を指す。

非共有型の名前空間では、ファイルシステム情報は単一の物理マシンに制限され、他と共有することはない。従来のスケールアップ型NAS、およびサーバベースのファイルストアはその代表で、非共有型の名前空間を備えた製品ということになる。

これに対して、共有型の名前空間はグローバル名前空間といわれ、複数の物理マシンあるいはノードの名前空間を単一の名前空間に集約させて表す。これは、複数の物理マシンの名前空間を1つにまとめ、それらを単一の連合型名前空間として示すことで実現する。通常、ファイルシステム仮想化やクラスタ化NAS製品は、この手法を用いている。また、複数の物理ノードにまたがって単一のファイルシステムを展開する、クラスタ化ファイルシステムの手法でも実現できる。

スケールアップ型NASとは、ファイルベースのストレージシステムのことで、たとえば、より高速なCPUや、より大きなメモリ、大容量のディスクなど、ハードウェアのコンポーネントを置き換えて規模を拡張するものを指す。この場合、名前空間は、ハイアベイラビリティに向けてクラスタ化した、1つ以上のノードにまたがって広がる。

スケールアウト型NASとは、ファイルベースのストレージシステムのことで、クラスタにノードを追加していくことで規模を拡張するものを指す。N+1(単一冗長ノード)または(各ノードに冗長ノードを備えた)N+M型のハイアベイラビリティ構成で実現し、複数のノードにまたがって広がる名前空間を提供する。これにより、名前空間のすべてのノードについて、データへのアクセスが可能になる。



ファイルシステム仮想化の用途、および選択基準

既存のファイルストアを手放して、それらをスケールアウト型のNASで置き換えるほうが得策になるケースは少ないため、さまざまなファイルストアを単一のグローバル名前空間に集約するファイルシステム仮想化製品は、スケールアウト型のNASシステムおよび従来のNASシステムを補完するものと位置づけられる。特に、レガシーのファイルストアからデータを移行させているときは、この種の製品が重宝する。AutoVirtのマーケティング・バイスプレジデントBrian Gladstein氏は、次のように述べている。「レプリケーション、アーカイブ、スナップショットなどの機能を求めてNASを購入する人は多い。しかし、彼らはすべてのファイルに対してNASを求めているわけではない。したがって我々は、既存のローエンドのファイルストアと高速ファイラーを組み合わせ、それらに単一の名前空間を与える機能を提供している」


グローバル名前空間をサポートしているNASに、非構造化データを集中させている企業でも、たいていの場合、いくらかのストレージサイロは、NASから外れた場所に分散して存在する。それは、部門別のデータの場合もあるだろうし、決して安くはないNASストレージに保存するまでもない、と考えられているデータの場合もあるだろう。その場合、ファイルシステム仮想化製品を用いれば、孤立したファイルストアをNASデバイスと組み合わせて、グローバル名前空間を構成できる。ファイルシステム集約の2つ目の用途は、データマイグレーションだ。システムの新設、ストレージ・インフラストラクチャのアップグレード、およびデータの移設プロジェクトなどの場合には、ある場所から別の場所へ、データを物理的に移行しなければならない。そんなとき、ファイルシステム集約製品は、異なるファイルストアへのアクセスを仮想化するので、シンプルで有効なデータマイグレーション・ソリューションの1つになり得る。また、ファイルシステム集約は、ストレージの自動階層化にも使える。最終のアクセス日時やファイルサイズ、あるいはファイルの種類など、ファイルシステムのメタデータ情報に従ってデータマイグレーションのルールを定義するポリシー・エンジンを装備し、定義されたポリシーに則って、データを自動で適切なストレージ階層に移動できるようにする。


ファイルシステム仮想化製品には、アプライアンス式のものと、ソフトウェアのみの製品がある。ソフトウェアのみの製品には、搭載するハードウェアが柔軟に選べるという利点があり、通常ベンダの制約も比較的少ない。一方アプライアンス式のファイルシステム仮想化製品は、ハードウェアとソフトウェアが同一ベンダの製品でパッケージ化されているため、パフォーマンスが最適化されていて信頼性が高く、大きな問題を引き起こすリスクが少ない。


ファイルシステム仮想化製品を比較する場合には、どのレベルで仮想化を行うか、ということが1つの評価基準になるだろう。たとえば、Microsoftの分散ファイルシステム(DFS)は、共有型の仮想化機能を提供し、F5 NetworksのARXファイル仮想化アプライアンス製品などは、ファイルレベルで仮想化を行う。


導入の難易度もまた、製品評価の基準になるだろう。理想を言えば、ファイルシステム仮想化製品は、クライアントの変更が最小限に抑えられるものがよく、バックエンドのファイルストア上の仮想化データが変更されないものを選ぶべきである。


ファイルシステムのサポートも考慮の対象となるだろう。なかには、CIFSしかサポートしていない製品があるが、F5のARXシリーズや、EMCのRainfinityなどの製品は、CIFSとNFSの両方をサポートしている。これであれば、Windows環境のファイルストアにも、Linux環境のファイルストアにも使用できる。ファイルシステム仮想化製品を、データの移行やストレージの自動階層化に使用するつもりであれば、ポリシー・エンジンの有無、およびその性能も重要な判断基準になってくるだろう。


ファイルシステム仮想化製品比較

ファイルシステム仮想化製品は数多くのベンダが提供しており、それぞれに異なった目的で設計されている。


AutoVirtのファイル仮想化ソフトウェア:MicrosoftのDFS同様、AutoVirtの製品もソフトウェア提供のみの製品で、Windowsサーバ上で動作する。


AutoVirtのグローバル名前空間は、ファイルサーバ、クライアント、DNS間のやり取りにCIFSプロトコルを使用している。クライアントがファイルを要求すると、DNSが適切なストレージデバイスを割り当てる。そのとき、グローバル名前空間は、クライアントとDNS間の仲介役として機能する。適切に配備されているAutoVirtのグローバル名前空間では、クライアントのショートカットは名前空間を参照する。この場合、名前空間がネットワーク化されたファイルの所在を示す鍵となり、DNSと連携して最終のストレージ参照先を提供する。


AutoVirtの製品は、クライアントへの導入もスムーズに行える。AutoVirtは、名前空間サーバが既存のファイルストアのシェアと共に存在するため、クライアントを一切変更する必要がない。また、手動でも行えるが、データ検出サービスが既存のファイルストアの検出を自動で行い、メタデータ情報を備えたAutoVirt名前空間サーバを提供する。MicrosoftのDFSは、既存のファイルシェアを継続して使用できず、新しいDFSシェアでクライアントを構成しなければならないため、この点は大きな差別化ポイントになる。


さらに、MicrosoftのDFSと違ってAutoVirtは、ポリシー・エンジンを装備するため、ルールに基づいてデータを環境横断的に移行し、データのマイグレーション、統合、レプリケーション、階層化が行える。しかも、エンドユーザからのネットワークファイルへのアクセスには影響しない。現在サポートされているのはCIFSのみだが、AutoVirtは、年内にNFSをサポートするバージョンのリリースも計画している。


EMCのRainfinityファイル仮想化アプライアンス:Rainfinityは、ファイルシステム仮想化製品の一種で、非構造化データへのアクセスを仮想化し、データ移行およびファイル階層化のサービスを提供する。Rainfinityのグローバル名前空間アプライアンスは、クライアントおよびアプリケーションに対して単一のマウントポイントを提供する、という特長がある。また、Rainfinity File Management Applianceを利用すれば、ポリシーベースの管理が可能になり、ファイルを異なるストレージ階層に自動で移行できるようになる。さらに、Rainfinityのファイル仮想化アプライアンスならデータの移行もスムーズに行える。


F5のARXと違って、Rainfinityファイル仮想化アプライアンスのアーキテクチャは、必要に応じて、インバンドのオペレーションとアウトバンドのオペレーションを切り換えられるよう設計されている。アプライアンスは、ほとんどの時間アウトバンドで稼働しており、クライアント・システムとバックエンドのファイルストア間で直接データがやり取りされている。マイグレーションが必要になるまではデータ・パスの外側に位置し、その後インバンドのオペレーションに切り換える。


F5のARXシリーズ:これは、F5が2007年にAcopiaを買収して、その後F5 ARXとブランド名を変更してリリースされた製品で、インラインのファイルシステム仮想化アプライアンスである。通常、アクティブ/パッシブのクラスタとしてインストールされ、CIFS/NFSクライアントと異なるCIFS/NFSファイルストア間に置かれて、CIFSおよびNFSの仮想化ファイルシステムをクライアントに提供する。非構造化データは、仮想化されたグローバル名前空間のなかに置かれる。ネットワークスイッチのような構造で、ギガビットのEthernetポート2基のARX500と、ギガビットのEthernetポート12基のARX2000、さらにギガビットのEthernetポート12基+10ギガビットのEthernetポート2基のARX4000がある。


F5のARXは、データの移行性およびストレージの階層化に重点を置いているため、データのマイグレーションおよびストレージの自動階層化で強い力を発揮する。ポリシー・エンジンにより、異なるストレージの異なる階層間で、リアルタイムに双方向のデータ移行が可能で、しかもユーザから見て透明性が高い。AutoVirt同様、ポリシーは最終アクセス日や、作成日、ファイルサイズ、ファイルの種類など、ファイルのメタデータをベースにしている。


F5のARXはアプライアンス製品であるため、パフォーマンスが最適化されており、その点ではソフトウェア単体提供の製品の比較にはならない。F5のARXは、パス分割アーキテクチャを採用し、ポリシーに関係のないタスクではデータがそのままデバイスを通過するデータ・パスと、ポリシーが関係するタスクでは適切に制御するコントロール・パスの両方を備える。F5の製品マーケティング・マネージャーRenny Shen氏は、「ARXはDFSの強化版だ。DFSはシェアレベルの仮想化だが、ARXはファイルレベルの仮想化を行う」と述べている。


MicrosoftのDFS:MicrosoftのDFSは、クライアントとサーバのサービスをセットにしたもので、MicrosoftのWindowsサーバを使用している企業であれば、分散CIFSファイルシェアを構成して、分散ファイルシステムに組み込める。DFSはデータ所在の透明性が高く、冗長性に優れているのが特長で、システム障害や過負荷の場合にでも、複数の場所にあるシェアを論理的に単一のDFSルート下に集めて、データのアベイラビリティを向上させている。


DFSは、Windows Server 2003までのサーバであればファイル複製サービス(FRS)を利用して、Windows Server 2003 R2およびWindows Server 2008、ならびにそれ以降のバージョンのサーバであれば、DFSレプリケーション(DFS-R)を利用して、サーバ間のデータレプリケーションをサポートしている。


MicrosoftのDFSがサポートしているのは、WindowsのCIFSシェアのみで、NFSあるいはNASシェアをDFSグローバル名前空間でサポートする計画もない。また、同製品にはポリシー・エンジンがなく、インテリジェントなデータマイグレーションにも対応していない。Windows Serverの一部として提供されているため無料なのが嬉しい点で、ファイルストアが主にWindowsサーバ内に存在する企業にとっては、良い選択肢となる。


オープンソースのNAS仮想化
NAS仮想化製品はまた、オープンソースソフトウェアでも入手できる。たとえば、ApacheのHadoop Distributed File System(HDFS)は、ファイルの分散および冗長化を支援し、どのデータストレージデバイスの容量も大幅に超えた論理ファイルの作成を可能にする。HDFSは商用ハードウェアを視野に入れて設計されており、サポート範囲も数ノードから数千ノードまで、どんな規模にも対応する。また、オープンソースのファイルシステムには、Glusterのクラスタ化ファイルシステムもある。こちらは、単一のグローバル名前空間を備えたスケーラブルNASを構築するためのものだ。

従来のNASシステムに巨額の費用をかけるよりは、安価なハードウェア・コンポーネント上で動作するオープンソースのファイルシステムを使うほうが、賢い選択肢ではないか、と思うだろう。しかし、エンタープライズの場合、オープンソースのファイルシステムが賢明な選択肢となることは少ない。というのは、オープンソースのファイルシステムはシステムの設定や管理に大変な労力を要することが多く、選択したソフトウェアの複雑さをものともしない、きわめて優秀なエキスパートを必要とするからだ。また、オープンソースのファイルシステムには、通常NASベンダが提供しているようなサポートも付いていない。エンタープライズのストレージでは、アベイラビリティ、信頼性、パフォーマンス、サポートが何より重要となる。ところが、オープンソースのソフトウェアでは、これらの条件が満たされない。オープンソースのファイルシステムは、クラウドストレージのプロバイダや、ストレージを専門とする企業、あるいは調査や教育関連の企業にとっては、非常にいい選択肢だが、エンタープライズとして選択する製品としてはお薦めできない。



ファイル仮想化の展望


非構造化データへのアクセスの様子は、15年前も今もあまり変わっていない。だが、大きな変化が今起こりつつある。NASシステムのアーキテクチャは、よりスケーラブルな方向へと動き出し、グローバル名前空間をサポートする、マルチノードのスケールアウト型アーキテクチャが徐々に広がり始めている。NASシステムの大手企業NetAppがついに、Spinnaker Network Solutionsを通じて獲得したテクノロジを、ONTAP 8に導入した。これは、起こりつつある変化を示す好例で、これによって顧客は、マルチノードのNetAppクラスタを構築できるようになった。

ファイルシステム仮想化製品は、従来のスケールアップ型NASシステム、および次世代のスケールアウト型NASシステムを補完して、エンタープライズの異種ファイルストア横断的に広がるグローバル名前空間を提供するものだ。今のところ、これらはデータの移行やストレージ階層化の目的に使用されることがほとんどであるが、今後は、全非構造化データに対して、統合されたエンタープライズワイドなグローバル名前空間を提供する、という点において、非常に重要な役割を果たしていくものと思われる。


著者略歴:Jacob Gsoedlは、フリーランスのライターで、ビジネスシステムを担当するコーポレート・ディレクターである。連絡先は〈jgsoedl@yahoo.com〉。

All Rights Reserved, Copyright 2000 - 2010, TechTarget
*この翻訳記事の翻訳著作権はJDSFが所有しています。
このページに掲載されている記事・写真・図表などの無断転載を禁じます。


February 2010