改訂版:レプリケーションの選択肢

著者:Jacob Gsoedl
Storage Magazine 2011年2月号より


かつては高価なオプションだったレプリケーションも、今や様々な形で提供され、かつてないほど安価で使いやすくなっている。

 

レプリケーション技術の広がりは、LAN、WAN、SANの進化そしてサーバー仮想化およびクラウド・コンピューティングによるものだと考えられる。データ保護や高可用性のための仮想マシン(VM)イメージの複製から、クラウド・サービスとの情報のやりとりに至るまで、レプリケーションは日増しに仮想化されていくIT環境において、最適かつ最速のデータ転送およびデータ保護手段であることを立証してきた。

 

しかし、データ管理におけるレプリケーションの役割がより重要になったのは、単なる進化の偶然ではない。それと同等、おそらくそれ以上にビジネス要件の変化がそこにはある。

 

例えば、ダウンタイムに対する許容度はどんどん小さくなってきている。2010年Enterprise Strategy Group (ESG、本社:マサチューセッツ州Milford)が行ったデータ保護についてのアンケートは、ティア1アプリケーションのダウンタイムを許せないと答えた回答者が、ほんの3年前には8%だったのが現在は18%にのぼっていることを明らかにした。災害復旧(DR)はレプリケーションの主要な用途であり、前述のESGアンケートでも投資No.1の分野とされている。公開会社や特定の業界はコンプライアンス義務を満たすために、重要データのアクセス性や復旧性を確保しなければならず、このことがレプリケーションの使用を推し進めている。さらに、グローバリゼーションと世界中に散らばるサテライト・オフィスをグローバルに経営する企業がもたらすニーズが、レプリケーション型のデータ保護に拍車を掛けている。

 

レプリケーションが存在感を増している事は、多種多様な形で製品に入り込んでいることからも見ることができる。ストレージの一機能、バックアップソフトのオプション、ビジネスアプリケーションの機能、ネットワーク機器のアドオン、さらには仮想化製品のオプションとしてレプリケーションは様々な製品に組み込まれている。動作環境も様々だ。ストレージにおいて、ネットワークにおいて、ホスト上であるいはアプリケーション内部で。同期か非同期か。ブロックレベル、ファイルレベル、サブ・ファイルレベル。レプリケーションの製品と選択肢は沢山あるというより、最初は、手のつけようがないほど多いと思えるだろう。しかし、レプリケーション製品は、異なる使用用途および使用環境のために様々な利点や価値提案を行ういくつかのグループに分けることができる。

 

 

同期および非同期レプリケーション

 

非同期レプリケーションは最も広範にサポートされているレプリケーションの方式である。ストレージ型、ネットワーク型、ホスト型レプリケーション製品はこの方式を使っている。データは、まずソース側のストレージでコミットされ、次にターゲット側のストレージへのレプリケーションのためにバッファーまたはジャーナルされる。データはレプリケーションのターゲットに遅れて到着する。遅延の幅はほぼ瞬時から数分数時間に及ぶこともある。ネットワーク遅延(レイテンシ)および帯域に対する許容範囲が広いため、長距離でのレプリケーションに向いている。

 

とはいえ、全ての非同期レプリケーションの実装が同じ、という訳ではない。差別化の重要な分野は、製品がどのようにネットワーク停止に対応するかであり、製品がトランザクション復旧をサポートするのか、不整合を解決するためにターゲット側のOSやアプリケーションに頼って単にcrash-consistentのレプリカ(複製)を作るかに分かれる。例えば、IBM System Storage DS8000のIBM Global Mirrorや日立データシステムズのUniversal Replicatorは書き込みのシーケンスを保持する機構を持っている。「Hitachi Universal Replicatorはコンシステンシーグループ内で書き込み順にレプリケートされたデータをもとに、トランザクションを復旧する事を保証しています。」日立データシステムズ社データレジリエンス(復元力、弾性)およびセキュリティ部門シニア・プロダクトマーケティング・マネージャー、Sarah Hamiltonはこう説明する。

 

ホスト型レプリケーションでは滅多にサポートされていない、同期レプリケーションは、ハイエンドのブロック型ストレージの特徴だが、以下に上げる製品を含め、ほとんどのネットワーク型レプリケーション製品でもサポートされている。HP StorageWorks SAN Virtualization Services Platform (SVSP)、IBM SAN Volume Controller (SVC)、LSI Corp. StoreAge Storage Virtualization Manager (SVM)。レプリケーション・ソースへのデータのコミットはレプリケーション・ターゲットへのコミットが成功して初めて行われる。同期レプリケーションはレプリケーション・ソースとターゲット間の同時性を保証している。信頼できるネットワークと低い遅延が必須条件であり、ストレージ・ベンダーによって値は異なるが、サポートされる距離は50kmから300kmでそれを超えることはできない。この方式の主な用途は、プライマリ・ノードがダウンした際に瞬時のフェールオーバーが必要とされるハイエンドのトランザクション型アプリケーションである。NASについては、そのNASがハイエンドのトランザクション型アプリケーション用ブロック型ストレージとして動くものでない限り、この方式はあまり関係がない。NAS専業ベンダーであるBlueArc Corp. のTitanやMercuryシステムは通常、同期レプリケーションのサポートを行っていない。「NASは同期レプリケーションを必要としません。」BlueArc Corp.のソリューション・マーケティング部門シニア・ディレクターのRavi Chalakaはこう主張する。逆に、NASおよびブロック型プロトコル、特にファイバーチャネル(FC)をサポートしているNetAppファイラーは同期レプリケーションをサポートしており、NetAppのストレージが EMC、日立データシステムズ、IBMが出している極めてハイエンドのブロック型ストレージ製品と互角に渡り合うことを可能にしている。

 

レプリケーションとネットワーク

レプリケーション・ソースとレプリケーション・ターゲットのシステム間の使用可能帯域幅および遅延(レイテンシ)は、レプリケーションのパフォーマンスに大きな影響を与える。50km未満の短い距離では遅延は無視できるほどわずかであり、使用可能帯域幅がレプリケーションのパフォーマンスを決定する。ネットワークのパイプが太くなれば、所与のデータはより速くレプリケートされる。より高速の回線を購入する以外の方法としては、圧縮やデータ重複排除は所与の帯域幅を最大限に活かす重要なテクニックだ。重複排除と圧縮はバックアップおよびリストアの時間を短縮するのに役立ち、回線とストレージ費用の大幅な節約につながる。

 

長距離のレプリケーションでは、遅延は決定的な要因となる。距離が長くなればなるほど、レプリケーション・ソースとレプリケーション・ターゲットの通信に時間がかかる。遅延は、非同期レプリケーションにおいては多少軽微な問題だが、同期レプリケーションにおいては決定的要因であり、50kmが通常の使用可能最長距離になっている。レプリケーションの実装によっても差が出るが(例えばIBM Metro Mirrorはソース・ターゲット間の距離300kmをサポート)、遅延の影響を減らし、サポートできる距離を伸ばす方法としてWANアクセラレータの使用がある。WANアクセラレータはTCPの最適化を行い、ラウンドトリップを最小にする技術を実装している。WANアクセラレータはシスコ、F5ネットワークス、ジュニパーネットワークス、リバーベッドテクノロジー、シルバーピークシステムズ各社から販売されている。

 

 

ストレージ型レプリケーション

 

ストレージ初期、一台のストレージからもう1台のストレージにデータをレプリケートする仕組みは必要に迫られて生まれたが、ストレージ・ベンダーはすぐにレプリケーションを自社のストレージに追加した。今でこそ標準機能になっているが最初はハイエンドのストレージだけに、次にミッドレンジそしてより下位のモデルに、とレプリケーション機能は追加されていった。Dellは、レプリケーションがストレージ市場において、ローエンドに浸透していく傾向を分かり易く示してくれるとても良いモデルだ。今日、Dellのストレージは、ローエンドのPowerVaultを除く、Dell/EMC SAN StorageおよびDell EqualLogicからDell DX Object Storage Platformまでの全ての製品がレプリケーションをサポートしている。

 

レプリケーションをストレージの一部として持つことは多くのメリットがある。ストレージ管理者にとって、それは慣れ親しんだストレージの機能がひとつ増えただけに過ぎない。ストレージの他の機能やオプションと同じように扱えるので、レプリケーションだからといって特別に手間がかかることもない。ストレージの一機能であるが故に、配備に関しての部門間の調整もごくわずかですむ。レプリケーションを行うのはストレージ担当であり、一旦配備されればそれをサポートするのもストレージ担当である。ストレージ型レプリケーションは、同一メーカーから供給され、同一ベンダーによってサポートされるため、問題が発生したときに起こる責任のなすりつけ合いを回避することができる。さらに、ストレージ型レプリケーションでは、パッチやその他の変更など、ホスト型レプリケーションにとっては悩みの種になりがちな外部からの作業によって障害を起こすことは比較的少ないため、より高い復元力を持つことができる。「アプリケーションの失敗は、ストレージシステムに影響を与えないのでストレージ型レプリケーションにも影響はありません。」NetAppデータプロテクション・ソリューション部門ディレクターのMark Welkeはこう語る。

 

ストレージ型レプリケーションの弱点は、それがソースとターゲットに同種のストレージを必要とするところだ。このためストレージ型レプリケーションの使用は同一機種(ホモジニアス)な環境に限られる。ほとんどのストレージ・ベンダーは自社の異なるストレージファミリー間のレプリケーションでさえもサポートしていない。大手ストレージ・ベンダーの中で、自社のどのストレージ間でもストレージ型レプリケーションをサポートするNetAppは唯一の例外だ。他に注目すべきベンダーは日立データシステムズである。同社のVirtual Storage Platform(VSP)およびUniversal Storage Platform(USP)はストレージ仮想化を経由して他のストレージと接続することができる。ところで、Dell EqualLogicのような極めてわずかな例外を除いて、レプリケーションはデバイスごとまたは複製容量により課金される有償オプションとなる。

 

ブロック型のFCやiSCSIのストレージはボリュームやLUNの変更をレプリケートする。レプリケートする必要があるのは数百バイトの変更されたブロックのみであるため、非常に高速で効率的だ。ファイルシステム配下で実行されるブロック型レプリケーションは、OSにとらわれずどのようなプラットフォームに接続されたストレージ間のレプリケーションでもサポートする。ブロック型レプリケーションは重複排除、圧縮、暗号、など先進的な機能を取り込む潜在力を持っており、実際いくつかのベンダーは自社のレプリケーション製品にそのような機能追加を行っている。例えば、NetAppはData Ontap8.0.1のリリースにおいて、親ボリュームとクローンイメージ(クローンボリューム)間の変更をFlexCloneボリュームにのみレプリケートする機能を追加した。FlexCloneボリュームはシンプロビジョニング型のクローンで、非常に小さい実容量しか必要としない。なにしろ、この最新リリースまでは、ディスク効率の良いFlexCloneの替わりに全ボリュームをレプリケートしなければならなかったのだ。

 

NASシステムは通常ファイルシステム・レベルでレプリケートされる。この方式にはメタデータを認識できる利点があり、レプリケーション処理中に利用される。ファイルサイズやファイルタイプなどの基準を設けてレプリケーションができるのはこの利点によるものだ。とはいえ、この方式はブロック型レプリケーション比べると遅く効率も劣る。レプリケーション・セット上で解析しなければならないファイルやフォルダの数が増えるにつれてパフォーマンスは影響を受ける。ツリーが大きくなればなるほど、解析時間は長くなっていく。この理由のために、BlueArcはオブジェクト型のJetMirror技術を導入し、時間がかかる順次ファイル解析の替わりに、オブジェクト型メタデータを保存する方式を採用した。「JetMirrorでのバックアップはNDMP[Network Data Management Protocol]より2.8倍高速です。非常にサイズの大きなファイルのレプリケーション時間は、従来の方式に比べ一桁短くなります。」BlueArcのChalakaはこう主張する。

 




ネットワーク型レプリケーション

 

異機種が混在する環境ならばネットワーク型レプリケーションの出番だ。この方式はどんなストレージでもどんなホストプラットフォームでも動作可能だ。I/Oの分離は、ホスト・ストレージ間のネットワーク上に置かれた、インラインのアプライアンスかファイバチャネル・スイッチの中で行われる。I/Oのスプリッターは、入ってくる書き込みI/Oの送信先アドレスを見て、宛先がレプリケーション・ボリュームのある部分を指していれば、そのI/Oのコピーをレプリケーション・ターゲットに転送する。ネットワーク型レプリケーションは、様々な点で、ストレージ型、ホスト型レプリケーションのメリットを兼ね備えている。数年前に市場に登場したばかりで、売上金額、出荷台数ともにストレージ型レプリケーション、ホスト型レプリケーションの後塵を拝し、シェアは最小だが、IDCによれば成長率はストレージ型レプリケーションよりも速いという。

 

ストレージ型、ホスト型レプリケーションの製品の多さに比べ、市場に出ているネットワーク型レプリケーション製品は数が少ない。この方式は二つのグループに分けることができる。インライン・アプライアンスとファブリック型レプリケーション製品である。

 

IBM SVCなどのインライン・アプライアンスは、I/Oを分離するのにブロケードやシスコのインテリジェント・スイッチに頼ることはしない。その替わりに、I/Oはアプライアンスの中でターミネートされストレージ・ターゲットに転送される。ワイヤー・スピードでI/Oの分離を行うファブリック型製品と違い、アプライアンスではターミネートと新しいI/Oの生成のオーバーヘッドが若干の遅延を引き起こす。ファブリック型製品は、レプリケーション・ボリュームまたは仮想ボリュームの一部でないデータは単に通過させるスプリット・パス・アーキテクチャをベースとしている。一方、インライン・アプライアンスは全てのトラフィックがレプリケーション・アプライアンスを通過しなければならない。その結果、インライン・アプライアンスはどうしてもファブリック型製品よりも拡張性において限界値に達しやすい。「キャッシュやプロセッサーの数、速度を含む様々なハードウェアの選択肢を持つことで、IBMは拡張性やパフォーマンスに対する不安を、かなりなところまで解消できるようになりました。」StorageIOグループ(本社:ミネソタ州Stillwater)の創設者でシニア・アナリストのGreg Schulzはこう語る。

 

ファブリック型レプリケーション製品は優れたパフォーマンスと拡張性の点で、技術的には勝っているかもしれないが、はるかに複雑でかつインテリジェント・スイッチを必要とする。インテリジェント・スイッチがない環境で使用する場合は、通常、ファブリック型レプリケーション製品からファブリック・スイッチの替わりにホスト上でI/Oの分離を行うホスト・エージェントが提供される。EMCのRecoverPointは、継続的データ保護とリモート・レプリケーションの機能を持った、ファブリック型レプリケーション製品のなかで最も名の通った製品である。

 

HP StorageWorks SVSPとLSI StoreAge SVM (前者は後者のOEM製品)は、インライン・アプライアンスの簡潔さとファブリック型のパフォーマンスおよび拡張性を兼ね備えている。この製品は、インバンドにおいては処理を行うスプリット・パス方式を使い、データの移動や通常のデータフローはアウトオブバンドで行うことで、拡張性とパフォーマンスの改善を実現している。

 

その他のネットワーク型レプリケーションのベンダーとしてはMicroScanとDelta Resync機能を持つFalconStor Software Inc.やInMage Systems Inc.がある。

 

 

ホスト型レプリケーション

 

ホスト型レプリケーションでは、サーバーに常駐し、書き込みI/Oを捕らえ、レプリケーション・ターゲットにファイルまたはブロックの変更を転送する、フィルター・ドライバーといわれるものによってレプリケーションが行われる。ホスト型レプリケーションは導入当初の費用や複雑さの度合いは最も低いものの、レプリケーション・ノードの数が増えるのに比例してこれらは増加してくる。少ない台数のサーバーを管理する間は簡単だが、ノードが多数になってくると、インストレーション、本番稼働、その後の継続的なサポートそして監視、と管理作業が気の遠くなる程面倒なものになる可能性がある。

 

ストレージ型やネットワーク型のレプリケーションと比べると、ホスト型レプリケーションは隔離の度合いが低く、実行環境も制御しにくいため、他のアプリケーションやサーバーのイベントから悪影響を受けやすい。ウィルス感染やアプリケーション・クラッシュによって、ストレージ型やネットワーク型のレプリケーションがダウンすることはないが、ホスト型レプリケーションは確実に停止する。スタンドアローンのホスト型レプリケーション製品を販売しているベンダーを次に挙げる。ARCserve のCA、Double-Take Software Inc.(現在はVision Solutions Inc.の一部)、Neverfail Ltd.、Quest Software Inc.、サイオステクノロジー株式会社(かつての SteelEye Technology Inc.)など。製品はサポートプラットフォーム(Windowsは全製品がサポート)、帯域制御、圧縮、重複排除、暗号化、HAなどの機能、管理オプションなどで個々に違いがある。

 

ホストベースのレプリケーションは三つのなかで最も融通の利く方式だ。ソフトウェアのみであり、DASからクラウドまでどんなストレージとも連携し、製品やベンダーによって異なるが、幅広いプラットフォームをサポートする能力を持っている。ストレージ型やネットワーク型レプリケーションが適用可能なシナリオでは競合するが、この方式は純粋にソフトウェアであるがゆえに、他の二つが全く立ち入れない領域まで入っていくことができる。第一に、この方式はクラウドストレージには理想的なレプリケーションである。Amazon Elastic Compute Cloud (EC2)は、ハードウェア型レプリケーションには全く対応できないが、クラウド間のおよびクラウドとオンプレミス・サーバー間のデータのやりとりにレプリケーション・ソフトウェアを走らせることはできる。

 

第二に、ホスト型レプリケーション・ソフトウェアは他のアプリに組み込むことができる。典型的な例はバックアップ・アプリだ。レプリケーションを追加することにより、レプリケーション型と従来型、両方のデータ保護を提供し管理できるようになった。レプリカは通常スタンドアローンのイメージではなく、大容量データ保護プロセスの一部になっていることが多い。レプリケーション型データ保護の動きが主流になるにつれて、従来のバックアップとともにこれを管理、監視する機能を持っていることがより重要になってきた。その結果、CA、EMC、IBM、Symantec、その他のベンダーは自社のバックアップ・スイートにレプリケーション型データ保護を加えるようになった。

 

 

レプリケーションの進化

 

レプリケーションは長い間、高可用性と重要なデータのデータ保護を目的として使われてきた。またデータ保護のためのメディア選択において徐々にテープを駆逐してきた。縮小する目標復旧時間(RTO)と24時間365時間のアプリケーションとデータの可用性のニーズの結果として、この傾向は加速されないまでも続いて行くことだろう。技術面においては、クラウド・コンピューティング、IT基盤の仮想化、オプションとしてのレプリケーションやレプリケーション製品のブームが、この傾向を促進している。

 

 

著者略歴:Jacob Gsoedlはフリーのライター兼IT部門取締役。

 

ストレージ・マガジンはエンタープライズITにフォーカスしたTechTargetポートフォリオの一つです。
Copyright 2000 - 2011, TechTarget. All Rights Reserved,


*この翻訳記事の翻訳著作権はJDSFが所有しています。
このページに掲載されている記事・写真・図表などの無断転載を禁じます。