オブジェクトベース・ストレージ徹底解説

著者:Jacob N. Gsoedl

Storage Magazine2012年6月号より


Web2.0アプリとクラウド・ストレージによって、オブジェクトベース・ストレージは他の追随を許さない拡張性を提供し、分散型アプリケーションには理想的であることが明らかになった。

 

オブジェクトベース・ストレージシステムが注目を集めている。事実、スケールアウトNASに取って代わるものとして、市場への進出も始まっている。オブジェクト・システムは、仮想的に無限の拡張性、高速処理と高速ネットワークへの依存度の少なさ、既存のストレージコマンドを使わず主にWebプロトコルを使って行われるアクセス、カスタム・メタデータ、低価格、汎用市販部品を利用できる能力、など人目を引く機能を持っている。

 

オブジェクト・ストレージ製品が持っているこれらの主要な属性は、既存のファイルベースやブロックベースのストレージに不満を持っている市場とアプリケーションに、参入していく要因となった。オブジェクト・ストレージは、パブリック・クラウドおよびプライベート・クラウドを構築する際、基礎となる要素である。Web 2.0の会社やFacebookのようなソーシャル・ネットワークのサイトは、ユーザーのファイル、画像、動画のためにオブジェクト・ストレージを選択した。しかし、オブジェクト・ストレージの適用事例は、オブジェクト・ストレージをコンテンツのタイプによっては、事実上ティア1として使っている新興のクラウドやWeb2.0にとどまらない。企業は自社の高パフォーマンスで高価なブロックベースとファイルベースのストレージ基盤を、拡張用にティア3、ティア4のオブジェクト・ストレージを使っている。急速に増加する非構造型データを、より廉価だが拡張性の高いオブジェクト・ストレージのティアに移行するのが、その目的だ。オブジェクト・ストレージは何年にも渡って、コンテンツ・アドレスド・ストレージ(CAS)の形態でデータのアーカイブ用に使われてきた。しかし、既存のCASシステムは、現在のオブジェクト・ストレージとは非常に異なっている。「分散クラウドの利用のために開発されたオブジェクト型ストレージの特徴は、コストの最適化(これはクラウドのキーワードですが)とHTTPプロトコルによるアクセスです。」コネティカット州スタンフォードに本社を置くGartner Inc.のリサーチ・ディレクターPushan Rinnenはこう語る。

 

 

オブジェクト・ストレージ vs. 既存ストレージ

 

ブロックベースとファイルベースのストレージだけでも沢山の選択肢がある状況で、当然あがってくる疑問は、なぜさらに新しいストレージ技術が必要なのか、ということだ。ブロックベースもファイルベースも共に成熟し実績のある技術であり、分散化とクラウド化が進むコンピューターの生態系のニーズを満たすべく、機能を拡張することは可能であるかのように見える。

 

ブロックベースのストレージでは、ディスク上のブロックはSCSIコマンドのような低水準プロトコル経由でアクセスされ、オーバーヘッドは少なく、余計な中小レイヤーを必要としない。これは、ディスク上のデータにアクセスする催促の方法であり、マルチユーザー・アクセス、共有、排他制御、セキュリティなどの高いレベルのタスクはすべてOSまで持ち越される。言葉を変えて言うと、ブロックベース・ストレージは低レベルの配管工事は一手に引き受けるが、それ以外の仕事はすべて高いレベルのアプリに頼っているのだ。これに対し、全てのオブジェクトベース・ストレージは、ブロックベース・ストレージのノードを持っており、オブジェクト・ストレージのソフトウェア・スタックがその他全ての機能を提供している。ブロックベース・ストレージは、オブジェクト・ストレージを補完するものと考えられないこともないが、ファイルベース・ストレージは、オブジェクト・ストレージの直接のライバルと言えるかもしれない。ファイルベース・ストレージの拡張性に関する主要な機能は、スケールアウトNASによってサポートされており、オブジェクト・ストレージ同様、ノードを追加することで水平に拡張することができる。しかし、スケールアウトNASは有限の名前空間を持った階層型ファイル構造を土台としており、制限するものといえば唯一オブジェクトIDのビット数だけで、ほぼ無限の拡張性を持つ平坦な構造の純粋なオブジェクト・ストレージに比べれば制限が多い。しかし限界はあるにしても、スケールアウトNASはオブジェクト・ストレージの特徴を多く待っており、レプレゼンテーショナル・ステート・トランスファー(REST)プロトコルのように、現在持っていない機能も、スケールアウトNASをオブジェクト・ストレージとして位置づけようとしているベンダーによって、早急にサポートされようとしている。「HP Ibrix X9000 Storageおよび同製品がサポートするプロトコル、CIFS、NFS、に加えてWebDAV、REST、そして大規模な拡張性によって、我々はオブジェクト・ストレージ市場において他のベンダーを大きく引き離しています。」HPのストレージ事業部プロダクト・マネージャーのパトリック・オズボーンはこう主張する。

 

 

オブジェクト・ストレージの定義

 

オブジェクト・ストレージという言葉は、異なる人々に異なるものを意味し、公認された単一の定義がない。あるシステムがどの程度までオブジェクト・ストレージであるかを分析するために、必要とされる機能と「あることが望ましい」機能の両方を見る必要がある。

 

オブジェクト:純粋なオブジェクト・ストレージ・システムは、ブロックまたはファイルを管理するのではなく、オブジェクトを管理する。もっと正確に言うと、現在のオブジェクト・ストレージ・システムは全て、ファイルをオブジェクトとして管理している。オブジェクトは、ちょうどファイルベース・ストレージがパス経由でアドレス付けされるように、固有の識別子経由でアドレス付けされる。オブジェクトは平坦なアドレス空間に保存されるが、この方式によってファイルベース・ストレージが使っている構造型ファイルシステムの持つ複雑さと拡張性の問題を取り除いている。

 

メタデ-タ:オブジェクは、オブジェクト内のデ-タについてのコンテキスト情報とペイロ-ドすなわちデ-タ本体によって構成されている。ファイルベース・ストレージでは、メタデ-タはファイル属性に限られているが、純粋なオブジェクト・ストレージ・システムでは、カスタム属性をいくらでも持たせることができる。ファイルベース・ストレージでそれを行うには、ファイルに関連したあらゆる付加的な情報を扱うために(データベースを持った)アプリケーションが必要になる。カスタム・メタデ-タでは、ファイル(オブジェクト)に関連した全ての属性をオブジェクト自身に保存することができる。「カスタム・メタデ-タによって、豊富な情報を自身が持つファイル・オブジェクトの構築が可能になりました。ユーザーは、それをオブジェクト・ストレージにしまっておくだけでいいんです。膨大な非構造型データを、より少ない管理作業で構築することも可能になりました。」マサチューセッツ州ミルフォードに本社を置くEnterprise Strategy Group (ESG)のシニア・アナリスト、Terri McClureはこう語る。

 

 

 

 

固定オブジェクト:純粋なオブジェクト・ストレージは、固定のコンテンツを保存する場所と言うこともできる。つまり、オブジェクトを生成、削除、読み込みすることは可能だが、そのまま変更を加えることは出来ないのだ。そのかわり、オブジェクトは新しいバージョンを生成することによって更新される。結果として、ファイルベース・システムにとって頭痛の種である、排他制御とマルチユーザー・アクセスの問題は、オブジェクト・ストレージにおいては全く存在しない。「もし、複数のユーザーが同じファイル(オブジェクト)を一斉に更新すると、オブジェクト・ストレージ・システムはそのファイルの異なったバージョンを書き込むだけなのです。」NetApp社Data Lifecycle Ecosystemグループのバイスプレジデント、Tim Russellはこう語る。その場での更新をサポートしない、というシステム上の妥協案がかえって幸いして、オブジェクト・ストレージは分散ストレージと分散アクセスのための最適ストレージになっている。

 

冗長性:オブジェクト・ストレージは、同一オブジェクトのコピーを複数ノードに保存することによって、冗長性と高可用性を実現している。一つのオブジェクトが生成される時、オブジェクトは一つのノードに生成された後、一つ、またはそれ以上のノードにコピーされる。コピーされるノードの数はそれぞれの環境ごとのポリシーによって決められる。ノードは、同じデータセンター内にあることもあれば、地理的に分散していることもある。同一ファイルの更新をサポートしないことによって、複雑な仕組みなしでマルチノードにコピーを置く冗長性が可能になっている。従来のストレージ・システムでは、コピーされた(複製された)ファイルを複数のインスタンス間で同期をとることは、とてつもなく難しい課題だ。システムは非常に複雑になり、一定の遅延制約などの一連の厳しい制限なしには実現できないかも知れない。

 

 

 

 

プロトコルサポート:従来のブロックベース・プロトコルやファイルベース・プロトコルは、システムのパフォーマンスが良く、遅延が問題にならないデータセンター内では、有効に機能する。しかしこれらのプロトコルは、地理的に分散したアクセスや遅延が予測できないクラウドには向いていない。さらに、従来のファイルシステム・プロトコル(CIFSおよびNFS)は屋内ネットワークで有効なTCPポート上で通信を行っており、インターネットに晒されることはまれである。それとは逆に、オブジェクト・ストレージは通常、HTTP上のREST APIを経由してアクセスされる。HTTPに載ってオブジェクトに送られるコマンドは単純だ。putはオブジェクトの生成、getはオブジェクトの読み込み、deleteはオブジェクトの除去、listは複数オブジェクトの一覧表示、である。

 

アプリケーション・サポートおよび統合:従来のデータストレージ・プロトコルがサポートされておらず、REST APIへの依存が高いため、オブジェクト・ストレージをアクセス可能な状態にするには、従来のシステムと連携するための取り組みが必要になる。カスタムアプリケーションの他にも、いくつかの市販アプリケーション(特にバックアップとアーカイブ用アプリ)がオブジェクト・ストレージとの連携機能を追加している。オブジェクト・ストレージの対象となっているのは、主としてAmazon S3クラウド・ストレージである。業界が標準規格の合意形成に向けた格闘を続けているために、広範囲に散らばったオブジェクト・ストレージの統合は、まだわずかしか行われていない。通常、クラウド・ストレージ・ゲートウェイと呼ばれるオブジェクト・ストレージ・ゲートウェイは、オブジェクト・ストレージと通信をするための別な方法である。従来のストレージとオブジェクト・ストレージの間に置かれたゲートウェイは、通常あらかじめ決められたポリシーに基づいて、二つのストレージの間でデータをやりとりする。

 

クラウド機能:クラウド・ストレージとWeb2.0アプリケーションは、オブジェクト・ストレージの主要ターゲットであるため、インターネット上の共有アクセスに関係する機能は、それらと重要な関連性を持っている。マルチテナンシーと異なるユーザーを安全に分離する機能は、オブジェクト・ストレージ製品が会社内のネットワークを超えて使用されるために、必須の機能である。セキュリティは暗号化だけでなく、テナント、名前空間、オブジェクトへのアクセス制御を提供しなければならない。サービス内容合意書(SLA)の管理および複数のサービスレベルに対応する機能は、クラウドを使用する上で重要だ。オブジェクトのインスタンス数や各インスタンスがどこに保存されるべきかといった、複数のSLAの実行を支援するポリシー・エンジンは、オブジェクト・ストレージが製品として持っておくべき有用な機能である。さらに、使用量の計測、および課金の自動追跡機能もクラウドの使用において欠かせない機能だ。

 

適用事例:純粋なオブジェクト・ストレージは、データベースなどのように変更が頻繁に行われるトランザクションデータには向いていない。また、共有ファイルをアクセスするNASを代替するものとしても設計されていない。オブジェクト・ストレージは、一つのファイルの単一の「真」を保証するための排他機能とファイル共有の機構を持っておらず、その替わりとして、一つのファイルに対して、複数の異なるバージョンを提供する。オブジェクト・ストレージは、更新がほとんど行われない、非構造型データの膨大な拡張性を持ったデータ保存用途としては、有効である。同様に、トランザクション用ストレージ・ティアの先に置く、非アクティブデータ用増設ティア・ストレージ、あるいはアーカイヴ・ストレージにも向いている。クラウド空間においては、ファイルコンテンツ、特に画像や動画の保存に適している。「今日(こんにち)、オブジェクト・ストレージは、メディア、エンターテイメント、健康産業で見かけることのできる、ポスト・プロセス・タイプのデータの保存、そしてアーカイブ用途に適しています。しかし、パフォーマンスが増大し、機能が成熟するにつれて、オブジェクト・ストレージは、クラウド・ストレージ分散型IT環境を提供するようになるでしょう。」 Hitachi Data Systems (HDS)のシニア・プロダクト・マーケティング・マネージャーのJeff Lundberg はこう語る。

 

 

オブジェクト・ストレージへの様々なアプローチ

 

オブジェクトベース・ストレージは、次の3つのグループに分類することができる。

 

CAS:コンテンツ・アドレス・ストレージはファイルをカスタム・メテデータ付きのオブジェクトとして保存し、それらのファイルはニューメリック・オブジェクト識別子を経由してアクセスされる。強力なコンプライアンス機能付きディスク型アーカイブ空間として設計されたCASシステムは、通常、データセンター内に設置されるため、インターネット上の分散アクセスやマルチテナンシーなどのクラウド機能を必要としない。CASの市場は、Centera を持つEMCが支配してきた。エンタープライズ市場でEMCと競合している会社としては、Caringo Inc. などが挙げられる。CASベンダーが自分たちのハードウェアをクラウド・ストレージ・システムに仕立て直すには、既存のプラットフォームを拡張してクラウド対応機能を持たせるか、新たにオブジェクト・ストレージのプラットフォームを作成する、という方法がある。EMCは彼らのクラウド・ストレージ・プラットフォーム、Atmosで後者の方法を採った。Caringo は既存のCASシステムに手を加えて、現在では、Caringo Object Storage System と呼ばれている。Caringo はオブジェクト・ストレージ・プラットフォームのバージョン5以降、マルチテナンシーと1TBまでのオブジェクトをサポートしている。 「2012四半期に、我々はCloud Scalar を発表します。この製品は、REST対応のインタフェース、計測、拡張されたアクセス制御と割当機能、管理権限を持ったユーザーへのWebベースのポータル、などの機能によって、我々のクラウド・ストレージ・プラットフォームを拡張したものになっています。」Caringoのマーケティング部門シニア・ディレクター、Adrian Herrera はこう語る。

 

Dell Inc. のDX Object Storage Platform は、Caringo 製品をベースとしている。「DX Object Storage Platform は、Caringo が元になっていますが、我々は他製品との連携や、Ocarina 重複排除のような機能を通じて価値を付加しています。」Dellのデータ・マネジメント・マーケティング・ディレクターのBrandon Canaday はこう語る。

 

 

第二世代のオブジェクト・ストレージ・システム:その他大半のオブジェクト・ストレージ・ベンダーは、ゼロから自分たちのオブジェクト・ストレージ・ソフトウェアを開発している。安価な×86ベースのノードで動作するように設計されているので、各ストレージ・ノードは計算と保存の両方のリソースを提供し、ノードを追加するだけで、直線的に容量とパフォーマンスが増大する。オブジェクト・ストレージ・ソフトウェアは一般的にハードウェアを認識せず、緩やかに連結した以下のサービスから成り立っている。プレゼンテーション・レイヤーは、HTTPプロトコル(RESTまたはSOAP)経由でクライアントとのインタフェースを扱う。オプションとして従来のファイル・システム・プロトコルを扱うこともある。メタデータ・マネジメント・レイヤーは、どこにオブジェクト・データが保存され、ストレージ・ノード上でどのように保護・分散されているかを管理する。さらに、ストレージ・ターゲット・レイヤーはストレージ・ノードとのやりとりをつかさどっている。  EMCは自社のAtmos オブジェクト・ストレージ・システムを、それぞれ、仮想アプライアンス、ソフトウェアのみ、廉価版サーバーとJBOD付きのソフトウェア、という各種の形態で販売している。「Atmosの重要な点は、各追加ノードが、容量、計算、ネットワークのリソースを文字通り増やしてくれるところにあります。」EMCクラウド・インフラストラクチャー・グループ・シニアVPのMike Feinberg はこう語る。

 

2010年にNetapp はオブジェクト・べース・ストレージ・ソフトウェアの開発会社、Bycast を買収し、この技術が現在、NetApp StorageGrid の基礎になっている。NetApp は StorageGridソフトウェアをNetApp E-series ストレージ・システムと組み合わせ、オブジェクト・ストレージ・ソリューションを提供している。「StorageGrid は、E-series ストレージ・ノードでのRAID保護により、DRのための複数コピーに加えてローカルの冗長性を持つなど、いくつかの長所において、Atmosと同じカテゴリーに入ります。」NetAppのRussellはこう語る。

 

Amplidata は、同社のAmpliStor 製品は、オブジェクト・ストレージ製品として耐久性・拡張性・高いパフォーマンスを兼ね備えている、と主張する。「9桁を超える耐久性を実現し、RAIDコントローラーの後継となる独自コーデック、BitSpread テクノロジーと、キャッシュにSSDを利用した高パフォーマンス・ノードとの組み合わせにより、AmpliStorは1コントローラーあたり720MBpsのスループットを提供することができます。」AmplidataのプロダクトVP、Paul Specialeはこう語る。

 

Hitachi Content Platform (HCP)は、HDS(Hitachi Data Systems)ストレージとオブジェクト・ストレージ・ソフトウェアとの組み合わせにより、Hitachi NAS Platform(以前のBlueArc)やその他のHDSストレージ・システムと連携するオブジェクト・ストレージ・ソリューションを提供している。

 

 

クラウド対応スケールアウトNAS:オブジェクト・ストレージ・アーキテクチャーがベースにはなっていないものの、スケールアウトNASのノード追加によって水平的に拡張する機能によって、スケールアウトNASベンダーは。、オブジェクト・ストレージ市場でオブジェクト・ストレージ・ベンダーと競争することができている。CASシステムのベンダーと同様、スケールアウトNASベンダーは。、HTTPプロトコルのサポートなどオブジェクト・ストレージの機能を追加しているところだ。スケールアウトNASは、オブジェクト・ストレージの皮を被ったNASなので、屋内でのクラウド配備においては、純粋なオブジェクトストレージ製品よりも優位である。

 

 

オブジェクトの課題*訳注

 

今までになかったような拡張性と分散アクセスの組み合わせによって、オブジェクト・ストレージはクラウド・ストレージとWeb 2.0の世界で成功を収めることができた。企業のデータセンターでは、これらのシステムは、既存のデータ・ストレージを補完するアーカイブやファイル蓄積のストレージ・ティアとして配備されている。しかし、ブロックベース、ファイルベースのストレージが席巻しているストレージ市場おいて、オブジェクト・ストレージが占める割合は、まだほんのわずかだ。アプリ、既存ストレージ・システム、自分と同種のオブジェクト・ストレージ・システムとの標準化と連携が、今後の普及の鍵となる。

 

 

著者略歴:Jacob Gsoedlはフリーのライター兼業務システム部門取締役。

 

訳注:原文はOBJECT LESSON(実物教育)で、Object Storageと掛けている。

Copyright 2000 - 2012, TechTarget. All Rights Reserved,

 

*この翻訳記事の翻訳著作権はJDSFが所有しています。

このページに掲載されている記事・写真・図表などの無断転載を禁じます。