JEITAテープストレージ専門委員会コラム
「ビッグデータは本当にビッグになるのか?1秒間に1PB!? 世界の英知が選んだストレージとは? 」

 

スイスとフランスの国境をまたぐ地域に、2つの研究地区を持つCERN。地下には 全周 27km の大型ハドロン衝突型加速器 (LHC) が、国境を横断して設置されている。ヒッグス粒子を発見したのもこの施設である。
さかのぼれば彼らは実に大きな発明も過去にしてきている。今やなくてはならないHTML 、HTTP、 World Wide Webもここが発祥だ。ネットの時代、さらには現在のビッグデータ時代や今後のIoT時代も、これらの発明がなければ存在しなかった! 世紀の大発明である。

 

1秒間に1ペタバイト!?

さて話を戻すと、CERNの大型ハドロン衝突型加速器 (LHC)で生成されるデータは何と、1秒間に1PBにもなる。そのデータを高速に記録し、かつ長期に安全に、さらに重要なことに省エネルギーかつ低コストで保存する必要がある。過去の実験データは二度と再現できない可能性もあるし、1回の実験では莫大な費用を要するからだ。 そんな世界の英知ともいえる彼らが使っているストレージとは、いったい何なのだろう?

 

ベストな選択はテープ

そんな貴重なデータを保存するストレージとして彼らが選んだのは、磁気テープである。世界で最初のデジタル記録媒体である磁気テープは、今から60年以上も前の1951年に登場した。そんな古いテクノロジーをなぜ世界の技術の先端を行っているかれらが選ぶのか? その理由をCERNのエンジニアはこう語っている。

 

なぜテープを選ぶのか?

CERNの研究者の答えは以下の4つに集約される。

1.低コスト、低消費電力

磁気テープはコストが安いだけではない。コストには電力量も含まれる。テープは使わないときは電力を使わない。このことは、とてつもない量のデータを長期に保存する必要がある彼らには非常に重要である。

 

2.信頼性

ディスクが破損したときはその都度、大量の、テラバイトクラスのデータが失われる。テープの場合は一部が読めなくてもその量は数ギガバイトにとどまるケースが多く、さらにいうならば、テープは30年以上のデータ保存が可能であるといわれている。ディスクの場合は残念ながら長期保管には向いているとは言えない。

 

3.セキュリティ

世の中で起きるデータロスのほとんどは、オペレーションミスや、ハッキング、内部関係者による人為的なものといわれている。それはおそらく防ぎようがないのだろう。CERNに保存される大量のデータをすべて消し去るには、テープだと何年もかかる。一方ディスクの場合は数秒だ。

 

4.高速性

一般的にテープはシーケンシャルデバイスであるがために、記録速度が遅いと勘違いされているケースが多い。実はそれはレイテンシー(データアクセスまでの時間)の話で、スループット(実際にデータを転送する速度)は極めて速い。さらにテープには、ライトした直後に別のヘッドでデータを読みオンザフライ(即時)に確認できる技術が盛り込まれている。書きっぱなしではなくリアルタイムに記録できたかどうかを確認しているのだ。

 

世はビッグデータ時代、2020年には44ZBにもあるといわれるデジタルデータ、いったいどれくらいの量が長期に保存されるのだろうか?筆者はその多くのオリジナルデータ、特に非構造化データは半永久的に保存されるとみる。Data as a Service (DaaS)が本格的に立ち上がる今年から、そのインパクトはパブリッククラウドサービスにとどまらず、多くの企業が恩恵をあずかり、また逆に独自のデータでビジネスを革新したり、展開できるようになるかもしれない。いったいどこまで膨れ上がるのかこのデータは? すでにハイパースケールなデータを低コストに、長期に、さらに安全に保存することに成功している、世界で最も頭のよい人たちの英知を参考にしてみるのはいかがだろうか?

 

 

一般社団法人 電子情報技術産業協会(JEITA) テープストレージ専門委員会
日本ヒューレットパッカード(株) 井上 陽治
リンクが張られていない、タイトルだけの記事は、最新号のメルマガ記事です。
次 回のメルマガが配信された時点で記事にリンクが張られます。
メルマガ登録する と次回から最新記事を読むことができます。
メルマガ登録は無料、非会員でも登録で きます。登録はこちら