JEITAテープストレージ専門委員会コラム
「ビッグデータは本当にビッグになるのか?
- 災害データは永久保存すべきか? -
」
災害データは永久保存すべきか?
阪神淡路大震災、新潟県中越地震ときて東日本大震災。このところ立て続けに大きな災害が続いているが、そのたびに事前の準備が重要であることを思い知らされる。しかし万全な対策を準備するには過去のデータを記録、保存、そしてそれらのデータを統合的に分析していく必要がある。「東日本大震災復興構想会議」において策定された「復興構想七原則」の第一原則は、災害の記録を永遠に残し、それを将来に役立てる、という意味合いの文言が書かれている。そもそも46億年前に誕生したといわれる地球の動きなど、数百年で考えるのですら無理があるのかもしれない。それを考えると「永遠に保存する」というのも当然の帰結ではないだろうか。
事実、過去の災害の記録を長期に保管しようという試みは以前から行われてきた。古文書のような紙媒体や、石碑のようなものは数百年の風雪に耐えられるものではあるが、情報量はかなり限られる。ビデオ映像のような、非構造化データが主流となってきている昨今では「石」にそのデータを記録するのはかなりな難問のように思われる。当然記録データはデジタルメディアとなるわけだが、デジタルの歴史はここ70年程度、果たして数百年も保存できるのだろうか?
どんなデータを保存するか? オープンデータの活用
災害情報とひとくくりに言っても、かなり多くの種類のデータが考えられる。地殻変動関連の情報はもとより、気象データ、交通データ、通信記録データ、SNSデータ、といった情報も非常に有効活用できるデータである。
さらに今後は、公共のデータだけでなく、オープンデータの活用も重要になるだろう。例えば2015年に国内販売数が前年比4割増の60万台超となったドライブレコーダーの画像を災害アーカイブにアップロードして、それを合成分析することも可能だし、個別に管理している防犯カメラの画像や、個人の写真、動画も同様である。実は一部のスマートフォンのOSには、写真や画像を撮影した際の、日にち、時間だけでなくGPSの位置情報も記録されている。つまり画像データをマップ上に、時間ごとに貼り付けることが可能になる。これができるともしかしたら災害発生時の各地域の時間ごとの全体の変化が読み取れるようになるだろう。
一方では、個人や企業の保有するデータをオープンにするためには、プライバシー、著作権等についての課題も解決する必要がある。
永久は無理でも、ではいったいどれくらい?
そもそも現在コンピュータが世の中に現れたのが1946年(ENIAC)であるからまだ70年の歴史しかない。さらにデジタル記録メディアとしてUNIVACの1951年が最初で、これも65年程度。その間、コンピュータ用の記録メディアは、磁気テープに始まり磁気ディスク、フロッピーディスクやZIPディスク、そして今はフラッシュと移り変わっているが、50年前のメディアを読める機械を見つけるのは容易ではないだろう。ではせめて100年を目指してみてはどうか? 実際にストレージ団体としては世界最大のSNIA(Storage Network Industry Association)で100年アーカイブというテーマの研究をしていた。今でもLong Term Retention (LTR) Technical Working Group (TWG)ではデジタルデータの長期保管基準の策定を行っている。
100年できれば永久も見えてくる?
100年というのはあながち的外れではないかも知れない。というのは、100年の間にはデータ記録のテクノロジーも、メディアも大きく変わるからだ。実際70年の間にも、上記のように記録デバイスが、テープ、ディスク、メモリーと入れ替わってきている。当然その間には多くのデータコピー(マイグレーション)が行われてきたわけであるが、これを自動化できればデジタルデータの100年保存、さらには永久保存も可能になるのではないだろうか?このように、古い記録メディアから新しい記録メディアへのデータのコピーを自動化することで、使う側の人や、アプリケーションはそのメディアを意識することなく、永久にデータを取り出すことができる。現在この仕組みは多くのアーカイブソフトウェアで可能になってきている。例えばテープをファイルシステムとして扱えるLTFSという技術を利用したアーカイブソフトウェアであれば、今までのフラッシュや回転ディスクのストレージから、より低コスト、低消費電力で長期アーカイブに向いたテープストレージに移動することができる。それを繰り返すことで、デジタルデータを永久に残すことも可能になるだろう。
ジオスケールは天体クラウドで
これらのデータの保存先はどこが良いのだろうか。永遠アーカイブであるからアクセス時間よりは長期に、安全に保存できることのほうが重要だ。当然クラウドというのも選択肢として出てくるが、それも複数サイト、場合によっては日本国外も考えたほうが良いだろう。これをオブジェクトストレージの世界では「ジオスケール」と表現することもあるが、さらに言えば地殻変動の影響を受けない空中や、宇宙空間、つまり、ドローン(無人飛行)や人口衛星の内部にデータを分割して保存するというのも今後は出てくるかもしれない。それには今後期待されている、次世代の不揮発性メモリー(NVRAM)のような低消費電力、かつコンパクトで軽量な記録媒体の出現がカギとなる。
日本ヒューレット・パッカード(株) 井上 陽治
ビッグデータは本当にビッグになるのか? - IoT時代のPANって何? -
ビッグデータは本当にビッグになるのか? - 農業とIoT 最先端米国から学ぶ -
ビッグデータは本当にビッグになるのか? - つながる車、IoVからのデータはどれくらい? -
ビッグデータは本当にビッグになるのか? - 1日1PBの動画の保存先 救世主はフラッシュではない? -
ビッグデータは本当にビッグになるのか? - ダボスより 自動運転はどこまで進むか -
ビッグデータは本当にビッグになるのか?- 2016年に2030年のICTを占う -
次 回のメルマガが配信された時点で記事にリンクが張られます。
メルマガ登録する と次回から最新記事を読むことができます。
メルマガ登録は無料、非会員でも登録で きます。登録はこちら