ITアーキテクトのひとりごと
第45回 「ソーシャルとビッグデータ」
ソーシャルって何?
ソーシャルという言葉が使われる代表的なサービスはSNSだ。SNSに蓄えられているデータはどのくらいの間、システムに蓄えられているのか。Facebookではサービス利用を止めてもいつまでもデータを蓄えているらしい。ちょっとそれも困ったもんだとは思うが、人が死んでしまっても、そんなことにはお構いなく蓄えてくれるとしたら、ちょっとしたフリーで使えるモニュメントのようなもので便利だ。「俺の爺さんのブログ、いまでもFacebookで見られるんだ。子供の頃のことですっかり面影を忘れてしまったけど、お墓参りのつもりで、時々Facebook見るんだ」なんていう時代が来るのも面白い。
ストレージシステムのGB単価は下がり続けているので、コストの問題は大きくないはずだとすると、いつ棄てるのかは重要ではない。
ビッグデータの分野では、た くさんデータがあればあるほど、その分析精度があがる、今まで知らなかったことがわかるという噂。たくさんあればあるほどよい(かもしれない)というのはIT業界の利益誘導の臭いがするし、知らなかったことが分かるかのような話も少し人を馬鹿にしたような響きがする。
これらのビッグデータの分析は、すでに終わってしまった事柄を分析したにすぎない。傾向に大きな惰性があるならば、予測にも役立つが、惰性がない現象にビッグデータの分析手法を使っても、随分と刹那的な行動を引き起こすだけだ。1秒でも0.1秒でも速い方がよいという刹那的な行動はカタストロフィッ クな事象と混乱を引き起こす。
今起こっていることを理解することができるかのような話もちょっと嘘っぽい。いま発生している事象をリアルタイムで理解のレベルまで持って行くなんていうことは、予測、予見しておかないと無理だ。
クオリティを無視したデータの蓄積が行われないことを祈るが、もし行われたとしてもコストの問題を引き起こさないとすると、棄てるタイミングは、会社が潰れた、サービスが無くなった、無意味であることが立証されてしまった、環境保護団体から電気の無駄使いだと批判された、天災が発生した、そして、間違って消してしまった時だ。
この中で一番確率が高いのは、間違って消してしまった、という事象だろう。システムの故障よりも人間が間違う確率が遙かに高いことは事故例で証明されている。人間の記憶が自然と薄れ、まだら模様で消えていくのと違って、ITシステムに蓄えられた記憶は、ある日突然、大量に無くなる。
蓄えるべきデータは何なのかを評価する仕組みが必要な時代だ。劣化しないITストレージ内のデータをどのように整理整頓、掃除するのか。その気になれば幾らでも大量のデータを未来永劫記憶していくことができる時代にふさわしい新しい記憶の仕方って何だろうか。地球に隕石が落ち、電源を失ったITシステムが大量絶滅する日までデータは増え続ける。恐竜は化石を残したが、ITシステムは何も残せない。
株式会社エクサ 恋塚 正隆