JEITAテープストレージ専門委員会コラム

「テープアーカイブの可能性」



最近、人工知能を見かける機会が増えてきました。2022年11月にChatGPTが公開されたのも記憶に新しいですね。

ChatGPTはチャットボットなので、文章で質問をすると文章で回答してくれます。
筆者も試しに「テープストレージについて教えて」と質問してみました。
すると、自然な文章で磁気テープの材料であるフィルムの磁性体やシーケンシャルアクセスに最適、などといったテープストレージの特徴を的確にとらえた回答を得られました。人工知能が自動的に生成したとは思えない文章で回答を得られたことに驚きを覚える一方、「データ破壊が困難であるため、セキュリティ対策として有用」といった一部誤答と思われるような内容も含まれていました。
ChatGPTは回答に納得がいかなかった場合に再度回答を生成できるので、もう一度実施してみたところ、内容が訂正されより精度の高い結果を得られました。
回答の精度は学習用のデータの量に依存しているようです。「テープストレージ」のようにデータが豊富にある質問内容であれば精度の高い回答を返しますが、それほどデータのない対象に関する質問だと文法こそ自然なものの、かなり見当違いの回答することもあります。
人工知能チャットボットはテキストデータを元に学習するので、膨大な学習用のデータを用意したとしても、全体の容量はそれほど大きくはないでしょう。
しかし、世の学習用のデータは必ずしもサイズの小さなものばかりではありません。
たとえば、画像や動画がそれにあたります。
また、将来人工知能のエンジンがより高性能なものに置き換えられた場合、一度学習させたデータでも異なるよりよい成果物を得られる可能性があり、使用済みのデータでも保管しておく価値があります。
画像や動画といったサイズの大きなデータだと保管するための大容量のストレージを用意しないといけません。
そういった普段使用しないコールドデータを保管するストレージには容量が大きいだけでなく、保管時にコストがかからないことも要求されます。
そのコールドデータの保管先として選択肢に挙げられるのがテープストレージです。テープストレージはバックアップで用いられることが多いですが、 アクセス頻度の低いコールドデータのアーカイブ先としても使用できます。テープストレージは最新のLTO-9で一巻あたり18TBまでデータを格納でき、 2022年に更新されたLTOロードマップではLTO-14で一巻あたり576TBとなることが予定されています。
途方もない容量に感じますが、このロードマップは媒体ベンダの実証実験の結果を元に策定されており、決して実現不可能ではありません。また、コストの面でも優れています。
容量単価は各種ストレージの中で最も安価であり、かつデータ保管時に通電する必要がなく他のストレージ製品に比べて消費電力を大幅に削減できます。
人工知能は学習用のデータを用意した分だけ性能が上がり、より精度の高い結果を出します。
現在生成されているデータを利用するだけでなく、過去に生成されたデータも利用することができれば、人工知能からより精度の高い結果を引き出せます。 そのためには将来利用できるか分からないデータでもどこかに保存しておく必要があります。常に生成され続けるデータを将来にわたって保管するには、 記憶容量単価や省電力などTCOが低く大容量なストレージが要求されます。これらすべてを満たすのはテープストレージです。
今後、人工知能の活躍がますます見込まれる中、学習用データの保管先としてテープストレージをご検討されてみてはいかがでしょうか。

一般社団法人 電子情報技術産業協会(JEITA) テープストレージ専門委員会
http://home.jeita.or.jp/cgi-bin/about/detail.cgi?ca=1&ca2=292

本内容にてご質問などございましたら、JDSF事務局経由でお願いいたします。

INDEX:
リンクが張られていない、タイトルだけの記事は、最新号のメルマガ記事です。
次回のメルマガが配信された時点で記事にリンクが張られます。
メルマガ登録すると次回から最新記事を読むことができます。
メルマガ登録は無料、非会員でも登録できます。登録はこちら