インターネットで検索されやすいのはやっぱりテキストデータだと思う

シェアする

image

インターネットに関する技術の進歩は衰える気配がありません。技術の進歩と共に次々と新しいサービスも開発されています。インターネットで扱われるデータも、黎明期はテキストデータが主流、やがて画像データや簡単な動画、そして音声データや本格的な動画データへと変わってきています。しかし、いくら新しい技術やサービスが開発されても主流はテキストデータだと思います。

スポンサーリンク

インターネットを使う情報発信は、膨大なデータ量に埋もれて伝わり難くなっている

インターネット上に存在するデータは膨大で今も増え続けています。どれだけ凄い量なのかというと、例えば現在発見されている人類最古の壁画が約4万年前、インターネットが普及し始めた1970年とします。少し古いデータですが2011年の1年間にインターネット上に流れたデータ量は、インターネットが普及するまでの4万年分の1921万倍と言われています。つまり人類が4万年かけて生産した情報量がわずか2秒足らずで生み出されています。

これだけの膨大な情報量の中から必要な情報を効率良く引き出す仕組みとして検索エンジンが産み出されました。とにかく増え続けるデータに埋もれてしまわないよう現在も進化を続けています検索エンジン黎明期の対象はテキストデータでしたが、最近のインターネット利用で見るとシェアを伸ばしている動画データや音声データの検索サービスも始まっていますが、検索精度とコストパフォーマンスという点ではテキスト検索にはまだまだ及ばないと思います。

ふと考えたのですが、テキストデータ、音声データ、字幕の動画データ、同じ内容として比較した場合、一番扱いやすく探しやすいのはやはりテキストデータだと思いました。例えば利用者が求めている情報はデータのどの位置にあるかわかりません。それは先頭かもしれないし後半かもしれません。でもテキストデータなら文章のどの位置にあるか問題になりません。でも音声データや動画データは、データの特性として基本的に先頭から聞いたり見たりしなければなりません。しかも再生速度は再生する装置側に依存します。でもテキストデータなら読み手しだいで「速読」という技も使えます。つまり効率よく情報の収集と把握にはテキストデータが一番、まさに一目瞭然と言えます。

インターネットコンテンツのビジュアル化が進んでいますが、それでも基本はテキストデータだと思います