読者です 読者をやめる 読者になる 読者になる

玉石混交の単位

27歳 コミュニケーション ジャーナリズム ビッグデータ メディア 思想 情報科学 日常 東京 歴史 言語学 政治学

 「ネット上の情報は玉石混淆だ」としばしば言われる。専門家も素人もネット上にいろいろなことを書き込むためにこういう言われ方をするようになる。インターネットが登場して以来、この「玉石混淆」という形容が使われるようになってからもうずいぶん経ち、その間もネット上の情報は増え続け、今でも情報は凄まじいスピードで増え続けている。そして今後も増え続けるだろう。

 以前にどこかで読んだが、人間が発話で作る文(sentence)というのは、これまでに世界で使われたことのない文であることがほとんどであるそうだ。この情報のソースを確認しようとGoogleを使ってみたが、うまく調べることができなかった。これにはこの現象を形容する適当なラベル(そのほとんどは「名詞」(noun))が存在しないためだろう。

 検索エンジンというのは基本的に「名詞」向けに偏って設計されていると私は思う。検索ボックスに何か単語を打ち込むとき、そのほとんどは名詞だろう。そして、検索者のほとんどが名詞ばかりで検索をかけるから、名詞に関する検索の質は高まっても、その他の品詞を使った検索要求に対する回答の質は向上しにくいという偏りが生まれる。この偏りは、Googleが意図して生みだしたものであるかどうかということとは関係ない。人間がただ検索を実行しているだけで自然と生まれてしまう類の偏りだ。だから却っていっそう厄介だと思う。

 人間は物を考えたり表現したりするときに、名詞だけでなく、特に形容詞(明るい、美味い、キモいなど)や副詞(マジ、とても、早く、効率良くなど)をよく使うが、それらを検索語句として正確な検索を実現させることはまだまだ難しい。「おしゃれな服」と打ち込んだところで、検索結果で表示されるのは、自分が考える「おしゃれ」とは食い違った「おしゃれ」ということになるだろう。それはイーライ・パリサーが指摘する「パーソナライゼーション」が進もうと同じことだ。

 話が逸れてしまったので元に戻そう。この「新しい文を作る」現象について、自分自身の今日一日を振り返ってみると、「おはよう」とか「ありがとう」とか「さようなら」というような定型表現を除いては、確かにほとんどの文はこれまでに自分が使ったことのない文であると感じる。これについて、「ひとつひとつがオリジナル」というキャッチコピーを与えてもいい。こういう意味では私は今日、特に意識もしないままに世界に対して新しい情報をいくつも提供したことになるわけだ。もっとも「情報」という言葉には注意が必要で、いま「情報が増え続けている」と書いたのは単にデータ量のことを指している。もう少し違った意味で情報という言葉を使うこともできる。

 たとえばプラグマチックに考えるならば、それを手にした個人や集団に何らかの行動の変化をもたらすものを情報と定義することができる。例えば今日、どこかで誰かがが「太陽が東から出て西に沈む」という普遍の事実を自分のブログに書いたとして、それが誰かの行動に変化をもたらすとは限らないし、そういう情報は既にネット上に存在しているだろう。だからこれは「情報」とはいえない。

 このように考えると、ネット上では情報はそれほど増えていない。毎日毎日、芸能人や著名人のブログ記事や大手新聞サイトの記事や、SNS上の個人の投稿など、次から次へと新しい文章が山のように投稿されているが、誰かの行動を本当に変えるような文章というのは少ないものだ。ライフハック系の記事などは、ニュースキュレーションアプリでどんどん出てくるが、私の行動に変化をもたらすものはそれほど多くはない。

 さしあたってこの記事では、「情報」という言葉について、プラグマチックな意味での定義を採用して論を進めることにする。「玉石混淆」という表現が使われるとき、それはある特定のサイトの中の複数の文章に対してであったり、ネット全体に対して使われていることが多い。しかし考えてみると、玉石混淆という言葉は、ある一つの記事の中でいい部分と良くない部分があるという意味で使うこともできる。特にその文章が大部なものである場合には。

 さてそれでは、玉石混淆という言葉をどの単位に対して使うかについて、上の二つに準えたケースを考えてみよう。

Case 1:ある二つの記事について、一方は良記事で他方は悪記事である場合

 仮に良記事のURLをhttp://abc.com/article1822533(= URL X)とし、悪記事の方をhttp://xyz.jp/minorcats/104423(=URL Y)とする。こういう場合、検索エンジンは問題なく機能する。良記事のあるページ、つまりURL Xを上位に表示し、悪記事、つまりURL Yをなるべく下位に表示するようにランキングのアルゴリズムを調整すればいいという話だ。これは検索エンジンが当初からやっていることであって、特に珍しくもない。

 

Case 2: ある記事の文章の内部で、良い部分と悪い部分がある場合

 この場合、いい部分も悪い部分も同一のURLに対応する文書として存在するために、既存の検索エンジンでは同一の単位として評価されることになる。同一のURLの内部で良い部分だけを切り取って上位に表示し、悪い部分は別にして下位に表示するというようなアルゴリズムは今のところ存在しない。少なくとも私はそういう検索エンジンを見たことがない。

 それではこちらの意味で「玉石混淆」が使われている場合には、私たちはまだ、自分の頭で内容の良し悪しを判定しなければならず、そのためにはどうしても良いものと悪いものの両方をチェックするはめになる。情報が増え続ける毎日の中、限られた時間の中で、これを実行するのは中々難しい。

 私たちは少なくとも名目的には民主主義を掲げる社会に暮らしている。だから社会で起こる様々な問題についてある程度の関心を持っているということが市民の義務のようなものとして求められる。もちろんこれには限界があって、私たちが議員を選出することによって、彼らに重要な議論や意思決定を代行してもらっているわけだが、どの議員を選ぶべきであるかという問題はどうしても残り、その問題に対処するときには、ある政治なり経済なりの問題について、自分なりの考えを持っていなければ、その問題について特定の政治家の判断が妥当であるかどうかということを正当に評価することはできない。

 結局私たちは、代議制というシステムを採用していても、自分たち自身である程度公共の問題について考える必要性から解放されることはない。そしてこの問題について考えるにあたって、メディアは重要な役割を担い、そのメディアの中ではいろいろな人間が日々あれこれといろいろなことを書いている。それらのすべてに目を通すということは、専門家や評論家などを別にすれば実質的には不可能であるといってよい。大量の文書をうまくまとめて整理する人間が現れる。或いは最近ではそういうものをまとめるサービスも出てくる。しかしどれもしっくりこない。

 「玉石混淆」という言葉の用法についての考察を通して、「公共の問題に対処する大衆の判断能力を担保するにはどうするべきか」という問題への対処法を見出したいと思う。それは別の言い方をするならば、「知りたいこと」と「知るべきこと」の線引きの問題でもある。