どの範囲から何を引き出すか
自分の頭とシステム上の記録
「どの範囲から何を引き出すか」というのはけっこう難しい問題で、自分自身はどうかということを振り返っていくつかに分類してみると、次の5つが思い浮かぶ。
①ネット全体から(検索エンジン)
②自分が保存した特定のデータ全体から(Evernote)
③アプリ内のすべてのコンテンツから(Twitterやブログ、Youtube、Amazonなど種類は多岐にわたる。ちなみにFacebookでできる検索はユーザーとFacebookページのみなので、ここに含めない。)
④自分の脳内から(日常生活の多くの場面)
⑤その場にいる人の脳内から(職場や会議の場面)
引き出すときに個人の能力が問われるのは④と⑤である一方、①~③はそれを提供する企業の能力が問われると考えられがちである。しかし①の場合、過去に検索したことを自分が忘れてしまったら、同じことを再度調べるのはなかなか困難になってしまう。短時間で解決できる問題に関して何かを調べているのなら、引き出すのは一度でかまわないかもしれないが、長時間じっくり取り組まなければならないこととなると、忘却というのは致命的だ。②はそもそも自分が何を保存したか、保存するときにどんなタグを付けたかなどの要因も絡んでくる。
記憶力とは、実際には「記憶する力」ではなくて「記憶したことを引き出す力」のことであるという視点から①~⑤を捉え直すと、引き出す役割を担うのは①~③ではコンピュータのアルゴリズム、④、⑤では脳内のニューロン同士のつながり(ニューラルネットワーク)といえる。
時間
さらにここに短期と長期という時間の長さも絡んでくると、引き出すのが人間の仕事である④や⑤はもちろん、たとえ引き出すのが人間ではない①〜③でも、長期的には「私は過去に何を調べたか」ということをその人自身が覚えていなければならない場合がある。①なら検索履歴をみれば何を調べたかはわかるが、②〜⑤にはそういう機能がない。リマインダーという補助手段を活用する手もあるが、リマインダーはリマインダーとして別個になっているため、調べるたびに検索エンジンやSNSと連携しなければならず、面倒である。
検索エンジンの基本を振り返る
色々な人が書き込んだことの中から自分が探していることを引き出すというときに、検索エンジンといえばGoogle、Bing(msn)、NAVER、Dolphinなど、アルゴリズムはいくつかしかない。
(a) ディレクトリ型→エディタと呼ばれる人たちが、ウェブサイトを精査してカテゴライズし、登録していく。ロボット型に比べてサイトの登録数が少ないが、サイトの質が高いとされる。
(b) ロボット型→クローラ(スパイダー)と呼ばれるロボットがネット上の様々なサイトの情報を持ち帰って登録していく。処理能力はディレクトリ型に比べて格段に高いが、企業によるSEO対策により、ユーザーの希望にそぐわないサイトが表示される場合もある。
の2種類がある。ロボット型のGoogleのアルゴリズムについてはアルゴリズム – 検索サービス – Googleで詳しい説明がある。ここで関係しそうな部分を引用する。
今日の Google のアルゴリズムは、本当に探している情報を推測することを実現する 200 を超える独自のシグナル、つまり「手がかり」を利用しています。これらのシグナルには、ウェブサイト上の語句、コンテンツの新しさ、お住まいの地域、PageRank などが含まれます。
Pagerankのリンク先はGoogle創設者の二人、サーゲイ・ブリンとラリー・ペイジのスタンフォード大学時代の論文である。なお現在はこの論文に書かれた内容からアルゴリズムはかなり修正・改良されている。
過去に何を引き出したかを記録した履歴によって、検索エンジンにおける検索結果は変わってくる。この点では自分が過去に検索したことのない単語や、ウェブ上で過去に触れたことのないコンテンツが、これからの検索結果に影響することはない。特定の企業が提供する検索エンジンのアルゴリズム自体は単一で、その企業がそのとき採用しているものに限られる。アルゴリズムが改良されることはあっても、「あるもの」が別の「あるもの」に変わるだけで、数が増えるわけではない。もちろんユーザーの側は、ブラウザを変えることで同じ単語でも検索結果が変わってくることがありうるが、ある単語を複数のブラウザで同時に検索する人間などほとんどいないだろう。
結局は引き出す人間にとって快適であることが重要である。引き出すには整理が欠かせない。この「整理」ということをテーマに、以前記事を書いた。
plousia-philodoxee.hatenablog.com
結局どれが一番効率的か
それでは短期と長期とを問わず、誰もが必要なときに必要なものを最も効率良く引き出すしくみというのは
A:コンピュータのアルゴリズム
B:ニューラルネットワーク(とその集団レベルでの協調)
C:それ以外の方法
のどれだろう。今の私にはそれについて答えるために考える手立て、ないしフレームワークのようなものがない。これから何らかの指標でこれらを比べ、どれがベストかということを決められるようにしたい。なぜなら何かを引き出す方法について考えることは、以前からの私の関心である、世論の形成や変化、集団による情報処理と深く関係するテーマであるからだ。