サイコロが人とAIを振り分ける

 サイコロの各目の出る確率を考えるとき、人間は何度も繰り返しサイコロを振らなくても、極端な話、一度もサイコロを振らなくても、それぞれの目が出る確率が6分の1であることを見抜くことができる。これを「直観」と呼んでいる人も多い。少数のデータから答えを見つけ出すことと言い換えてもいいだろう。以前、統計に基づく処理を行う自然言語処理では、大規模な集団のマクロな傾向は分析することができても、個別の人間の特性を推定することは難しいということについて触れたことがあった。

plousia-philodoxee.hatenablog.com

 

 これに対して、もしも人工知能が同じ問題に対処するとしたら、とにかくサイコロを実際に振ってみて出た目のデータを処理して統計的に6分の1という確率を弾き出す。だからもしも一度もサイコロを振らなければ、或いは少ない回数のデータしかなければ、人工知能は統計が使えないから、サイコロの出る目の確率を正しく答えることができない。この意味では人工知能には直観がない。

 ただし、確率を計算するための大量の結果だけがわかっている場合には、人間が計算しても人工知能が計算しても大した違いはない。人間が人工知能と同じ確率をちゃんと計算できたとしても、どうしてその確率になるのかという「メカニズム」の方はわからないからだ。サイコロの場合であれば、サイコロの面の数は6面あって、それぞれの面が上にくる確率は互いに等しいとすぐに見抜くことができたから、一度そのメカニズムさえわかれば答えを出すのは容易かった。

 すると、直観というのはメカニズムを見抜くことと何か関係があるのかもしれない。ここで「関係がある」という断言を避けているのは、少なくとも私個人の場合、何かが直観的にわかったという場合、メカニズムがわかっている場合と、わかっていないけれどもなぜか答えはわかるという場合の両方があるように思えるからだ。IQテストのようなパターン認識系の問題の場合なら、メカニズムがわからなければ原理的に解けないようになっているから、直観とメカニズムの認識は不可分に結びついている。しかし、例えば街中を歩いていて、「なんとなくこっちに行った方が近道だという感じがする」というような場合には、メカニズムはよくわからないまま直観だけが生まれている。

 「ディープラーニング」(深層学習)の研究が進み、人工知能が大量のデータから何らかの「特徴量」を取り出すことができるようになった。それは人間がこれまで「意味」と呼んでいたものと同じなのではないかと考える人もいる。サイコロの例でいえば、人工知能もサイコロが6面あるということを大量のデータから理解することができるようになったという風にいえる。しかしそのためには「大量のデータ」が必要なことは変わらない。量を質に変えるためには、そこが前提条件だ。だから逆に、少数のデータから特徴を取り出すことは相変わらずできないままだ。

 いまここに、十分な量のデータがそろっていれば、人工知能の方が早く正確に答えを出すことができるかもしれない。しかしデータの量が少ししかなければ、人工知能は早く間違った答えを出す可能性が高い。データの偏りが原因である可能性もあるが、何よりも少量のデータからメカニズムをつかむことが、機械学習では不可能であるからだ。たとえばここに普通の6面サイコロと、8面サイコロの二つがあり、それぞれ10回ずつ振ってみたとする。どちらも1〜6の目しかでなかったとしたら、人工知能は6面サイコロと8面サイコロを区別することができない。人間ならば、一目見ればたちどころに両者を区別できる。これが10回でなく、100回とか1000回のデータであれば、8面サイコロの方で7や8の目が出るはずだから、人工知能の方も両者を区別することができる。 

 GoogleAmazon検索エンジンや広告表示、おすすめ商品の表示の改良に機械学習を導入している。ということは大量のデータを必要とする。私個人の検索要求を正確に理解するために、私のすべての検索要求の履歴と、協調フィルタリングにおいて何らかの意味で私と「似ている」と判断された別の利用者の検索要求のデータ、そして世界中の厖大な数のネット利用者の検索履歴のデータを参考にして、私に特化した検索結果を表示する。

 少数のデータから正しい答えを導き出す方法を、人工知能たちはまだ知らない。*1

*1:アニメ「あの日見た花の名前を僕達はまだ知らない。」(通称「あの花」)のもじり