ソーシャル物理学と自然言語処理の立場の違い
少し前の記事に書いたように、最近は自分の関心がコンピュータ科学の領域に絞られてきた。
plousia-philodoxee.hatenablog.com
そこで人工知能に関する書籍のうち、いわゆる「人工知能は人類を滅ぼす」というような思想方面の書籍は避け、機械学習やディープラーニングの意味について一般向けに解説した本などを中心に集めて読んでいった。
人工知能、ディープラーニング、機械学習についてまとめ
1冊目は松尾豊さんの著書。「ディープラーニング」(深層学習)の発見に至る人工知能研究の変遷と、それがもたらしたブレークスルーとはどんなものか、そして日本の人工知能研究の現状と将来という形で論が進んでいく。人工知能に関する特集が色々な雑誌で組まれ、その中でしばしば松尾さんが登場するが、基本的には
①日本の人工知能研究は世界的に見ても層が厚く、学会には全国から多様な出自をもつ人材が集まる状況であり、閉塞感の続く日本経済の突破口として人工知能を積極的に活用していくという方向性を提案している点
②人工知能研究に携わる専門家がしばしば問われる「人工知能は人類を滅ぼすか」という議論については、わざわざ人類を滅ぼそうとするような欲求を埋め込むような研究者がいるとは思えないし、またそれは技術的に考えても難しいという点から懐疑的な立場をとるという点
③人間の知性を構成的に再現することを人工知能の定義と考えるならば、神経回路による脳内の情報処理はコンピュータで再現できないはずがないので、人工知能の実現は原理的には可能なはずだと考えている点
の3点を中心に議論を展開している印象だった。
2冊目は人工知能が現在どのような業界でどのように活用されているのかの具体例の紹介と、「文系にもわかる人工知能の基本のき」のような難易度の内容の特集も詰まった日経ビッグデータのムック。 機械学習やディープラーニング、ビッグデータなど、この分野のバズワードを中心に解説している。
この1冊でまるごとわかる! 人工知能ビジネ ス(日経BPムック)
- 作者: 日経ビッグデータ
- 出版社/メーカー: 日経BP社
- 発売日: 2015/08/29
- メディア: 単行本
- この商品を含むブログを見る
機械学習やディープラーニングの研究については、Twitterでそれらしい情報を発信するアカウントを探してフォローしたり、Yahoo!ニュースやNewsify、Right Relevanceなどのキュレーションサービスでキーワードを登録してフィードを取得したりすることで情報を集めている。研究を紹介する記事を読んでいると、
①ルールが明確に決まったゲーム(オセロやチェス、将棋など)の戦略を学習させるもの
②画像認識を学習させるもの
③Twitterやブログ上の投稿をもとに自然言語処理を行い、より効率的な広告を表示させるもの
などをよく見かける。一企業が人工知能や機械学習、ビッグデータを活用している場合には、どんな応用をしているかということは明らかにされても、その背景にある技術的な側面については明らかにされないことがほとんどだ。この辺に自分の会社の情報はなるべくクローズドにしようとするインセンティブがはたらく市場経済のもったいないところが見え隠れしていると個人的には思うのだが、まあそれはまた別の機会に書こうと思う。
ここから本題。自然言語処理と社会物理学について
さて自然言語処理の基本的な立場は次のようにまとめることができる。わたしたち人間は言葉を使う生き物だ。だからわたしたちがどんな言葉を使っているのか、そこにどんなパターンが存在しているのかを分析すれば、おのずと私たちはどんな行動をとるか、どんな風に考え意思決定をするのかなどについて正確に予測できるようになるのではないか、よしそれではTwitterやブログの投稿を見てみよう…と。
これはこれで面白い。しかし私たちが使う言葉は私たち自身の内面を正確に反映している保証はどこにあるのだろうか。
一方で最近『ソーシャル物理学』という本が出た。これは日本では「社会物理学」と呼ばれている分野に分類できる内容を扱っている。
ソーシャル物理学:「良いアイデアはいかに広がるか」の新しい科学
- 作者: アレックス・ペントランド,矢野和男,小林啓倫
- 出版社/メーカー: 草思社
- 発売日: 2015/09/17
- メディア: 単行本
- この商品を含むブログを見る
原著はこちら。
Social Physics: How Social Networks Can Make Us Smarter
- 作者: Alex Pentland
- 出版社/メーカー: Penguin Books
- 発売日: 2015/01/27
- メディア: ペーパーバック
- この商品を含むブログを見る
著者は以前に『正直シグナル』という本を書いたアレックス・ペンドランド。軽く調べたところでは、どうもこうした分野の人々からは「サンディ」という通り名で呼ばれているらしい。たまたま去年に原著の『Socialphysics』を読んでいたところだったので、感激して翻訳の方も買ってしまった。この本についてはHONZにレビューがある。
しかも2つ。
一つは私と同い年のHONZレビュアーである冬木糸一さんによるもの。
もう一つは日立の中央研究所主管研究長である矢野和男さんによるもの。
二人の文章を比較すると、力点の置き方の違いや論の展開の方向性などが異なっていて、面白い。冬木さんはデータドリブン(彼はこれを「データ駆動型」と表現する)な社会の方向性について、本の構成に沿って個人→組織→都市へとデータの活用される範囲を拡大していく方向で論を進め、一方で矢野さんはやはりご自身の専門であることもあって、研究上の文脈や自身の研究との関連性、どんな影響を受けたかといったことに触れつつ、著者のペントランド教授の研究上のこだわりや一貫した立場なども交えて論を進める。
意識的に残すデータと無意識に残してしまうデータ
さて今回の記事と関係するのはどこかといえば、ソーシャル物理学、或いは社会物理学における研究上の基本姿勢の部分だ。社会物理学では自然言語処理と異なり、「言葉」ではなくもっと別のデータに注目する。
「いつメールを送ったか?」
「1日に何通送ったのか?」
「どの時間帯に送受信は集中するのか?」
といった、一見個人の意思とどう結びつくのかわからない、しかし言葉よりもはるかに客観的なデータに注目し、それを分析することで集団や個人の振る舞いを正確に予測しようとする立場をとる。言葉は意識的に扱うことの方が多いものだから、どうしても作為的な(或いは「わざとらしい」)部分が残ってしまいがちになる。だから、自然言語処理ではそういう部分をうまくそぎ落としてやらないと、人間の行動に関する秘められたパターンに到達することは難しいだろう。
あるいは心理学系の研究では、未だにアンケート方式をとっていたりするが、5段階の評価や「あなたはどう思うか」などの回答は主観的であてにならず、基準が個々人でバラバラなので統一的なデータとして扱えないという根本的な欠点がある。こうした研究方法は、人間の行動に関するデータを取れなかった時代に生まれたものであり、いつまでもそれに盲目的に従う理由はないと思うが、アカデミックな慣習というのは他の慣習と同様に簡単には変わらないので、今後もしばらくは心理学部は残るだろうし、そこではアンケート方式の調査のしかたに関する授業が行われることになるのだろう。統計学の授業もあるのだろうが、統計で処理する内容が5段階評価のアンケートでは、なんだか惜しい。
社会物理学ではそういうデータは徹底して斥ける。もっと些細な、シャーロック・ホームズのような一流の探偵しか使いこなせなかったような情報に注目する。
例えば「メールをどう利用するか」ということについては、言葉に比べて意識的に行う部分が少ない。だからこそ知らず知らずのうちにはまっているある種のパターンというものを抽出しやすくなるし、そこには作為がない分説得力がある。この点で社会物理学には優位性がある。
しかし、私たちの普段の行動を振り返ってみると、自然言語データの方が今はまだはるかに多いというのが現実ではないか。Twitterやfacebook、ブログに投稿はしていても、行く場所行く場所でFoursquareなどの位置情報系アプリでチェックインしたり、体温や血圧を常時測定してログを残したりする人は比較的少ない。
見出しに書いた通り、この2つの領域の基本的な違いは、意識的に残すデータと無意識に残してしまうデータのどちらに重きをおくかというところに現れていると考えられる。
社会物理学を発展させるにはどうしても色々なセンサーを使わなければならないが、言葉の方はといえば、すでに多くの人がソーシャルメディアやブログに投稿したりしている。この点では自然言語処理の方が研究が進歩しやすい環境だと言えるかもしれない。IoTのトレンドが今後も続いて、そこかしこにセンサーが遍在し、「ユビキタスセンサー社会」とでもいうべき状況になれば、それぞれのセンサーから得られるデータを人工知能に処理させることで社会物理学の研究は一気に進歩し、じきに自然言語処理よりも大きな成果を社会にもたらすようになるかもしれない。
まとめ
自然言語処理は言葉に注目するわけだから、コンピュータを使ってセラピストのようなことをするといえる。一方で社会物理学は、人間の行動に関する些細な事柄に注目するわけだから、コンピュータを使ってシャーロック・ホームズのようなことをするという風に言えるだろうか。小学生の頃にホームズにハマった自分としては、社会物理学の方により大きな期待と関心を寄せている。
【おまけ・関連書籍など】
社会物理学に関係しそうな記事をチェックしていると、そのほとんどでは日立が名札型ウェアラブルセンサーを被験者につけてもらうという形で実験を行っている。他のセンサーが登場するということはほとんどない印象だ。
名札型センサーといえば、『ソーシャル物理学』の中でも言及されているし、『職場の人間科学』や『データの見えざる手』の中でもこれを使った実験からわかることを中心に論を展開している。
データの見えざる手: ウエアラブルセンサが明かす人間・組織・社会の法則
- 作者: 矢野和男
- 出版社/メーカー: 草思社
- 発売日: 2014/07/17
- メディア: 単行本
- この商品を含むブログ (17件) を見る
ちなみに『職場の人間関係』の著者であるベン・ウェイバーさんはペンドランド教授の研究室の出身で、現在は教授と創業した会社のCEOを務めているらしい。矢野さんの解説記事の中でそのように述べられていた。
『データの見えざる手』は「日本版ソーシャル物理学」とでも呼べそうな勢いで『ソーシャル物理学』と内容が重なってくる一冊。以前に世論がどう変化するかを物理学の考え方を応用して説明できないかという記事を書いたときに言及した本だ。
plousia-philodoxee.hatenablog.com