ビッグデータ
現在作成中で未完成ですが、現時点で公開しても役に立つという人がいるかもしれないので、一応公開しました。今後も作業を進め、完成を目指したいと思います。海外のサービス、サイト、企業などはカタカナ表記とし、アルファベットでなく五十音順で配置しま…
人工知能のIQ*1について、4000とか5000とかいう数字が使われるのをときどき目にするが、なるべく少ない情報から一般的な特徴を見抜く汎化能力の高さがIQの要件ではなかったか。サイコロを1000回や2000回振らなければ確率分布がわからないような知性に対して…
近頃、情報と時間の関係について考えることが多くなった。それぞれの情報は、その属性に応じて、必要とする人へ届けられるべき「タイミング」というものがあるが、現在のインターネットはそういうところがうまく設計されていないのではないかと感じることが…
何かを思い出すということと検索エンジンとの関係について。
ロードバイクで住宅街の中を走っていると、自分のいる道と交差する道が次から次へと現れる。それぞれの道は自分のいる場所からずっと奥に向かって伸びており、その両側にはたくさんの家が立ち並んでいる。 小さい頃、図書館で本を読み漁っていたとき、あるい…
サイコロの各目の出る確率を考えるとき、人間は何度も繰り返しサイコロを振らなくても、極端な話、一度もサイコロを振らなくても、それぞれの目が出る確率が6分の1であることを見抜くことができる。これを「直観」と呼んでいる人も多い。少数のデータから答…
「ネット上の情報は玉石混淆だ」としばしば言われる。専門家も素人もネット上にいろいろなことを書き込むためにこういう言われ方をするようになる。インターネットが登場して以来、この「玉石混淆」という形容が使われるようになってからもうずいぶん経ち、…
改めて考えてみると、検索エンジンやキュレーションが行っていることの本質は、ウェブ上の様々なページのランク付けや選別だ。Googleはウェブ上の厖大なウェブページの中から、検索者が最も必要としていそうな特定のページを探し出そうと、今日もアルゴリズ…
高校生の頃、ジャパハリネットというバンドの「物憂げ世情」*1という曲が体育大会で使われた。ふとしたきっかけで久しぶりに聴きたくなって、YouTubeで探して聴いていると、歌詞のある部分が気になった。 溢れすぎる情報と毎日飛び交う電波の中 良くも悪くも…
先日書いた記事*1の中で、「~ということは統計によって示されている」という形の構文がネット上の実に色々な領域の色々な人々によって使われていて、それが読む人間の思考停止につながっているのではないかということについて触れた。ここで「思考停止」と…
ここにあるプログラマーがいる。彼は昼夜逆転の生活を送り、昼頃からもぞもぞと起き出してきて、コーラを飲みながら画面とのにらめっこを始める。そういう生活スタイルが、彼の描くコード(プログラム)と完全に無関係とは言えないのではないか、とふと思っ…
多くの人がブログやSNSという形で、インターネットを日常に不可欠のものとして使うようになって以降、ものを書く人が増えた。かつてはパブリックな場で見ることのなかった周縁の、或いは末端の「声なき声」は、日常的に可視化され、記録に残るようになった。…
第2章 第1の変化「すべてのデータを扱う」 1. ジェフ・ジョナスの「データに語らせる」見解に関する2010年12月パリでのジェフ・ジョナスとの対話について:リンクなし 2. 米国の国政調査の歴史 U.S. Census Bureau, "The Hollerith Machine" Online histor…
第1章 世界を変えるビッグデータ 1. インフルエンザの流行に関する論文 Jeremy Ginsburg et al., "Detecting Influenza Epidemics Using Search Engine Query Data" Nature 457 (2009), pp.1012-14 2. ジョンズホプキンス大学研究チームによるGoogle Influ T…