Appendix Link:『ビッグデータの正体』第2章 第1の変化「すべてのデータを扱う」

第2章 第1の変化「すべてのデータを扱う」

1. ジェフ・ジョナスの「データに語らせる」見解に関する2010年12月パリでのジェフ・ジョナスとの対話について:リンクなし

2. 米国の国政調査の歴史

U.S. Census Bureau, "The Hollerith Machine" Online history. 

www.census.gov

3. ネイマンの貢献

William Kruscal and Frederick Monsteller, "Representative Sampling, IV: The History of the Consept in Statistics, 1895-1939" International Statistical Review 48 (1980), pp.169-195, pp.187-188

ネイマンの有名な論文

Jerzy Neyman, "On the Two Different Aspects of the Representative Method: The Method of Stratified Sampling and the Method of Purposive Selection" Jounal of the Royal Statistical Society 97, no.4 (1934), pp.558-625

4. 1100人の標本で十分という根拠

Earl Babbie, Practice of Social Research (12th ed.2010), pp.204-207

※原著では現在は14版が最新版のようだが、ここではあえて12版の方のリンクを貼った。リンク先ではpdfファイルで12版がすべて見られる。なんと便利な時代だろう!

ちなみに14版はこちら(Amazon

www.amazon.com

5. 携帯電話の世論調査への影響

fivethirtyeight.com

世論調査の偏りやその他の統計に関するヒント:

www.amazon.co.jp

翻訳版はこちら。

www.amazon.co.jp

6. スティーブ・ジョブズの遺伝子解析

Walter Isaacson, Steve Jobs (2011), pp.550-551 

www.amazon.co.jp

7. Googleのインフルトレンドによる市レベルの予測

Dugas et al., "Google Flu Trends"

8. エツィオーニの「つかのまのデータ」という指摘に関する2011年10月のクキエによるインタビュー:リンクなし

9. ズームのCEO

Jonathan Rosenthal, "Special Report: International Banking" The Economist, May 19, 2012, pp.7-8

www.economist.com

10. 相撲八百長事件について

Mark Duggan and Steven LEvitt, "Winning Ins't Everything: Corrupition in Sumo Wrestling" American Economic Review 92 (2002), pp.1594-1605

11. ライトロカメラが取り込む光線数1100万本について

https://www.lytro.com/

12. 社会科学分野での標本抽出の置き換え

Mike Savage and Roger Burrows, "The Coming Crisis of Empirical Sociology" Sociology 41 (2007), pp.885-889

本では紹介されていないが、これに関連する動画(長さ:1:20:15)がYouTubeにあるのを見つけたのでついでに添付しておく。

www.youtube.com

13. 携帯電話会社からのデータの総合分析について

J.-P.Onnela et al., "Structure and Tie Strength in Mobile Communication Networks" Proceedings fo the National Academy of Science of the United States of America (PNAS)104 (May 2007), pp.7332-36