読者です 読者をやめる 読者になる 読者になる

炭水化物とコンビニと、データ解析

f:id:plousia-philodoxee:20140926232444j:plain

   炭水化物とコンビニと、データ解析について、お互いに関連のなさそうな三者ではあるが、自分の頭の中ではまとまっている、そんなことを書いてみようと思う。文章という形式でもうまくまとまるといいのだが・・・。

 

まずは炭水化物から。本も紹介しつつ。

ここ数日というもの、夏井睦さんの『炭水化物が人類を滅ぼす』光文社新書)という本を読んでいて、自分のここ数年の間の食生活の、ある部分の妥当性が裏付けられたような思いがしている。・・・と同時にこの本の内容がどの程度妥当なものか、改めて考え直したいと思う。

 炭水化物についてはWikipediaにもある程度詳しく記述があるので、まずはここから、続いて専門書へ進もうと思う。

炭水化物が人類を滅ぼす 糖質制限からみた生命の科学 (光文社新書)

炭水化物が人類を滅ぼす 糖質制限からみた生命の科学 (光文社新書)

 

専門書はこちら。

 

ストライヤー生化学

ストライヤー生化学

 

 

 

 

「自分のここ数年の食生活」とは、基本的にシリアルと野菜、たまに肉や魚、飲み物は基本的にミネラルウォーター、お茶(ペットボトルの場合は十六茶か緑茶)、コーヒー、豆乳、牛乳(シリアルにかける)というもので、他にはチョコレートなどのお菓子や外食で、自宅では米や麺類、パンなどの「炭水化物」をあまり摂らないというものだった。

 

こういう食生活は大学生の途中くらいから始まった。それが原因なのか、それとも他に原因があるのかわからないが、私は高校生の頃からほとんど体重が変わっておらず、60キロ弱であり続けている。たまにこの話題になると「なにか特別なことでもしているのか」とか「規則正しく運動でもしているとか?」などと聞かれたりもするが、そんな特別なことでもなく、ただただ炭水化物を摂る量が少ないから太らないのだ。

これは夏井さんのロジックを使うとざっくり3段階で説明がつくらしい。

炭水化物(糖質)を摂らない→糖分が体の中に余分に溜まって脂肪に変わるということがない→太らない。

 

とはいえ、このロジックも含めて、この本には論理の飛躍や「単なる思いつきでは?」という箇所も少なくなく、どうも胡散臭い感じが否めないので、自分なりに色々調べて内容を検証してみようと思う。

 

ところで摂取する炭水化物が「少ない」であって、「全く摂らない」ということではないから、たまにアルバイト先の帰りにコンビニに立ち寄って、丼ものを買ったりすることもある。カツ丼、親子丼、ロコモコ丼…、どれも好物である。

 

・・・という状態の食生活だったのだが、上の本を読んでみて、「ちょっとこれは本格的に炭水化物を抜いてみようかな」と思い立ち、今夜はいつものコンビニでバラ売りのおかずだけを3品買ってみた。主食(米)抜きの食事であり、コンビニでの新しい消費パターンである。

 

話はするっとコンビニへ・・・。いや、コンビニからするっとデータ解析へ。

そう、新しい消費パターンということなのだが、レジで会計をしているときにそのことについて、ふと考えた。

 

「あれ、これまでは丼ものを買うことが多かった自分が、急に単品のおかずを数品買うように変わって、店員さんも訝しく思ってやしないだろうか。」と。

 

私もかつて、コンビニでアルバイトをしていたことがあったから、店員は会計の時には、客層の判別のために、レジに最初からついている「年齢層」「性別」のボタンを押していることを知っている。こうしたデータをもとにコンビニは新しい商品を考えたり、既存の商品について、店内に置く量や組み合わせを変えたりする。

20代女性の来店が多い場合にはスイーツコーナーを充実させ…などの様に考えていくのだろう。

 

お客に関するデータといっても、これ以上細かくは入力するわけにはいかないので、データ解析をするにしても、各商品に関してはその購入者の「年齢層」「性別」「来店時間」「一緒に買っているもの」などしかわからず、あくまでもその範囲で解析を考えなくてはならない。

 

単純な回帰分析をするにしても、変数は多ければ多いほど興味深い結果が得られる可能性が高くなるわけで、使われる変数の数がずっと一定だと変数の相関を考えるとしても遅かれ早かれ「変数どうしの組み合わせ」に限界がくる。

 

「年齢層」「性別」「来店時間」「一緒に買っているもの」をそれぞれ「商品」と単回帰分析するとしたら、4通りしかない。「年齢」と「性別」、「来店時間」と「性別」など、「商品」以外の変数同士を単回帰分析するとしても、4×3÷2=6と、わずか6通りの組み合わせしかない。

 

これがもし、ボタンが10種類ついていたら、確かに店員さんはレジでの会計処理が大変だろうが、単回帰分析の組み合わせはけっこう増える。10×9÷2=45、45通りである。

 

45通りもの組み合わせがあれば、これまでに気づかれなかった、一見信じがたいし、人間には理解することもできないが、実際に試してみたら確かに変化がある、そんな相関が見つかるかもしれない。

 

この辺の「意外な相関」については先日取り上げた『データの見えざる手』(矢野和男)だけでなく、ビッグデータの正体 情報の産業革命が世界のすべてを変える』(ビクター・マイヤー・ショーンベルガー、ケネス・クキエ著、翻訳:斎藤栄一郎)にも例があった。

 ちょっとだけ本のことを書くと、小規模のデータであれば人間がそのデータの「意味」を考えなければならなかったが、大規模データの場合には、データの方が自ら、自分自身の意味を物語るようになる、というのが印象的だった。人間の頭によらずに、データの意味が明らかになる…ビッグデータの登場によって「意味」というものが人間による独占的な取り扱いの対象だったというこれまでの事情は変わってしまう。いや、既に変わってきている。

ビッグデータの正体 情報の産業革命が世界のすべてを変える

ビッグデータの正体 情報の産業革命が世界のすべてを変える

 

 

コンビニの方に話を戻そう。単回帰分析の組み合わせの数が云云かんぬんと書いてきたが、もちろんこれは、「明日からコンビニはボタンの種類を増やし、データ解析を充実させて、よりよい商品管理、販売を行うべきだ」という意味ではない。そういうことを主張したいのではなくて、あくまで「考え続けると、例えばこういう側面が見えてくるし、それはなかなか興味深くもあるよね」というレベルの話である。

 

実際のところは組み合わせに限界がきて、「もう他に変数の組み合わせがありません!」となり、ではどうするか、ということになる。回帰分析の範囲だけで考えたとしたらもう打つ手はなく、データ解析以外の方法を・・・ということになるのかもしれない。各店員によるPRのための声かけの充実(「ただいま店内のおかず全品10%引きでーす。いかがでしょうかー?」など)や、店内の商品の配置替えなど。もちろんこれらの活動も何らかの形で「データ化」され、分析にまわされることになるのかもしれないけれど。

まあコンビニは、自分が知らないだけで、もっと他にも色々な所からデータを収集してはいるだろう。そしてそれを使って分析をしていることだろう。

 

・・・とまあ、そんなところで、コンビニでおかずを買ったというところに話を戻そう。

すると今回の自分の購買行動のパターンの変化は、コンビニの側のデータでは捕捉しようのないものだ。自分という「個人」のレベルの行動の変化までは、先ほどの4種類のボタン+来店時間という要素だけでは判別が難しい。

 

もちろん店員さんが自分のことを覚えている可能性はある。最寄りのコンビニでよく利用するし、時間帯もだいたい同じだから顔を覚えられているだろうと思う。

 

しかし「店員が顔を覚えている」というレベルの情報は、コンビニのデータ解析には実際には使われないだろう。記録をつけているということもないだろうし、自分も店員をしていた頃にいわゆる「常連さん」は何人か覚えてはいたが、その人たちの情報を店長に話したことは一度もなかったし、何かに記録したこともなかった。あくまで「自分の頭の中だけのデータ」という感じだった。

 

「糖質制限に関する新書を読んだある個人が、その本の内容に後押しされて購入する食べ物の組み合わせを大きく変えた」という文脈(コンテクスト)に関する情報を、コンビニが捕捉することは、プライバシーの保護と両立する形で、何らかの工夫によって可能なんだろうか。