Entries

矢野和男『データの見えざる手』


どうも評価が難しい一冊。日立の研究所で、ウェアラブルセンサを用いて様々な人の身体運動や、誰が誰と話したかのデータを取得して分析した結果。具体的には例えば、リストバンド型のウェアラブルセンサで腕の動きを50msごとに加速度センサで計測(p.23)。また、名刺型センサを首からぶら下げて、センサどうしの近接関係や空間にあるビーコンとの反応でその時点での位置を拾うなどしている。

合計100万人日にも及ぶデータに基づいた議論をしている。だがどうも話の飛躍が多いか、私には飲み込みにくい結論を出しているのか。いま一つ議論の流れがスムーズに理解できなかった。話題は大きく二つ。個々人の一日の活動量の総体と、それをどう配分するかは熱力学に類比される法則的に決まっていること。そして、集団行動の活発さがその集団に属する個人の幸福度に影響するということ。こうして、「自然の摂理の解明に用いられてきた物理学の概念やツールが、企業の利益や人間の共感の理解に威力を発揮する意外性はこれまでの書籍には見られない本書の特徴」(p.14)だと言う。

個々人の一日の活動量の総体(「活動予算」と呼ばれている)が決まっているのは、体力的な問題として誰しも感覚的に納得できる。著者によれば、この活動量をどう配分するかも決まっている。リストバンドを付けた腕の活動を、1分間にどのくらい動いたかで計測する。このとき例えば、1分間に60回以下の動きを伴う活動には総活動量の半分程度が使われる。これは誰でも、いつでもそうだ。したがって、自分の遺志によって今日は腕の運動の激しい活動を増やそうとしても、どこかで辻褄が合うことになってしまう(p.44-47)。ちなみに著者はここから、一日のToDoと時間配分は自分の自由にはならないと言う。だが同じような活動量のなかでならToDoも帰られるし、時間配分もできる。そもそもToDoで管理するタスクは大概、活動量の同じようなものが多いだろう。

腕の1分間あたりの活動をX軸、その一日における頻度をY軸に取って(ヒストグラムのようにビンを使って)ある幅でプロットすると、ベキ分布になる。著者はこれを、物理学におけるボルツマン分布、すなわちあるエネルギー準位にある粒子の数の分布と同じだとしている。つまり、自然現象と同じ法則が人間の活動に見られると言う。そしてボルツマン分布のさらなる一般化(ボルツマン分布はもともとマクスウェル分布の一般化)として、「U分布」(普遍的universalの頭文字)と名付けている(p.36)。腕の活動もベキ分布となる。腕の活動にはベキ分布に調整する最適化が行われていて、最適化が行われなければ正規分布になるはずだと著者は書く(p.40-43)。ちなみに正規分布とポアソン分布は同じようなものだと言うのはなぜだろう(p.30-32)。確かにパラメータλが十分に大きいなら、ポアソン分布は正規分布で近似できる。だがそれだとポアソン分布を使う意味がそもそも無い。だからポアソン分布は小さなλで使われるので、普通は正規分布とは別物と捉えられる。

さて、腕の活動がベキ分布をなすのは、ベキ分布になるのは腕の活動へのエネルギー供給が限られていて、しかも疲労が溜まるからと理解できる。それは最適化というより、生物としての制限だろう。このこと、すなわち腕が閉鎖系なのか開放系なのか、あるいはどういった系(熱源)に接しているのか、どんなエネルギーの出入りがあるのかについて何も考察していないのはなぜだろう。エントロピーが最大になる分布がボルツマン分布だと言うが、それは系の状態によるのではないか(p.51-54)。なぜ何も限定をつけずに主張しているだろう。正規分布がエントロピー最大になる場合もあるのでは。エントロピーとは同一のマクロな状態を取りうるミクロな状態の数であることから、人間の活動における自由と制約の話などに展開しているがそれはご愛嬌か。

幸福度はより飲み込みにくい議論になっている。著者は幸福度は加速度センサで測れるという。この実験では、アンケートへの回答から見る幸福度と、首からぶら下げた名刺型センサの加速度(すなわち、身体的な活動量)との間に強い相関を見ている。毎週、その週の「よかったこと」を書いたグループではアンケートによる幸福度が高く、また活動量が大きい(p.74-78)。これは相関関係であって、幸福感があるので活発になったかもしれず、あるいは何らかの第三因子による因果かもしれない。とはいえ、加速度センサで測れることはOKだ。もう一つ、コールセンターでの事例が論じられる。これは、休憩所の会話が活発ならば、営業成績が良くなるという結果を見ている。すなわち集団における活発さという集団的特性と個人の活動(業績)の間の相関を与えるもので、とても面白い。これも相関関係である。

この二つの相関関係は、いつの間にか因果関係の議論に転じている。そして次の結論が出ている。
人の身体運動が、まわりの人の身体運動を誘導し、この連鎖により、集団的な身体の動きが生まれる。これにより、積極的な行動のスイッチがオンになり、その結果、社員のハピネスが向上し、生産性が向上する(p.97)

これを導く議論はかなり追いにくい。おそらく鍵になっているのは、補足する議論もなく出てくる次の文章だろう。ウィリアム・ジェイムズ的な、感情の定義の逆転。
我々が主観的に感じるハピネスとは、この集団的な身体運動の活発化にともなって生じる感覚(おそらく後付けで生じる感覚や意識)だと考える(p.92)
そりゃ幸福感をそう考えて定義すれば、因果関係は得られる。けれども問われるべきはその定義の妥当性。幸福感を得るにはとにかく集団で身体を動かせばいいのだろうか。社内運動会を復活させよ、など提言しているのでどうやらそう考えているようだ。納得できる人はどのくらいいるのだろうか?運動も集団行動も嫌いな私には幸福感はもたらされそうにない。あるとしてもその幸福感の原因は、やっていることの意義や達成感とかだろう。集団で穴を掘ってそれをきれいに埋め直すことを繰り返せば、みんな幸福感を抱くのか?

ついで出てくるのは運を測定する、という話。この話は、互いのウェアラブルセンサの近接関係から把握されるネットワークグラフに帰着されている。知り合いの知り合いが多ければ、それだけ想定外の問題に対処できるという(p.140-144)。自分だけでは解決できない問題を相談できたり、あるいは思ってもない情報がもたらされるだろう。それはその通り。でも、これは「運」と我々が呼ぶものか?ここで論じられているのは知り合いの多さだが、運なのか?組織内・組織間のコミュニケーション状態の可視化と改善へのステップとして論じるならばよい話。そして実例もその話。センサの単なる近接関係だけでは、一方的なコミュニケーションかもしれない。そこで話者の身体運動の大きさから会話の質を測ったりしている。会話に熱心になると身体運動が大きくなるので、お互いが会話中にどう運動したかで会話の質が分かるわけだ(p.161-170)。これも面白い話。けれども、運を測るとは何なのだろう。

データ分析において人間が仮説を立てて検証するのではなく、機械に任せてしまえという話が続く(p.191-193)。データを何でも入れれば「人工知能」が答えを出してくれる、その過程がブラックボックスでも結論は正しいのだから信じろ、というよくある「ビッグデータの神話」に見える。「データの見えざる手」という題名はここから来ている。この議論には、データの前処理、ハイパーパラメーターの設定、特徴量抽出といった話がまるで抜けている。後段に、それでも人間が果たすべき責任、結果解釈における責任などが記されている(p.212f)。しかしこれらの議論は質がそれまでとまったく違い、脱力。

天才肌の人間が書くものはときに、その思考が追えずに混乱することがある。本書もそんな一例のような気がする。ちなみにこの本の醸し出す雰囲気に既知感を抱いて、何だろうとしばらく考えていたが分かった。30年くらい前に流行った、1/fゆらぎだ。データ分析で自然現象と人間の社会現象を直結させた点で同じなのだ。
スポンサーサイト
この記事にトラックバックする(FC2ブログユーザー)
http://exphenomenologist.blog100.fc2.com/tb.php/860-a43a54dd

トラックバック

コメント

コメントの投稿

コメントの投稿
管理者にだけ表示を許可する