Entries

スティーヴ・ロー『データサイエンティストが創る未来』


ニューヨーク・タイムズの記者による本。データサイエンスの最近の応用について書いている。原題は"Data-ism"で、それはデータに基づく意思決定を重んじるマインドセットを意味している(p.14)。仮説を構築してからデータを見るのではなく、まずデータを見て何が言えるかを考える、「データ第一主義」とも言える。データ第一主義の精神の生みの親はテューキーだという(p.130)。

本書は様々な人に取材をしている。だがいまひとつ何が言いたい本なのか、姿が見えてこない。データサイエンスに対する著者の理解もあまり深くないよう。つまり、一通りの話題の表面をさらっており、深く突っ込んでいない、悪い意味でジャーナリスティックな本に見える。基本的には本書は、ジェフリー・ハマーバッカーという人物とIBMを中心に物語が展開する(ただしハマーバッカーとIBMの間に関係はない)。

ハマーバッカーという人物はまずウォール街で金融アナリストとなり、金融モデルの構築に従事していた。だが所属していたベア・スターンズでシステムがすべて止まり、データが供給されなくなる事故があった時に、モデルではなくデータこそが大切だということに気づいたという(p.48-50)。ベア・スターンズを1年もせず退職後、フェイスブックでデータサイエンティストのチームを結成に携わる。さらにその後はクラウデラを共同創設。そして、医学研究の分野に転じた(p.20)。医学研究では、自分の双極性障害の経験もあってメンタルヘルスの分析に目標を置く(p.214-223)。人間の様々な活動データからいかに精神障害の兆しを見つけ出すか。

IBMの話題は、ハマーバッカーの伝記的記述と絡んでおらず、本書の統一感を失わせている。IBMはデータ重視の潮流の中でスマート・プラネットというアイデアを発表している。このアイデアができあがってくる過程の記述は一読の価値がある。2008年頃、IBMは自社が何をする会社なのか、アイデンティティ・クライシスに陥っていた。スマート・プラネットはそうした中で、コミュニケーション部門とマーケティングの責任者であったジョン・イワタが主導してできあがったものだ(p.69-75)。

IBMの話ではビッグデータに基づいて在庫管理を改善した、医薬品流通のマッケソン社の事例(p.84-88)、稀な症例である成人性くる病を診断したワトソン(p.94-97)、地面に設置したセンサーと衛星画像を使ってワイナリーの収穫を改善した例(p.163-175)などがある。もちろん実際の現場に取材してリアルな情報を載せているものの、事例としてはよく聞くたぐいのものだ。また、ホテル経営のデニハングループでの空室率改善の話がデータ駆動型意思決定の事例として挙げられているが、これはデータサイエンスというよりほぼBIの話だ(p.104-111)。こうした点に、とりあえず関連する話題を何でも集めてきたような感じがする。

室温を自動調整するネストのサーモスタットを巡っては、節電のためにある温度設定を強制するか、あくまで人の好みに合わせるかなどの論点がある。これは機械による自動調整をどれだけ信頼するか、機械が最適なものだとする結果をどう尊大にならずに適用するか、といった機械への信頼という論点だ。それを深めると自動運転などの話になる。とても良い論点なのだが、著者は特に深めずに通り過ぎていく(p.188-199)。力量を超えているのだろう。

総じて、データサイエンスがもたらす社会への影響を、社会の側からざっと眺めようとしている。個々の論点はまとまっていて読みやすいので、二次文献には使えるのかもしれない。だが話の本筋が見えずバラバラで表面的な印象を受ける。
スポンサーサイト
この記事にトラックバックする(FC2ブログユーザー)
http://exphenomenologist.blog100.fc2.com/tb.php/831-d261e92d

トラックバック

コメント

コメントの投稿

コメントの投稿
管理者にだけ表示を許可する