FC2ブログ

Entries

高橋威知郎ほか『データサイエンティスト養成読本 ビジネス活用編』


何冊も出ている養成読本のシリーズから、ビジネス活用編。データサイエンスのプロジェクトの進め方や、成果を出すポイント、組織のあり方などが書かれている。技術的な側面はほとんどない。そういえば数式も出てこない。何人もの著者が書いてるので、それぞれの記事にはレベル感の違いがある。しかしデータサイエンスの技術面以外のところに関心があれば必読と言える本。

データサイエンスがビジネスに貢献するために、何よりも分析結果を現場に丸投げせず、ビジネス結果まで責任を持つべきと言う高橋氏の記事(p.10-12)。組織におけるデータ活用のレベルを測るために、トーマス・ダベンポートの分析力を駆使する発展の5段階と、ジム・デイビスの情報価値を最大化するための5段階を軸としたマッピング(p.21)は有益。業務課題は解決できればデータ分析である必要はないという点は大いに納得する。ただデータ分析を使うかどうかで、データ分析者が課題に対する姿勢を変える必要はないという点(p.23-24)はやや疑問。データ分析以外の解決策であれば、データ分析者以外が担うべきだろう。

奥村氏の機械学習プロジェクトの進め方は実践的で役に立つ。機械学習部分がないとプロジェクトが成功しないような依存性の高い場合について。この場合は、慎重にPoCを繰り返して見極めることが解かれる。機械学習がボトルネックにならないように、機械学習ではない次善の策や、そもそも機械学習を使わずに課題か解決可能かを考えること(p.44-45)。

樫田氏のメルカリのBIチームの話はとても面白い。記述もクリアだし、よく考えられた独自の視点に基づいている。データ分析チームのミッションを、羅針盤(方針を示す)、活版印刷(情報と知識をみんなに行き渡らせる)、火薬(競争優位のための新しい武器)をそれぞれ提供するという世界三大発明になぞらえたり(p.61-62)。データ分析の組織パターンでよくある、マトリックス組織のメリットとデメリット、人材の評価方法やアサイン方法について(p.62-67)。採用方針について、パトス(情熱)、エトス(人間性)、ロゴス(論理思考)の3側面から評価し、入社後には身につけにくい素質を重点的に評価する(p.74-76)など、とても面白い。

中山氏の記事もデータ分析組織の作り方。ここでは大企業では先にデータ基盤を構築すると、使えるようになるまで投資するというコンコルド効果が働き、データ分析が政治的に推進される、という興味深い意見が書いてある(p.82)。私の経験からはそんなことはないのだが、どうなのだろう。何の分析に使うのか何も明らかでないままゴミがためられていき、データレイクがあるけども何にもなっていないことになる。なまじ大企業でリソースの余裕があるので、予算・人員ともにデータレイクで無駄にされてもさほど問題にならないような。この記事にはSI企業向けのポイントがあるのが面白い(p.89-98)。SI企業がデータ分析を担うときには、人事制度・組織構造(専門家を育てにくいローテーション人事)、契約(検収基準での請負形態との相性の悪さ)、保守管理(精度劣化する分析モデルへの特別な保守)、商品ラインナップ(顧客のレベルに合わせたデータ分析商材の取り揃え)という点に課題があるという。

後半は徐々に個別論というか、やや細かい論点に入っていくような感じがある。伊藤氏の探索的データ分析の話は、統計量や散布図などの話になり、ややこの本のトーンから離れている。ビジネスに結び付いたKPI設定の話がもっとメインに来たほうがよかった。

津田氏の科学的ビジネスのすすめは、クリアな記事。データサイエンス人材を、よく言われるビジネス・IT・データサイエンスの3側面でなく、データサイエンティスト、機械学習エンジニア、データエンジニアの3側面に分けている(p.115-117)。この分類も聞いたことがあるが、それによってビジネス側面がかなり薄まっている。理想像としてはやはりビジネス、IT、データサイエンス(というか数学)の3側面だろう。ビジネスでのPDCAは科学的方法論での仮説検証サイクルだろう(p.122-126)という論点。だから特殊なことではないという結論でよいが、個人的にはKarpathyのSoftware 2.0を踏まえるとここには新しい考え方があるのだと思う。

西田氏のデータ分析の民主化。日本の品質管理の仕組みこそ、現場でみんながデータを見ながら対策を考えていた。80年代にアメリカはそれを日本を見て学んでいた。日本には本来データドリブンな考え方があるはず、という論点(p.137-138)。これは確かにそうだ。結局、こうした品質管理の仕組みにITがうまく乗ってこなかったということが、日本の現状なのだろうか。

最後の二つの記事はPeople Analyticsについてで、これはなぜこの本に入っているのだろう。組織論として見えなくはないが、個別領域の分析の話だ。特に大成氏の記事は、4つの集合によるベン図(p.141)の書き方が間違っている(例えばHRMと行動科学のみの共通部分の領域がない)とか、相関と因果の違いを述べていながら回帰分析の係数で話が終わっているなど(p.148-150)、やや納得できない点がある。
スポンサーサイト
この記事にトラックバックする(FC2ブログユーザー)
http://exphenomenologist.blog100.fc2.com/tb.php/1017-2b76d91d

トラックバック

コメント

コメントの投稿

コメントの投稿
管理者にだけ表示を許可する