FC2ブログ

Entries

株式会社ブレインパッドほか『失敗しない データ分析・AIのビジネス導入』


多くの分析プロジェクトを手掛けてきブレインパッドによる、データ分析プロジェクトの進め方ガイド。コンパクトにまとまっている。機械学習プログラムが他のプログラムと異なる点を押さえて、プロジェクトをどう進めていけばよいかポイントが書かれている。彼らの経験に基づく成功事例や失敗事例も随所に挟まれている。最終章はデータ分析組織の話がある。

AIという言葉はビジネス界ですっかり流行しているが、その実態はデータ分析。AIは分析に足るだけのデータがあるかどうかが鍵なので、AI導入プロジェクトはデータが活用できるかどうかのデータ分析プロジェクトとして捉えるべき(p.11-13)。機械学習は解釈性が問題になったり、結果が確率的だったり、多くのデータが必要だったり、ハイパーパラメータの調整に時間がかかるなどがある。従来のルールベースのシステムとは異なる。ルールベースに比べた機械学習の短所を補うための4つの工夫が挙げられている(p.38f)。ユースケース、精度、評価指標を明確にすること。PoCを実施すること。運用においては人の判断余地を残すこと。追加のデータ収集が可能な、柔軟な環境を確保すること。

総じて、データ分析プロジェクトには7つのリスクがあると捉えている(p.14f)。分析の進め方として時間と成果が比例しないリスク、データの量や質が不十分なリスク、データへ依存しておりデータ形式が変化すると機能しないリスク、データのトレンド変質に関するリスク、良い分析結果が得られるとは限らないリスク、分析結果が解釈不能で活用されないリスク、本番では精度が出なかったり処理時間がかかりすぎるリスク。これらリスクへ対処するため、プロジェクトとしては立ち上げ、PoC、ビジネス適用の3フェーズをサイクルとして繰り返すというアプローチを紹介(p.46-48)。

PoCの前に決めるべき分析要件がよくまとまっている。ユースケース、対象粒度、出力値、解釈性の度合い、評価基準、データ利用制約、処理時間制約、環境制約(p.90-104)。またビジネス適用の場面では、暗黙のフィードバックという考えが目についた(p.144-146)。これは典型的にはレコメンドなどで、システムの結果がユーザー行動を変えるため、学習データが変化し、システムが過学習する(同じ売れ筋商品ばかりリコメンドするようになる)もの。機械学習システムを本番運用して生まれるデータのバイアス。何らかのルールベースでそのような結果に陥ることを排除するしかないようだ。

全般的によくまとまっているが、簡潔な本でもあるのでインパクトは薄い。まだ類書は少ないだろうと自負している(p.190)が、最近この手の本はいくつも良書が出てきている。それらの中ではちょっと埋もれてしまう印象。
スポンサーサイト
この記事にトラックバックする(FC2ブログユーザー)
http://exphenomenologist.blog100.fc2.com/tb.php/1021-02095b03

トラックバック

コメント

コメントの投稿

コメントの投稿
管理者にだけ表示を許可する

Appendix

プロフィール

坂間 毅 (Sakama Tsuyoshi)

Author:坂間 毅 (Sakama Tsuyoshi)
数学の哲学を専攻して研究者を目指し、20代のほとんどを大学院で長々と過ごす。
しかし博士号は取らずPh.D. Candidateで進路変更。
哲学と特に関係なくIT業界に住んでいる。

別館:アマゾンのレビューページ

最新トラックバック

検索フォーム

QRコード

QRコード