Entries

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
この記事にトラックバックする(FC2ブログユーザー)
http://exphenomenologist.blog100.fc2.com/tb.php/919-61b9597d

トラックバック

コメント

コメントの投稿

コメントの投稿
管理者にだけ表示を許可する

高橋威知郎『14のフレームワークで考えるデータ分析の教科書』


教科書然としているが、あまり標準的な事柄が書いてあるわけではない。個人的にはもっと教科書的なものを探していたが、本書はかなり独自の視点が多く入っている。データサイエンス養成読本は教科書といえるが、まったくの初心者にはややテクニカルすぎる。よりビジネス面によった本を探していた。少なくともこの本は教科書というより、著者の経験に基づいてデータ分析のステップを整理したものだ。例えば初心者が本書を読んで、書かれている事項が標準的に扱われているものだと思われると困る。

データ分析の流れとしてはCRISP-DMが書いてあるわけではなく、準備する、集める、分析する、表現する、伝えるの5つのステップで書かれている。何をどう分析するつもりなのかを示す分析計画書に当たるものとして、メッセージボードというのが書かれている。メッセージボードは、誰?、目的、何?、具体的には?、最初の一歩という5つからなっている。このメッセージボードには網羅感がない。具体的に、というのが一つの項目になっているのは奇妙だし、まして他の項目と同時に埋まらないのはステップとして納得感が低い。最初の一歩というのも意図が不明だ。本書の記述の不満としては、ビジネス面の有効性からのデータ分析テーマの検討が甘いと思われる。すぐにどのようなデータがあるかという話になってしまっている。設定したテーマはビジネス的にインパクトがあるのか、実行可能なのかについての検討がほとんどなされていないという印象(p.31-37)。ビジネス的に意味があるのか、意味があっても実行可能なのか(コスト面や組織の立場的に)、ほかに優先事項はないのか等々、この段階で検討すべきことはもっとある。

スケジューリングについては書いてあることが面白く、本来かかると考えた期間の半分でできることしかしないというスケジュールを組み立てるとしている(p.52-57)。データ分析はやってみないと何ができるか分からない面も多く、最初からITシステム導入のようなスケジューリングはできない。とはいえ、期間の半分でできることにスコープを絞ったらビジネス側の人間は納得しないだろう。アジャイル的な要素とか、R&D的に考えるとかもありうる。

データの素性は6W1Hで明らかにし、素性のわからないデータを用いないこととしている(p.68-73)。6W1Hは、だれが、だれに対して、なぜ、いつ、どこで、何を、どのように、という観点からデータについて明らかにしようとする。分析をするためにはどんなデータが必要なのかを先に考えてから、はじめて探しに行くというステップは好ましい(p.78f)。

この後はQCの7つ道具になぞらえて定量分析のための7つ道具、そしてQCの新7つ道具になぞらえて定性分析のための7つ道具が書かれている。ここはかなり著者オリジナルの整理。事例集をはさんで、プレゼンテーションのための技法を述べている。スライドを作るとき、定量情報は加工して載せ、定性情報は加工せずに載せるというアドバイスは面白い(p.162f)。定量情報は何を意味しているのかを書かないと数字だけでは伝わらない。定性情報は下手に抽象化してしまうと生の感覚が伝わらない。

著者独自の観点から方法論をまとめている本としてよくできている。とはいえ教科書ではない。初心者に文句なく勧められるデータ分析の教科書はないものか。そこまで方法論として定式化されいない分野なのか。
スポンサーサイト
この記事にトラックバックする(FC2ブログユーザー)
http://exphenomenologist.blog100.fc2.com/tb.php/919-61b9597d

トラックバック

コメント

コメントの投稿

コメントの投稿
管理者にだけ表示を許可する

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。