Entries

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
この記事にトラックバックする(FC2ブログユーザー)
http://exphenomenologist.blog100.fc2.com/tb.php/914-df62b6e8

トラックバック

コメント

コメントの投稿

コメントの投稿
管理者にだけ表示を許可する

デイビッド・ネトルトン『データ分析プロジェクトの手引』


400ページほどある大部の本。データ分析について、ビジネスの観点やエンジニアリングの観点からの話題が扱われる。さらにWeb上のデータを中心として多くのケーススタディも扱われている。アルゴリズムについては、交差検証や決定木などの話題もそれなりにあるが、さほど重点は置かれていない印象。著者はもともとIBMの人だったこともあり、SPSSを用いた分析が念頭に置かれているようだ。大企業においてデータ分析の専任者がSPSSやSASでやるイメージ。現在のRやPythonを中心とする試みからすると、どうも一世代前のようなものに見える。

様々なことが書いてあるのだが、どうもいまひとつパッとしない。翻訳本だということもあるか。戦略面、データ面から考えられた、データ分析プロジェクトの実行可能性チェックリスト(p.10-14)は役に立ちそう。データの質を、ビジネスへの関連度やそれ自体の信頼性からなんとか定量化しようとしている(p.91-93)。そこまでやらなくてもという印象をもつ。データ表現の発展形として、階層、オントロジー、グラフ、多クラスに所属するというファジー表現が扱われている(p.75-81)のが面白い。

データ分析でありがちな間違いとして、データのバイアス、前処理のエラー、間違った解釈が挙げられる(p.162-165)。自分勝手な判断によって袋小路に陥ることを避けるために、銀行、保険、通信などの分野ごとにどのような説明変数が必要なのか、業界ごとにパッケージ化されたものを使うのも手だ(p.124-127)。テキストマイニングに5つのステップが定式化され、これもSPSSやSASにパッケージがあるので活用するようにと(p.209-218)。

翻訳本でここまで大部のものを読まずとも、和書でいい本はある。再読しよう。
スポンサーサイト
この記事にトラックバックする(FC2ブログユーザー)
http://exphenomenologist.blog100.fc2.com/tb.php/914-df62b6e8

トラックバック

コメント

コメントの投稿

コメントの投稿
管理者にだけ表示を許可する

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。