Entries

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
この記事にトラックバックする(FC2ブログユーザー)
http://exphenomenologist.blog100.fc2.com/tb.php/931-b7629366

トラックバック

コメント

コメントの投稿

コメントの投稿
管理者にだけ表示を許可する

ゴードン・リノフ、マイケル・ベリー『データマイニング手法 3訂版 予測・スコアリング編』


マーケティング系の事例を盛り込んで、データマイニングの手法を解説したもの。データ分析の一般的な流れを扱った章の後、決定木、ニューラルネット、k最近傍法、生存分析の4つの手法について、その概要と顧客分析での実例が書かれている。実例というよりは手法によった解説がメイン。もう少し事例の話が聞けるとよかった。解説の内容はあまり数式は出てこない。直感的な説明を心がけている。

面白かった事例としては、追加反応モデル(単純にキャンペーンに反応するかどうかではなく、キャンペーンが反応確率を増すかどうかの予測)でUplift Optimizerという決定木系のソフトウェアを用いて住宅担保ローンのクロスセルを改善したU.S.バンクの話(p.81-85)。同じく決定木でコーヒー焙煎機のシミュレーションを行ったネスレの事例。これは30秒後の各変数を目的変数とする多数のモデルを作成している(p.102-105)。さらに、相互情報量を距離としてk近傍法を適用した、マンモグラフィの異常発見の話(p.172-176)が興味深かった。

いままできちんと触れたことがなかったので参考になった記述として、ネットワークモデルとしてRBF(Radial Basis Function)モデル。RBFは多層パーセプトロンと並ぶニューラルネットのモデルとして紹介されている(p.134-139)。この説明だけだと概要をつかむのはやや苦労する。ちなみに本の執筆は2014年だが、ディープラーニングの話はまったく出てこない。

生存分析は概要や、コックスの比例ハザードモデルの話、また顧客分析への適用とてもよく書けていて参考になった。生存曲線はパラメトリックには分析できないという話(p.215-217, 234)が書いてあるのが目に留まる。経験則から来ているようだ。
スポンサーサイト
この記事にトラックバックする(FC2ブログユーザー)
http://exphenomenologist.blog100.fc2.com/tb.php/931-b7629366

トラックバック

コメント

コメントの投稿

コメントの投稿
管理者にだけ表示を許可する

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。