Entries

John Foreman, "Data Smart: Using Data Science to Transform Information into Insight"

Data Smart: Using Data Science to Transform Information into InsightData Smart: Using Data Science to Transform Information into Insight
(2013/11/04)
John W. Foreman

商品詳細を見る

データサイエンスの入門書。とてもよい。著者はダイレクトメールによるマーケティングを行っているMailChimpの人。データ解析で使われる様々な手法を、実際にデータを使いながら解説している。ツールとしてエクセルを使用している。これは取っ付き易さを狙っている以上の効果がある。エクセルでのデータの整理の仕方や、式の関数をそれぞれ説明することに拠って、それが同時に手法のアルゴリズムの説明にもなっている。これがRやPythonを使った場合は、パッケージで定義されている関数を一行書いただけで終わってしまう。ちなみに、最終章はそれまでエクセル上でやってきたことをR上でやるとどうなるか、が書いてある。

扱われている手法はk平均法、ナイーブベイズ、線形計画法、ネットワークグラフ、重回帰分析、アンサンブルモデル、時系列分析、外れ値分析。もちろんアルゴリズムの説明がしきれているわけではなく、基本的な考えは解説してあっても式自体は天下りに書かれているような箇所もある。それはこの本のレベルからして仕方のないところだろう。

アンサンブルモデルが扱われているのが類書との違いだろうか。やりたいことは重回帰と同じだが、計算量がまったく違う。1990年代半ばから使われ始めた手法だそうだ。その他、線形計画法のところはなぜか濃密だ。著者自身が以前だいぶ取り組んだ実例に基づいているよう。

統計学の話はほぼ知らなくても読めるレベルに抑えられている(重回帰分析での統計検定値の話を除いて)。数学的内容もあまり高度なものは必要とされない。データと解析結果を含んだエクセルを本のウェブサイトからダウンロードする形を取っている。そのため、何百行というデータで学ぶことができる。

初級レベルでこつこつ学ぶ本としてはいいのではないか。独習にも向く。誰か訳したら。
スポンサーサイト
この記事にトラックバックする(FC2ブログユーザー)
http://exphenomenologist.blog100.fc2.com/tb.php/735-bb81eb7a

トラックバック

コメント

コメントの投稿

コメントの投稿
管理者にだけ表示を許可する