Entries

佐藤洋行他『改訂2版 データサイエンティスト養成読本』


昨年出たものが早くも第二版になった。とはいえ、データサイエンスの進展スピードを見るとそうでもない。この本がデータサイエンティストへの最初の入口になるように意図されているようだ。

データサイエンティストにはどのようなスキルが求められるのか、その仕事はどのようなプロセスで進むのか。RとPythonという現在のところ主流であるデータ分析の言語について。その後、実際の適用例として3つが挙げられる。マーケティング分析、mixiでの分析、SNS分析。最後にはFluentd、SQL、Webスクレイピング、Tableauの解説記事がある。最後の4つはやはり少しバラバラな印象を持つ。

データサイエンスにはやはりアルゴリズムが鍵になると思う。それにはRやPythonでの紹介とともに、2006年時点での有力なアルゴリズムが載せてある。いまでも古くないと言われているが、それでも古い印象を持ってしまう。一番面白い記事はこのアルゴリズムのところで、現在の研究状況のアップデートもあるだけにやや物足りない。

細かく数字は追っていないのだが一点だけ。アヤメのデータセットを重回帰分析した結果の、PetalLengthとPetalWidthの偏回帰係数のP値が5%有意でないと書いてあるのだが、図15からはそれが読み取れる情報がない。どこからきた数字なのだろう。
スポンサーサイト
この記事にトラックバックする(FC2ブログユーザー)
http://exphenomenologist.blog100.fc2.com/tb.php/842-b690f9f7

トラックバック

コメント

コメントの投稿

コメントの投稿
管理者にだけ表示を許可する