Entries

清水亮『はじめての深層学習プログラミング』


深層学習についての、プログラム言語をメインにした入門書。主にChainerを扱い、後半でTensorFlowも登場する。著者の会社で作っているライブラリDeelも出てくる。深層学習の仕組みについての話はあまりない。数式はほとんど出てこない。

ChainerでのCNN、LSTMの実装例から、TensorFlowでのSeq2Seq、そしてDeep Q Learningを扱っている。最終章では深層学習の発展例として、スタイル転写、写真と説明文の生成、積層自己符号化器、転移学習、蒸留といった話題がある。

この本でコードを書けば、深層学習を学習させたり予測させたりするように動かすことができる。しかしモデルの構造などはあまり解説されないので、ChainerやTensorFlowのコードのそれぞれが何を意味しているのかは述べられない。なのでここから自分でやってみようとなると苦しいと思われる。それならそれぞれのフレームワークのチュートリアルをやってみる方が、ためになるのではないかという印象をもった。深層学習が分かった気になるが、分かりはしない一冊といったところか。コードが好きな人にはとっかかりとしてよいだろう。とはいえ、深層学習を動かす環境を整えるのはそれなりに大変だけれども。そういれば、CUDAのインストールtipsのところはかなり役に立つと思う。

著者のようなプログラミングがよくできる人には、数式で書くよりコードで書く方が分かりやすいそうだ。私には真逆で、コードで書かれているとそれが何を表現しているのか、いちいち数式に置き換えていかないといけない。数式一つで済むものが、コードだと10行くらいになってしまい冗長感を覚える。感性の違いなんだな。
スポンサーサイト
この記事にトラックバックする(FC2ブログユーザー)
http://exphenomenologist.blog100.fc2.com/tb.php/875-578068d2

トラックバック

コメント

コメントの投稿

コメントの投稿
管理者にだけ表示を許可する