FC2ブログ

Entries

ジョン・ホワイト『バンディットアルゴリズムによる最適化手法』

picture978-4-87311-627-3.gif
バンディットアルゴリズムについてのやさしい入門書。pythonの実装コードつきで述べられる。Epsilon-greedy法、Softmax法、Softmaxのアニーリングによる改善、UCB法が扱われている。たまに翻訳がおかしいところがあるが、おおむね読みやすい。最初に読むにはよいのではないか。UCBの解説はうまく直感的な説明ができている。

数式がまったく登場せず、数式で書かれるような内容もコードで書かれている。アルゴリズムの内容はとても読み解きにくい。例えばUCBでそれぞれの腕の推定値に加えられるボーナス値の定義
math.sqrt((2 * math.log(total_counts)) / float(self.counts[arm]))
など、数式で書いたほうがよっぽど分かりやすいと思うのだが。
スポンサーサイト
この記事にトラックバックする(FC2ブログユーザー)
http://exphenomenologist.blog100.fc2.com/tb.php/992-e8d25687

トラックバック

コメント

コメントの投稿

コメントの投稿
管理者にだけ表示を許可する

Appendix

プロフィール

坂間 毅 (Sakama Tsuyoshi)

Author:坂間 毅 (Sakama Tsuyoshi)
数学の哲学を専攻して研究者を目指し、20代のほとんどを大学院で長々と過ごす。
しかし博士号は取らずPh.D. Candidateで進路変更。
哲学と特に関係なくIT業界に住んでいる。

別館:アマゾンのレビューページ

最新トラックバック

検索フォーム

QRコード

QRコード