FC2ブログ

Latest Entries

エリック・シーゲル『ヤバい予測学』


機械学習による予測について。どんなユースケースがあって、どこまで実際使われているのかを軽いタッチで描いている。とても読みやすく、啓蒙書としては良いだろう。ただ2013年の本なので、情報はやや古い(原著は2016年に第二版が出ている)。

Predictive Analytics World(PAW)という機械学習による予測に関する大きなカンファレンスがある。著者はこの主催者を務めていたこともあり、多くのユースケースの話はPAWでのセッションから来ているものと思われる。最後には予測分析のユースケースが147も列挙されていて(p.375-386, 24-31)、ここを眺めるだけでも面白い。なかには意外な予測結果となったものもある(p.149-161, 371)。予測分析は、データ主導の意思決定を目指している(p.34f)。予測によって意思決定を支援した様々な例が登場する。

例えばジョン・エルダーによる株価予測モデルの開発経緯(p.62-72)。株価分析の試みは多くが失敗しているが、エルダーの場合、10年経ってモデルの整合性が取れなくなる前にファンドを縮小して利益を確保した成功例だ。株価分析については、人々のブログに不安を表す言葉がどれだけ現れているかから、二日後のS&Pの下落を予測などもある(p.168-175)。HPが退職者を予測し予防策を取る話もある(p.88-97)。第4章はチェース銀行が、決定木で住宅ローンの繰上返済を予測する話に全面的に当てられる。ちなみに第6章はアンサンブルモデルの解説を、IBMワトソンの「ジョパディ!」勝利をメインに語っている。ワトソンが長々と扱われるあたりは記述の古さを感じる(といっても2011年なのだが)。

小売り大手ターゲットが、消費者の妊娠を予測した例はよく取り上げられる。本書には当時にPAWの主催者として、メディア対応にあたった経緯(p.75-81)が書かれており面白い。予測分析を悪者にしようとするメディアとの攻防。最後には、アップリフトモデリングの話が最先端の話題として扱われている。顧客行動の予測だけではなく、その予測に基づいて施策を打ったときの効果の予測こそ、マーケティングで必要とされる。テレノールはアップリフトモデリングでROIを11倍に改善(p.316-320, 351-354)。USバンクのダイレクトマーケティングにおける、アップリフトモデルでの改善は、ROIは5倍だ(p.335-347)。

大量のデータによる分析は400年前の顕微鏡の発明に匹敵する。顕微鏡は小さすぎて見えないものを見えるようにしたが、データ分析は大きすぎて見えないものを見えるようにした(p.140f)という類比はなかなか面白い。予測分析はあくまで、人間の意思決定の支援に位置づけられる。肝心なのは予測をすることではなく、それを使って何をするかだ。プライバシーに深くかかわる予測をしても、予測すること自体がすぐに犯罪ではないが、大きな責任が生じる(p.123)。予測分析を使って意思決定をすることは、新しい種類の偏見バイアスと誤謬性エラーを取り入れて、人間の判断とバランスを取ることだと説く(p.115f)。予測は当たればいいのであって、因果関係はどうでもよいと見える記述もあるが、それでは予測結果を意思決定には使えないだろう。ポイントは性急な因果関係の特定を避けることにある(p.163-168)。

本書には「〇〇効果」と称されるキーワード的なものが5つ登場する。いまひとつ統一感があるようには見えない列挙だ。1. 予測効果。何が起こるかという見通しは、ぼんやりとしていて正確でなくても確かな価値をもたらす。小さな予測でも大きな効果をもたらす(p.32)。2. データ効果。データは必ず何かを語る。いくつかのデータをまとめれば、価値のあるつながりが見えてくる(garbage in, garbage outであるように自分には思われるが)(p.145)。3. 帰納効果。人間の技とプログラムを組み合わせて過学習を回避する(p.225)。というより、過学習を回避する仕組みは人間が考え出す必要がある。4. アンサンブル効果。アンサンブルに参加した予測モデルは互いの限界を補い、アンサンブルを構成する個々のモデルより、全体としてより正確な予測をする(p.257)。5. 説得効果。個人を説得できるかどうかは観察できないが、アップリフトモデリングで予測できる(p.346f)。
スポンサーサイト

山口周『天職は寝て待て』


積読解消期間。電通、ITベンチャー役員、外資系コンサル数社と渡り歩いてきた著者の転職論。自身の体験だけでなく、組織論を中心として様々な文献を引いてくる。単純な転職論よりもずっと論の厚みが感じられる印象。自分自身がいまはキャリアの悩みが少なくなったので、本の内容が深く刺さることは少なかった。

基本的には性急なやりたいこと探しや転職を戒める筋。確かに、自分のやりたいことはそんなに容易に見つかりはしない。「往々にして人は「自分が好きなこと」と「自分が憧れていること」を混同している」(loc.933)という記述にはとてもうなづいた。また「その職業なりの面白さや楽しさというのは、結局のところ、その仕事をある程度までやり込んでみないとよく分からない」(loc.960)というのもその通りだろう。

そこで、自分は何をすべきなのか、したいのかと考えるよりは、何が譲れないかを考えるほうがよいと書く(loc.1110)。エドガー・シャインという人のキャリア・アンカー(仕事において犠牲にしたくない価値観)を挙げてくる。アンカーは8つ。専門家としての能力を発揮することに満足と喜びを覚える(専門・職能別コンピタンス)、組織の階段を上り詰める出世欲(全般管理コンピタンス)、自分のやり方やペースを守って仕事を進めたい(自律・独立)、自分の人生の安定が最優先(保障・安定)、創造的・芸術的なことがらや事業を起こすことに幸福感や充実感を覚える(企業家的創造性)、世の中をよくする社会問題の解決に価値を感じる(奉仕・社会貢献)、一見不可能なことがらに挑むことを追求する(純粋な挑戦)、ワークライフバランスを追求する(生活様式)。自分がどの側面が強いのかを知り、検討する職業や会社がどういうタイプに当てはまるのかを知ることはとても役に立ちそうだ。

他には、仕事を「課題先行」と「好奇心駆動」の二つのタイプに分けて考える枠組み(loc.1988)も参考になる。課題があってそれを解くことを旨とする仕事か、課題を自分で作り出していく好奇心駆動型の仕事か。前者はコンサルティングファームが典型だし、後者はベンチャーが典型。この二つのタイプは求められる能力が大きく異なるため、片方で成果を出した人がもう一方でも成果を出せるとは限らない。

キャリアに悩む人は一度読んでみたほうがよいだろう本。ただこの本はキャリア選択についてなので、では選択したいキャリアがそもそもあるのか、将来性は、といった観点はない。

松田雄馬『人工知能の哲学』


ちょっと自分には評価しにくい一冊。NECで脳型コンピューターの開発をしていた著者が、知能とは何かを巡って認知科学、動物生態学、非線形力学などを手掛かりに論じている。

第一章では導入部として、人工知能とロボットの研究史をざっと追っていく。第二章では知覚における錯覚の事例を中心に、認知主体が物理的世界そのものではなく、脳で世界を「作り出している」ことを論じる。第三章では脳を機能的に理性脳、情動脳、反射脳の三区分に分ける脳仮説を元として、社会性の担い手が社会脳であることを論じていく。第四章はかなりミクロの話となり、非線形力学において振動や渦の自己組織化がなされていく様を、ファン・デル・ポール方程式を中心に論じる。第五章はシンギュラリティの話。結論として、知能とは環境において、そこにあるもので何をできるのかなど、「意味」を見出していくものであり、そうした知能は人工的に作られていないとなる(p.211)。

哲学とタイトルに謳っているのだが、あまたある哲学的議論を踏まえたものはほとんどない。いわゆる大学のディシプリンとして哲学に属するものでまともに出てくるのは、サールの中国語の部屋と、西田幾多郎、ベルクソン『創造的進化』のみ。認知、社会性、コミュニケーション、組織創発といった話題についての哲学的議論は山のようにあるが、本書はそれらを何も参照していない。ディシプリンとしての哲学を参考にしない思想は哲学ではないというつもりはないが、違和感を強く持つ。分析哲学の流れに親しんでいる人には、高橋昌一郎を哲学の議論で参考になるものとして挙げてくる(p.13)時点で黄色信号だろう。

ちっとも哲学的でないと感じるのは、本書に哲学的問いと営みを感じないからだろう。我々の日常的直感の前提への懐疑や、概念の掘り下げての検討といったものはあまりない。様々な自然科学の成果から無批判に議論を取り出してくるのみに映る。

私たちの見ている世界は主観的に作り出されたもので、それを客観的な世界と考える私たちは騙されていると著者は語る。素朴実在論と表象主義が前提とされているように思える。その結果、ユクスキュルの環世界もイリュージョンになり、アフォーダンスも環境の情報でなく、感覚になってしまう(p.127)。環世界は主観的な世界像でなく世界そのものだし、アフォーダンスは世界そのものにある情報である。素朴実在論のなかからだと、こうした現象学的観点は理解は難しいだろう。

自然科学に詳しい人が生命や知能について語ろうとすると、この本のような展開になるのをよく見かける。自然科学的世界像を前提としたうえで、特に概念批判を行わないまま自然科学的成果から類推で外挿する展開。例えば渦の自己組織化の話があっても、ここから認知主体間の組織の話へはほとんど連想ゲームしかないように見える。こうした試みに哲学の議論を参照する必要性がないと思われているのは、とても悲しいことでもある。

森岡毅、今西聖貴『確率思考の戦略論』


消費者購買行動の確率モデルを詳細に述べた本。主に、著者たちのP&Gでの経験に基づいている。USJでも広範に利用されているが、テーマパークは消費財とは違う(特に購買頻度や配荷の考え方)。主になっているのはP&Gのほう。

端的に書くと、消費者の購買確率は負の二項分布で近似することができるということ。負の二項分布でいう、各試行の成功確率を消費者の好意度preferenceと捉える。好意度は消費者のブランドに対する相対的な好意度であり、ブランド・エクイティー、価格、製品パフォーマンスにより決定されるという。そして市場構造は、消費者の好意度によって決定される(p.22, 34-36, 82-91)。難しく見えるが、結局は各消費者が各製品をどれだけ好んで購入するかが、各製品のマーケットシェアを決定し(というか定義し)、各消費者の購入頻度を合わせればマーケットサイズが決定(定義)される。

ここで好意度は消費者個々が持つように見えるが、モデル上は消費者全体についてのみ一様に語られる。そして一様の好意度を持つ消費者がどのくらいいて、購入可能なところにいるかが消費財の戦略の要素となる。つまり好意度preference、認知awareness、配荷distribution。すなわち認知率と配架率が100%なら、好意度はユニットシェアと一致する(p.238)。この3つに絞り、勝てる確率の高い戦略に素早くたどり着くことが戦略を立てる際に着眼すべきこと(p.39-41)。著者たちはあくまで好意度が本質と語る。認知に先立つ好意度というのは一見謎だが(知りもしない商品にどうやって何らかの購買傾向を持つのか)、各消費者に依存しない一様な好意度を考えている。実際の導出を見ると、好意度は認知率の決定要因にはなっていない(p.77)。

さらに個々のブランドの間のスイッチを考えると、個々のブランド選択確率を多項分布で近似できる。こうして消費者の購買行動は、ディリクレ負の二項分布と呼ばれるもので表される。それはある一定の期間における、カテゴリ全体の購入回数R、ブランドr1からrgまでの内訳の購入回数を変数で与えたとき、その確率Pr(R, r1, ..., rg)を示す。この確率はカテゴリを購入する世帯における割合と解釈できる。このモデルが成立するには4つの前提がある(p.30-34)。各消費者の購買行動は互いに独立。消費者が購入時にどのブランドを選択するかは多項分布で決まっている。ブランド選択は好意度の順位が高いほど、購入確率が高い(ガンマ分布している)。ブランド選択はカテゴリーの平均購入回数の多寡にはよらない。

というようにモデルが解説されるのだが、使っている数学がどうも一般的でないので読みにくい。そもそもDirichletを「デリシュレー」と記載している点で、怪しげな予感がするだろう。普通に数学を学んだ人であれば、Dirichletはディリクレと表記することは常識。確かにフランス生まれの数学者なのでフランス語読みするのもありだが(実際フランスではフランス語読みでデリシュレーと読まれる)、ドイツの数学者として認知されていてドイツ語読みをされるのが通例で、アメリカ含めて世界的に発音は「ディリクレ」である。

乗法記号を×と・の2つを説明なく使い分けていて意味不明(p.238-241)だったり、負の二項分布の説明は、各試行時に選ばれたほうのd個の玉を追加するという説明になっている。普通には、k回の成功を得るまでの失敗回数の分布として説明されるはず(例えば東大統計学教室の『統計学入門』p.119)。でもガンマ分布とポアソン分布の積になるから、一般的な負の二項分布のことを言っているはずだ。そういう定式化もあるのだろう。ある期間Tにおけるブランドiの購入回数riが本来は負の二項分布に従うのに、負の二項分布そのものを使わずにガンマ分布で近似する(p.260)とか、数学的に意味をなしていない式のようなもの(式(17), p.261)があったり(おそらくKruschkeのダイアグラムとか使うべきだろう)、消費者が実無限個いることになって積分されたりとか(p.265)、なんだか数学的内容はこちらの能力もあってついていけないことが多い。

著者が二人いることがポイントで、戦略は異なる観点から必ずプランBを用意しておくことが重要と説く(p.98-100)。著者のうち森岡氏のほうは独自の理論を自信満々に語るので読者は惑わされやすい。実務的には後半の、今西氏の記述部分が大いに参考になる。需要予測はぴったり当てるよりも大きく外さないことが大事で、幅を持たせて予測し、理想的には予測値が現実より少し少なめなのがベスト。また予測が大きく異なった場合には、まず関係する記録書類やデータを誰よりも早く保全し、後で分析すること(p.158-160)。予測の精度と予測モデルの精度を区別すること。精度の良いモデルでも説明変数が多く、その値に大きな振れ幅がある場合には、予測の精度は悪くなる。こうしたモデルは要因分析に使える。実際の予測にはできるだけ説明変数の少ないモデルが好ましいこと(p.165)。

さらに、ハリーポッターの需要予測の実際はとても面白い。多くの観点から独立的な試算をすることの大切さ。できるだけ似た状況の例を探し、最大と最小の幅をロジック、数学的知識、市場・商品カテゴリの知識を総動員して考える。映画の動員数とそれに関連するアトラクションをTDR、USJが展開したときの来場増加数から推定(p.166-180)。消費者調査データの読み方についての非常に実践的なアドバイスも重要。絶対値は怪しいが相対順位は比較的正しい。質問のバイアス。プレミアム価格の場合、実際にはお金は払わないテスト時と差異が出ること、など(p.190-204)。もちろん、消費者の購買意向を探るコンセプト・テストとコンセプト・ユース・テストもさすがP&Gアメリカ本社で鍛えたもので、ここまで具体的に書いてあるのは驚嘆する。

数学的内容についてはこの本だけでなく、元になっているA. Ehrenberg, "Repeat-Buying"という本を参考にすべきなのだろう。

信原幸弘編『ワードマップ 心の哲学』


心の哲学の現状を俯瞰する、とてもよい本。最初に読む本ではないが、ある程度この分野に理解があれば、分野の広がりや議論されているトピック・立場がよく分かる。二元論、行動主義、心脳同一説といった古典的なトピックから、志向性や意識の表象説といった最新の議論まで。さらに生態学的心理学、美学(芸術認識というより感性的判断評価)、精神医学など他分野と絡めたトピックも扱われ、心の哲学の提示する問題の広さが伺える。若手を中心に複数の著者が書いている。著者によっては分かりにくいものもある。

古典的な論点も現代的な視点から捉え直されているのがよいポイント。観念論は、概念枠という形でクワインまで持ち越され、命題的な心的態度の外に実際との接点をいかに確保するか、カントやヘーゲルの思考に求めようとする試みがある。現象主義は、知覚と幻覚で同じ種類の対象が経験されているという前提に異議を唱え、知覚と幻覚に認識論上の差異があることを主張する選言主義の展開がある(p.12-19)。外在主義と内在主義の対立は、心の志向的側面と現象的側面が分離できるかにかかっていると捉え直されている。現象的経験すら外在的環境によって決定されるとするには無理がある(p.82f)。古典的計算主義とコネクショニズムについてはちょっと記述の熱が薄く、淡白な筆致に見える。コネクショニズムの言うニューロン群の興奮パターンには構文論的構造がないため、体系性を持つ思考能力や推論能力は当てはまらず、コネクショニズムは限られた範囲の認知にのみ適用できるモデルだとしている(p.235)。これはディープラーニング研究でのNeural Turing Machine以降の試みを見ると、そうも言えないと思うが、そもそもディープラーニングを脳に類比的に考えることが誤りだと思う。ちなみにこの項の著者はアルファ碁の成功の背景がディープラーニングによる盤面のパターン認識と書いている(p.i)ので(そうでなくまずは強化学習やMonte Carlo Tree Searchでしょう)、ディープラーニング方面には明るくないと見える。

クオリアを巡るハードプロブレムが明らかにするような現象的意識の奇妙さについて、端的に3つのポイントにまとまっているのが有益(p.128)。機能的性質についての知識から、現象的性質についての知識を導けないこと(メアリの部屋論証)。人間と機能的性質において同型だが、現象的性質を欠いているものが思考可能であること(哲学的ゾンビ)。そして機能的性質の記述では現象的性質を説明できないこと(説明ギャップ)。これは問題の定式化として抜群。

心の哲学が神経科学の成果を受けた科学的アプローチと、行為者の信念や欲求の理解に関わる合理性のアプローチの両面を持っていることが何度も顔を出す。非法則的一元論が明らかにそうだし、自己知について論争(p.192-198)や、精神療法の理解(p.261-265)といったところにも、この二つのアプローチが見られる。

神経科学的アプローチと合理性からのアプローチは、解釈主義の広義と狭義への分類のところで面白い(p.50-55)。狭義にとって、心的状態は解釈によって主体に帰属される行動パターンだとすれば、ある種の行動主義となる。この行動主義では心的状態と物理的状態のトークン統一性すら認められないので、消去主義か道具主義に至ると位置づける。デネットが解釈主義を経て、道具主義として位置づけられる。ただし解釈の理論の規範性は、そもそも脳科学などの自然科学での置換を許さないという論点もある。

他には、意識の表象の志向性の問題と高階表象説、そして盲視からの反例と、高階表象の誤表象といった問題(p.102-107)が最高に面白い。さらに個人的に関心が強い予測誤差最小化理論と、それが持つ身体や脳の独立性の前提を疑う,拡張された心(p.240-245)。因果的に強く依存しているものは構成要素なのか。認知過程を脳と身体に限る従来の発想をいかに超えるか、とても興味深い。

知識がまとまるとともに一気に関心が広がるよい本だ。

Appendix

プロフィール

坂間 毅 (Sakama Tsuyoshi)

Author:坂間 毅 (Sakama Tsuyoshi)
数学の哲学を専攻して研究者を目指し、20代のほとんどを大学院で長々と過ごす。
しかし博士号は取らずPh.D. Candidateで進路変更。
哲学と特に関係なくIT業界に住んでいる。

別館:アマゾンのレビューページ

最新トラックバック

検索フォーム

QRコード

QRコード