Entries

松尾豊『人工知能は人間を超えるか』

人工知能は人間を超えるか ディープラーニングの先にあるもの (角川EPUB選書)人工知能は人間を超えるか ディープラーニングの先にあるもの (角川EPUB選書)
(2015/03/11)
松尾 豊

商品詳細を見る

先に種明かしをしておくと、「グーグルがネコを認識する人工知能を開発した」という一見すると何でもないニュースが、実は、同じグーグルが開発している自動運転車のニュースよりも、ずっと「本当にすごい」ことだとわかってもらえれば、本書はその役割を果たしたことになる。(loc.366)

人工知能についての過去の歴史をたどりながら、最近の話題である深層学習(deep learning)とその意義について書かれている。技術的な話題に触れたものだが、かなり読みやすい。一般向け説明のうまい人と見える。人工知能の話題については、データサイエンスの流行もあって大きく注目されている。だがその意義やもたらす影響については様々なことが言われているのが現状。何ができて何ができないのか、つまり「すでに実現したこと」と「もうすぐ実現しそうなこと」と「実現しそうもないこと(夢物語)」をきちんと腑分けして提示することが必要だ(loc.348)。

人工知能は過去にも流行になった。1956年から1960年の第一次ブームで、推論や探索がメインテーマだった。1980年台に第二次ブームがあって、これは知識の時代。そして現在が第三次ブームで機械学習と特徴表現学習(representation learning)の時代だ(loc.42, 636)。第一次ブームのAIは与えられた情報を分析・理解するものであり、これは言われた事柄だけをこなすアルバイトのようなレベル1。第二次ブームのAIは大量の知識・ルールを備えたもので、一般社員のようなレベル2。第三次ブームにあるAIは、決められたチェック項目に従って業務をよくしていく課長クラスのレベル3と、チェック項目まで自分で発見するマネジャークラスのレベル4と特徴づけられている(loc.571)。意外にも、IBMのワトソンはレベル2のAIだとされている。ワトソンは「質問の意味を理解して答えているわけではなく、質問に含まれるキーワードと関連しそうな答えを、高速に引っ張り出しているだけである」(loc.975)。ちなみにここで言うワトソンとは、アメリカのクイズ番組"Jeopardy!"に登場して優勝したものだ。

本書が語ろうとしている深層学習は「人工知能の50年来のブレークスルー」(loc.1388, 1439)である。ただしこれは著者の見解で、そうではないとする見解もある(loc.1711)。それまでのAIがいかなる問題に突き当たって、深層学習がブレークスルーになったのか、主に3つが書かれている。(1)人間が持つ知識の全体はいつまで経っても書ききることができない。サイクプロジェクトのような果てしない試みや、オントロジー研究の深遠さ、機械翻訳の困難さが挙げられている。知識やルールには関連性があるだけではなく、関連性の無さも必要であって、その量は極めて大きく実装が非現実的だ。(2)フレーム問題。関連する情報と関連しない情報を見分けることはAIには難しい。(3)シンボルグラウンディング問題。AIは基本的に記号列を扱っていて意味を理解していない。意味によって結びついて新たな知識を得ることができない。ちなみに、簡単に書こうとしているからだろうが、概念があればそれに言葉を当てればよいというクワイン的な博物館の神話が本書には見られる(loc.1859)。

これらの問題が意味するのは、AIは概念を自ら獲得できていなかったということだ(loc.1385, 1699)。概念は、人間が与えてきたのである。例えば機械学習の精度を上げるには、何が事象にとって意味のある特徴なのかを人間が考えて、AIに学習させなければならない。こうした「特徴量設計」が機械学習の最大の関門だった。つまり、「世界からどの特徴に注目して情報を取り出すべきか」に関して、人間の手を借りなければならなかったのだ。深層学習がブレークスルーなのは、AI自身が与えられたデータから注目すべき特徴を見つけ、その特徴の程度を表す「特徴量」を得ることができるからだ(loc.1367, 1435)。

深層学習の特徴は二つ。一つは言葉の通り、学習の階層を何層にも重ねて行うこと。もう一つは、自己符号化器(autoencoder)という「情報圧縮器」を用いること。自己符号化器がやっていることは、主成分分析と同じだと書かれている(loc.1559)。入力した情報から自己符号化器を用いてより抽象的な、高次の特徴量を生成する。それを次の層に入力して、より高次な特徴量を得る。こうして与えられた個別例から、教師なし(unsupervised)で高次の抽象概念を獲得する。これは概念の適用例や適用規則を人間が天下りに与えることとは異なる、自己学習のプロセスだ。さほど強調されていないが深層学習の三つ目の特徴は、出力を入力と突き合わせることだろう。普通は入力は別の出力(すなわち回答)と突き合わせてフィードバックを行う。深層学習の場合、獲得した高次の特徴量から個別例が再現できるかを見る。深層学習は2006年頃から始まっているが、そのアイデアは1980年代の日本にもあるという。深層学習が生まれなかったのは、強固な概念を獲得するために「ノイズ」つまり若干違ったサンプルを混ぜるという、正則性のための方法と、マシンパワーが不足していたためとされる(loc.1632-1694)。

後半は、深層学習がブレークスルーだとして、その限界や早とちりしがちなところのフォローをしている。AIが人間を滅ぼすかもしれないといったSF的懸念には著者は賛同しない。それには自己生存欲求が必要だろう、生命の概念が抜けているところでは成立しない話だ(loc.2031)。懸念はそんなところではなくて、AIが深層学習で獲得する概念は、人間の持つものと異なるかもしれない。それを人間の概念に近づけるために、「人間と同じ身体」「文法」「本能」が必要だと論じている。身体が無ければ感覚に関する概念は人間と同じにならないだろうし、空間的概念も怪しいだろう。また文法と言っているのは生成文法のように、概念獲得を生得的に制約する仕組みのことだ。最後の本能とは快・不快の区別のこと。脳において辺縁系の活動が学習に大きな影響を及ぼしていることは広く知られている。というわけで、「こうした「人間と同じ身体」「文法」「本能」などの問題を解決しないと、人工知能は人間が使っている概念を正しく理解できるようにはならないかもしれない」(loc.1946)。その通りで、それこそ生活形式(Lebensform)であろう。ウィトゲンシュタインが『探究』で書いたように、ライオンが我々と同じ言語を話しても我々は理解できないだろう。

深層学習を備えたAIが得意とするのは異常検知である。したがって、「産業の中で異常検知に対して人手がかかっており、それがスケーラビリティや市場規模の制約となっている場合は、業界構造が一気に変わる可能性がある」(loc.2373)。例えば自動車、電車、飛行機などの操縦士・運転士がそれだ。こうして近未来には、人間の意義ある仕事は二つになる。一つは「非常に大局的でサンプル数の少ない、難しい判断を伴う業務」(loc.2308)、典型的には経営者(あとは芸術家などもこれだろう)。もう一つは「人間に接するインタフェースは人間のほうがいい」という理由で残る仕事である。

最後には、爆発的に発展する人工知能の分野で日本がプレゼンスを維持するにはどうしたらよいか、課題が挙げられている。一番の問題は、日本には「機械学習の精度が上がると売上が莫大に伸びる」というビジネスモデルを築き上げている企業がほとんどないことだろう(loc.2492)。もちろんアメリカにもそんな企業はごくわずかだが、その規模や投資資金は膨大だ。

最近の人工知能の展開について平易に知るには最適な一冊だろう。特に歴史を踏まえていることは学ぶことが多い。
スポンサーサイト
この記事にトラックバックする(FC2ブログユーザー)
http://exphenomenologist.blog100.fc2.com/tb.php/724-760dd75c

トラックバック

コメント

コメントの投稿

コメントの投稿
管理者にだけ表示を許可する