Entries

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
この記事にトラックバックする(FC2ブログユーザー)
http://exphenomenologist.blog100.fc2.com/tb.php/557-6c153ec3

トラックバック

コメント

コメントの投稿

コメントの投稿
管理者にだけ表示を許可する

ビクター・マイヤー=ショーンベルガー、ケネス・クキエ『ビッグデータの正体』

ビッグデータの正体 情報の産業革命が世界のすべてを変えるビッグデータの正体 情報の産業革命が世界のすべてを変える
(2013/05/21)
ビクター・マイヤー=ショーンベルガー、ケネス・クキエ 他

商品詳細を見る

(引用元表示はkindle版の位置No.を表す。kindleは引用するには向かない。)

ビッグデータへのシフトの背後には、人類が古代から挑んできた計測、記録、分析へのあくなき挑戦がある。IT革命が起こったことは確かだが、これまで「IT」の「T」(テクノロジー)だけが脚光を浴びすぎた観がある。そろそろ「I」(情報)にも目を向けるべきなのだ。(loc.1568)



ビッグデータの普及による社会的影響を扱った本で、よく書けているし話題になった本。相変わらず邦題はセンスが無いが、原題のサブタイトルには「我々の生活、働き方、考え方を変える革命」とある。ビッグデータの概要についてはもちろん解説しているが、技術的内容、数学的内容、またマーケティングなど企業戦略的内容についてフォーカスした本ではない。ポイントは、ビッグデータが与える社会的影響、また我々の思考様式への影響にある。そしてそれを様々な具体例を紹介しつつ説得的に語っている。

ビッグデータが与える社会的影響について言えば、データに基づく判断がもらたす僥倖を幾分楽観的に描いた『その数学が戦略を決める』や、ただ憂鬱、憂鬱というだけで何の対策もない『ビッグデータ社会の希望と憂鬱』もある。本書が優れているのはそうした間のバランス感覚だと言える。厖大なデータに基づく精緻な予想が可能となる状況にあって、それをいかに活かし制限するか、つまり「ビッグデータ・ガバナンス」(loc.3463)についてまともなことが書いてある。こうした本は少ないのではないか。

ビッグデータがもたらす社会的変化について、要領よくまとまっている。それは、①「ビッグデータは限りなくすべてのデータを扱う」(loc.304)、② 「量さえあれば精度は重要ではない」(loc.315)、③「因果関係ではなく相関関係が重要になる」(loc.339,323)の三つにまとめられている。

①のビッグデータのBignessについて言えば、まずもってそれまで利用価値がなかったと思われてきた雑多なデータへの意識の変化(loc.164)が挙げられる。実に多種多様なデータ、例えば人間がネット上、あるいはネット外でも数々のセンサーを通過した副産物として残るデジタル痕跡、「デジタル排出物」(loc.2252)でさえ、ビジネスの素材として、重要な経済資源として、新たな経済価値の創出に活用できるようになる(loc.168)。そうしたビッグデータの活用は、データ型、スキル型、アイデア型に三つに分類される(loc.2461)。この世界がデータの集まりだという世界観は、いままでなかったものだ(loc.1933,1990,1993)。もちろんテクノロジーの発展(特にストレージ、ネットワーク)がこれを可能にしているわけだが、著者は数値アルゴリズムの発展にも着目している。ある調査によれば、1983年から2003年の間に、およそ43000倍もアルゴリズムの性能は向上しているのだという(loc.733)。こうしたデータ処理技術の発展には我々の方法や意識が追いついていないのが現状である(loc. 558)。
さてこうもデータが厖大に取得されると、その使い道はすぐには分からない。そもそも、データは他のデータと組み合わさって分析されるものだ。だから、データは際限なく利用できることがポイントなのだ(loc.2429)。この点、各企業の認識は分かれているようで、グーグルはデータの2次利用を最初から考慮して収集しているようだが、アマゾンはせっかくのデータを遊ばせている、など評価している(loc.2622-2632)。ともあれ問題は、データ取得の時点で使用方法を限定してしまうのは生産的でないということである。日本でも個人情報取得の際にその目的を明示することとなっているが、データ利用の観点から言えばそれは実践的ではない(loc.2992,3372)。むしろデータは各企業に自由に使わせるべきであり、ライセンシーや第三者機関の認定などによって制御すべきだと説く。

②のデータの精度について、ビッグデータの時代には我々は「無秩序や不確実性にジタバタしない姿勢が要求される」(loc.996;3776)と著者は記す。ビッグデータで扱われるデータには精確性を欠くものも多いが、それらを精確でないとして除外するのは懸命ではない。なぜなら、不精確なデータからでも分かることは多くあり、それは精確なデータに固執するような人の想像を絶する(loc.904)。そんな態度は「情報量の乏しいアナログ世界の遺物」(loc.829)とまで言う。

③の因果関係から相関関係への移行が本書の最も大きな論点だ。これは類書も同じ。ビッグデータ時代では、相関関係で判明する事柄が増え、社会が因果関係に重きを置かなくなる。その結果、判断の拠り所や現実の捉え方について常識が問われる(loc.192)。相関関係ではその現象の理由は分からないが、大概の意志決定においてはそれで十分なのである(loc.329)。因果関係は知の源泉としての主役からは退いていく(loc.1379)。「現象の裏側にある原因を知ることが人類の最大の望みなのだろうか」(loc.1283)という著者の問題提起はなかなか重大である。
もちろん、一部の研究(医薬品の副作用実験や航空機用部品の設計など)では因果関係に基づく研究は必要だし(loc.3680)、そもそもビッグデータ自体、数学、統計学、計算機科学という理論や因果関係の上に成立しており、だからこそそれがもたらす相関関係が信頼できるのだ(loc.1450)。なお、こうした本によくあるが、演繹関係と因果関係の混同が見られる。また、事象間に因果関係があるか、相関関係があるかという話と、確率的事象かどうかが混同されている。

さて、本書の後半で語られるのはこうしたビッグデータがもたらすマイナス面が何であって、それをどう制御していくかである。ビッグデータの利用は、「人間の神聖なる自由意志」か、はたまた「データによる独裁」かという、倫理問題にまで発展する(loc.381)。ビッグデータ・ガバナンスは、既存のルールの延長線上にはない。その枠組みそのものを破壊するくらいの大胆な取り組みが必要である(loc.3360)。なぜこうもビッグデータのもたらすマイナス面が問題かというと、人間は世界を因果関係でみる癖があるからに尽きる。それゆえ、ビッグデータの分析結果も因果関係として解釈される危険がある。(loc.3185)。これはビッグデータの技術的欠陥ではなくて、データ分析結果の使い方の誤りである。例えば犯罪傾向の相関関係に基づいて、ある人を可能的犯罪者として収監するのは、ビッグデータによる相関関係の分析結果を因果関係と混同している。ビッグデータが相関関係を前提としている以上、因果関係を判定して個人の有責性を示す道具としては、まったくもって不適当なのだ(loc.3175-3181)。オーウェルの『1984』や映画『マイノリティ・リポート』などが描く社会である。

ビッグデータがもたらすリスクは3つにまとめられる。それはプライバシーが侵されるリスク、傾向や習性によって人の将来的行為が判断されるリスク、そして権力機関がビッグデータに基づき判断を行う「データ独裁の犠牲者になるリスク」である(loc.2949)。特にデータ独裁の犠牲者になるリスクが大きく取り上げられる。先に上げた可能的犯罪者の収監がまさにそれに当たる。著者は書く。「人間が運命を自ら形作ることはできないのか。確率によって可能性は命を絶たれるのだ」(loc.3754)。

データ独裁を避けるためには、人間の関与の余地を残しておくことが必要(loc.3441)であり、「ビッグデータが人間の手に負えなくなる事態だけは避けなければならない」(loc.3568)。社会が責任概念に基づいて個人を追及することを続けるなら、我々自身が自らの意思で左右できる部分が残っていなければならない。「そうでなければ、人間性の本質である「理性的思考」と「選択の自由」をビッグデータが歪めてしまうことになる」(loc.3719)。つまり、人間が人間である最後の砦、「予測不可能性」を確保しなければならないのだ(loc.3780)。

したがってビッグデータ・ガバナンスでは「実際の行為と個人責任によって人を判断する体制を今後も維持すること」(loc.3463)が柱となる。人間はあくまで人間によって判断されなければならない、というのが著者の見解である。そうでなければ責任を問う主体がいない。我々は、習性や性格などではなく、自らが為した行為つまり実際の行動にしか責任を負えないし、負うべきではない(loc.3421)。詳細な議論は省くが、著者はビッグデータ・ガバナンスの3要素を以下にまとめている。「個別同意方式のプライバシー保護からデータ利用者責任制へのシフト」、「予測に人間の関与が確実に含まれていること」、「ビッグデータ監査人に相当するアルゴリズミストの配置」(loc.3560)。要はデータ利用を自由にやらせる代わりにきちんと責任主体を置き、また外部からのチェックが可能とすることだ。だが特にアルゴリズミストの配置については、データ分析が精緻になるにつれ、そのアルゴリズムは企業秘密扱いになってしまい、監査は難しいのではないだろうか。

さて最後に。こうした相関関係に基づいて人間が判断されることを、著者は正義の概念が揺らいでいると表現している(loc.3427)。確かに過去の習性に基づき人を判断するのは、公正ではない。けれどもそれは、ビックデータによる分析が云々以前の問題として、例えばステレオタイプによる人の判断、人種差別、部落差別などがそれに当たる。精確性はともかくとして、性格としてそうした差別と相関関係による差別は変わるところがない。問題は正義よりもむしろ、行為概念の方にあると思われる。著者は行為による責任の帰属をかなり厳密に考えているが、裁判における状況証拠による認定の例を見れば分かるように、我々の責任帰属はもっと多様である。
スポンサーサイト
この記事にトラックバックする(FC2ブログユーザー)
http://exphenomenologist.blog100.fc2.com/tb.php/557-6c153ec3

トラックバック

コメント

コメントの投稿

コメントの投稿
管理者にだけ表示を許可する

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。