Entries

岩波データサイエンス刊行委員会編『岩波データサイエンス Vol.6』


全6巻完結。本巻は時系列解析、特に状態空間モデルを取り上げている。わからないところは多々あれども、なかなか良質の記事が集まっている。冒頭は時系列解析研究の第一人者、北川による解説。とてもすっきりした解説で、これを踏まえば、消費者行動を潜在モデルで分析する佐藤の記事などよく見えてくる。川崎の記事は時系列因果関係という難しい領域を扱っている。単位根検定の必要性とRでのやり方が示される。単位根過程に従う独立な時系列どうしの回帰が見せかけの相関を示すことは、単位根検定の主たる動機だが、ここか成書に譲られるのが少し物足りない。また、グレンジャー因果については言及はわずかで、ここはぜひともinformalな解説が見たかった。

特集の後は個別の話題が続く。宇宙観測データから星間ガスの分布をどう推定するかという記事。天気予報にデータサイエンスがどう活かされているかを扱ったものはとても面白い。時間発展演算子を3次元変分法から4次元変分法による推定にしたというデータサイエンスの進展により、台風の進路予報が10%改善した(p.115f)など。また最後の、夢を見ているときの脳活動からその内容を推定しようとする試みの神谷による記事は、その苦労話を含めてとても面白い。論文を読んでみよう。

阿佐志保、中井悦司『プログラマのためのGoogle Cloud Platform入門』


Google Cloud Platform (GCP)について書かれた平易な入門書。各GCPサービスが一通り扱われており、概要を知りたい向きには役に立つ。GCPを使ったサービス構築に必要な概念が書かれている。ロードバランサやDNSの知識もコンパクト。

実践例としては、オンラインゲームや写真アルバムサービスを例として、デプロイの仕方が扱われる。Kubernetesの章が個人的には最も役に立った。また、機械学習サービスについても触れられているが、これはちょっと付け足し感が強く、詳細は書かれていない。

岩根圀和『物語 スペインの歴史』


テンポの良い読みやすい一冊。およそ15世紀から17世紀、スペインの黄金時代を中心に、その歴史の一コマを物語調で書いている。扱われるテーマは、スペインの歴史の有名なポイント。イスラムによるイベリア半島侵攻、キリスト教徒による国土回復運動、レパントの海戦、地中海のイスラム海賊に拿捕されて捕虜となったセルバンテス、スペイン無敵艦隊とイギリスとの海戦。最後には第二次世界大戦後のスペインとして、国民的詩人ガルシア・ロルカの処刑、フランコ死去による王政復古、そしてETAによるテロ活動が扱われている。最後の章はやや散発的でまとまりを欠く。

イスラム侵攻については、イベリア半島側からも歓迎の向きがあったというバランスの取れた記述がみられる。476年に西ローマ帝国が滅亡した後にイベリア半島を治めた西ゴート族は、8世紀になると王位継承をめぐって内紛を悪化させる。王座をめぐる貴族間の党派争いで国内は疲弊していく。イベリア半島からアフリカに難民として脱出する者も多くみられた。イスラムのイベリア半島侵攻は、庶民にとっては救い主としての見方もあったとのこと(p.6-9)。

国土回復運動、レコンキスタについてはもちろんグラナダ開城をめぐる経緯を描く。コロンブスの新大陸への出航は、このグラナダ開城を待って落ち着くのを待たされていた。とはいえ著者の記述の多くはレコンキスタの経緯というよりは、それに伴う、あるいはその後のイスラム教徒とユダヤ教徒への迫害に充てられている。レコンキスタはイスラム教徒との戦いではあるが、キリスト教としての統合の過程でユダヤ教徒も排除されることになる。ユダヤ教徒の追放令は1492年に出ており、これはイスラム教徒の追放令の1609年より早い。いくつかの理由は推測されているが、なぜユダヤ人追放を急いだかの理由は明確でないという(p.67)。そして異端審問所の恐ろしさが、異端と断定された人への残忍な処置の様子とともに描かれる。その筆致はなかなかリアル。この異端審問所はほとんど秘密警察である(p.68-77, 80-92)。

レパントの海戦は司令官ドン・フアン・デ・アウストゥリアを中心に、セルバンテスを副として描かれる。開戦に至るまでの経緯が簡潔に描かれ、海戦そのものの様子はまるで戦場を俯瞰する記録者がいたかのように細かく書かれている。ドン・フアンの主力部隊、ドーリア率いる部隊、セルバンテスの属する部隊の動きが追われ、鮮やか筆致といえる。著者はセルバンテスを中心とする文学研究者のため、いきおい詳細な記述となる。

レパントの海戦の後、スペインに戻ろうしたセルバンテスはイスラムの海賊に拿捕され、アルジェで5年に及ぶ捕虜生活を送る。最終的には身代金との引き換えに開放されるのだが、それまでに4回にもわたる脱走計画を企てる。よくぞ処刑されなかったものだ。この過程もなかなかリアルで、ドラマを見るよう。

ハイライトの最後はスペイン無敵艦隊について。とはいえ、対イギリス海戦の敗北について。そもそも無敵艦隊の出航前に1587年、ドレイクがカディス港を襲ったことが大きな痛手となる。出港準備を済ませていた艦隊や補給物資が失われただけでなく、食糧貯蔵用の樽を製造するための板材が濡れたことが挙げられている(p.209)。急ごしらえの生乾きの板材で作られた樽は、水を腐敗させ食糧をカビさせた。このことが後の海戦で不利となる。補給物資の再調達にあたる官吏として、スペインに戻ってきたセルバンテスが登場する。無敵艦隊を率いたシドニア公爵は歴史的に不評。著者の評価は、シドニア公はカレーでパルマ公の軍勢との合流を待っていたゆえの、イギリス艦隊を直接攻撃しなかった行動とみている。この海戦の様子の描写もなかなか面白く、著者は戦闘シーンを描くのがうまいと見える。

グザヴィエ・バラル・イ・アルテ『サンティアゴ・デ・コンポステーラと巡礼の道』


サンティヤゴ巡礼について、多くの写真を載せて書かれたとても読みやすい一冊。巡礼者を描いた多くの彫刻や絵画、また教会建築などが写真付きで載っている。著者は中世美術史に明るい。サンティアゴにおけるヤコブ信仰の起こり、巡礼路としての成立、巡礼路の教会や修道院、そして目的地サンティアゴ・デ・コンポステーラについて扱われている。

イエスの弟子ヤコブがサンティアゴに埋葬されているという伝説は古くからあった。9世紀初頭にペラギヌスが「ヤコブの墓」を発見したとされ、アルフォンソ2世によって教会がコンポステラに建てられる。おりしもレコンキスタの最中、ヤコブはキリスト教徒を イスラム教徒から守る守護聖人であるという考えと結びつく。モーロ人殺しのヤコブ、サンティアゴ・マタモーロス(p.20-25)。

おりしもイスラム教徒のヨーロッパ侵攻により、エルサレムはおろかローマまでも巡礼に赴くのは難しくなってきていた。そこでサンティアゴが巡礼地として定着し始める。ところでイスラム教徒にとってメッカに巡礼することは信者としての義務であって、メッカ巡礼を行わないイスラム教徒はアラーの天国に入ることができない。一方、キリスト教徒にとって巡礼は天国に入る一つの方法ではあるが、あくまで熟慮に基づく自発的な行為である。行き先や時期も自分で決めることができる(p.30f)。巡礼については、イスラム教とキリスト教で大きな考え方の違いがある。

サンティアゴへの巡礼は、10世紀になってフランスからの巡礼者が増える。13世紀から15世紀までが巡礼の栄光の時代と言える。15世紀になると巡礼に対する懐疑的な考えが次第に広がり、16世紀後半には宗教改革によってその懐疑は頂点に達した。この後、巡礼はルネサンス期から19世紀まで長期にわたって衰れることになった(p.78)。しかしサンティアゴは再び巡礼地として注目を浴び、世界遺産への登録(1993年)に極まり、多いときは月当たり5万人を超える人が訪れる。

小さな手軽な本であり、図表が多く見ていて楽しい。聖ヤコブの日にサンティアゴ大聖堂前の広場を埋め尽くす人の写真は特に圧巻だ。

ゴードン・リノフ、マイケル・ベリー『データマイニング手法 3訂版 予測・スコアリング編』


マーケティング系の事例を盛り込んで、データマイニングの手法を解説したもの。データ分析の一般的な流れを扱った章の後、決定木、ニューラルネット、k最近傍法、生存分析の4つの手法について、その概要と顧客分析での実例が書かれている。実例というよりは手法によった解説がメイン。もう少し事例の話が聞けるとよかった。解説の内容はあまり数式は出てこない。直感的な説明を心がけている。

面白かった事例としては、追加反応モデル(単純にキャンペーンに反応するかどうかではなく、キャンペーンが反応確率を増すかどうかの予測)でUplift Optimizerという決定木系のソフトウェアを用いて住宅担保ローンのクロスセルを改善したU.S.バンクの話(p.81-85)。同じく決定木でコーヒー焙煎機のシミュレーションを行ったネスレの事例。これは30秒後の各変数を目的変数とする多数のモデルを作成している(p.102-105)。さらに、相互情報量を距離としてk近傍法を適用した、マンモグラフィの異常発見の話(p.172-176)が興味深かった。

いままできちんと触れたことがなかったので参考になった記述として、ネットワークモデルとしてRBF(Radial Basis Function)モデル。RBFは多層パーセプトロンと並ぶニューラルネットのモデルとして紹介されている(p.134-139)。この説明だけだと概要をつかむのはやや苦労する。ちなみに本の執筆は2014年だが、ディープラーニングの話はまったく出てこない。

生存分析は概要や、コックスの比例ハザードモデルの話、また顧客分析への適用とてもよく書けていて参考になった。生存曲線はパラメトリックには分析できないという話(p.215-217, 234)が書いてあるのが目に留まる。経験則から来ているようだ。