その数学が戦略を決める

 おおぅ、もう三月。今年の目標は更新頻度を上げること、とか抜かしてたのは誰だろう(汗)

その数学が戦略を決める

その数学が戦略を決める

 専門家はデータに基づきつつ、長年の経験と直感で正しい判断を下してくれる。やっぱり頼りになるのは人間。…という思いこみをひっくり返される本。言い換えると、データマイニングなめんな。

 たとえば医療。診断プログラムに症状を入力すると、膨大なデータベースから関連性予測によって病気の候補を教えてくれる。重要なのは、人間には思いこみがあるがプログラムにはそれがないこと。聞いたこともない病気も、「以下の可能性は考えましたか?」と示してくれる。
 この便利な道具で人間が判断を下せば最強!と思いたくなる。ところが、本書は逆のことを主張する。最終の判断プロセスを人間に委ねると、結果としてミスが増える。逆に判断は絶対計算に任せつつ、人間の専門家による判断をデータとして加えることで、より正確になるのだという。主従逆転。

 ここで思い出したのがレファレンス協同データベース(長いから以下レファ協)のこと。今は司書さんがレファ協を参考にしてレファレンスを行う。しかし見方によれば、全国の司書がせっせと専門家ならではのデータを蓄積している。自分は技術的なことは分からないけど、自動レファレンスのプログラムを作りたい人がいたら、結構使えそう。
 あるいは、自分の愛してやまないサイト「覚え違いタイトル集」。こんな問題解けるのは人間だけ。でもこれをwebに挙げることで、誰かがGoogleで調べた時にヒットする率が高くなる。Googleをデータベースと見れば、その精度を高めるために人間が貢献しているということ。


 また、人間の専売特許と思われがちなクリエイティブ分野でも絶対計算が活躍。アメリカでは、脚本が売れる映画になるかどうかをいくつかの要素から予測する会社があるという。そんなのパターン化して面白くない?しかし無名の俳優が主演する映画でも、要素に合致していれば高得点になる。無名の脚本家の本は読んでももらえない世界とどっちがクリエイティブか。
 この話からおおっと思ったのは、Google Book Searchのこと。古今東西の本がテキストデータになるということは、それを使って本の内容分析ができるということ。自動で書評を書いたり、古今東西の名作から売れるパターンを自動生成したり、文学研究にも使えるとしたら、これってすごいことだ。と今更気付く。


 人間の判断は絶対計算にかなわないという考え方は、もちろんあらゆる専門家から反発を招く。医師、教育者、映画製作者などなど。だが本書ではそういう専門家を「恐竜」と一蹴。
 一方、絶対計算自体の問題点についてはいくつか指摘されている。確かに計算自体は人間の作るもの、偏見やミスはどうしても存在する。データから最高にマッチする相手を探します!と謳った出会いサイトでも同性カップルはできないようになっているが、これは同性愛に対する偏見じゃないか、とか。自分の情報を誰かに把握して分析される怖さについてもさらりと触れている。さらりと過ぎて自分はちょっと物足りなかったが。

 だが機械の強みはやっぱり大量のデータを参照できること、決めたルール以外の先入観にとらわれないこと。それによって、隠れたニーズや因果関係を発見できること。


 読後、レコメンド機能の話題を思いつつ色々妄想。
 人間の司書さんで、個々の利用者の好みを把握して本をすすめる人はいるらしい。いいことだと思う。が、やっぱり限界はどうしてもあるよな、と思う。1つめはこの本のとおり、どんなに頑張ってもデータ収集と分析の面で機械にかなわないという点*1
 2つめの限界は自分で思いついたのだけど、そういう本人すら気づかないニーズを人間に指摘されるのは抵抗がないか?むしろ機械の方が気が楽なのでは?ということ。
 小説の好みくらいなら当たればうれしいし、外してもさほど実害はない。だがたとえば、定年後妻と楽しく過ごそうと計画中の男性が「熟年離婚されないために」的な本を勧められたらどう感じるか。自分からその本がほしいと要求したわけじゃない人に対して、ガン、借金整理、リストラ後の対応についての本を勧める度胸があるか。下手すりゃクレームだ。
 以前性的マイノリティへの情報提供に関して、思春期の子供にとってはそういう情報にアクセスすること自体に抵抗があり、必要な情報を得られないという話もあった*2

 必要だけど、はっきり自覚していなかったり、抵抗があって表示できない情報要求。それをくみ取って必要な情報への道案内をするためには、ある意味機械の方がいいのかもしれない。機械のおすすめなら、必要だと思えば参照し、いらないと思えば「けっ機械はしょうがねぇな」と思ってすむ。本を読むことが娯楽か、必要な情報を集める手段か、によって答えは違うのかもしれない。


 本書の最後の方で「デスク・セット」という映画が紹介される。電子頭脳EMERACと図書館司書バニーのレファレンス対決、というテーマの映画らしい。

「デスク・セット」は、技術的な対立を解決する方法の面でも示唆的だ。ヘプバーン演ずるバニーは、EMERACほどデータ取得が速くない。だが最終的には、コンピュータはバニーのような人物を不用にはしない。単にその活躍の場が変わるだけで、コンピュータは結局は、彼女をはじめとする司書たちをもっと有能で有益にしてくれるのだ。教訓は、コンピュータというのは人生を楽にしてくれるものだ、ということ。(p291)

*1:だから無駄とは思っていない。そういう気遣いのできる人は好きだし必要。ここで言ってるのは人間としての限界の話です。

*2:第5回ARGカフェ・フェストでの小澤さんのお話