2010年10月27日水曜日

このエントリーを含むはてなブックマーク

The Formula ~もしヒット映画を予測できるボットを作っちゃったらどうする?~ (前編)

一度読むとまさに粘りつくように記憶に残るエピソードがある。アタマの中にはそんなのがいくつも転がっていると、時には目から入ってくる情報とおもしろい邂逅をみせてくれる。

その数学が戦略を決める (文春文庫)』(イアン・エアーズ 著 |山形 浩生・訳|2007)という本がある。
ぼくが気になっていたエピソードはその著書の中にでてくる「6.6 大コケ映画を探せ」という一章だった。これがここ数年ずっと頭のどこかに転がっていた。

簡単にいうと、映画の興収が巨額になるか、鳴かず飛ばずでおわるかを決定づけるのは、役者や監督あるいは宣伝費の大小なんかではない、シナリオの出来しだいなのだ。しかもそれは事前に数式でもって精度高く予測することが可能だ、というもの。

実はエアーズがこの題材に気づいたのが、マルコム・グラッドウェルが2006年にニューヨーカーに書いた記事「The Formula」だったのである。そう、抄訳として投稿したグラッドウェルの記事を彼のブログにみつけたとき、あとで目を通そうとマーキングしていたひとつがこの「The Formula」だった。

読み進めた途端に『その数学・・・』を憶いだし、あらためて読み返してみると、エアーズはグラッドウェルのことについてちゃんと触れていた。数年前にぼくがグラッドウェルを知らなかっただけだったのだ。まさに”知の発掘人”とでもいおうか・・・彼の広範な足跡をあらためて思い知らされた気がした。

『その数学・・・』には数式というのがニューラル予測にもとづくとされているだけで、開発の詳しい経緯が載っていない。ずっと知りたかったのは、どうやってそれが開発されたのか、だった。そして「The Formula」を読み進めると、やはりグラッドウェル。そこはきちんと網羅してた。これはベンチャーを考える意味でも示唆に富んでいる経緯だとおもう。なので忘れないようにその要約を残したいとおもう。

*   *   *

The Formula --What if you built a machine to predict hit movies?--
By Malcolm Gladwell
The New Yorker, October 10, 2006

ザ・フォーミュラ ~もしヒット映画を予測できるボットを作っちゃったらどうする?~
マルコム・グラッドウェル
雑誌”ニューヨーカ―” 2006年10月10日号掲載より抜粋して抄訳

ワシントンDCの大手弁護士事務所の弁護士ディック・コパケンの映画狂いといえば度を超してた。なんせケープ・コッドで二週間すごした休暇で彼は14夜連続で映画を見に行った。そしてもどってくると熱い口調で映画の解析を始めるのだった。コパケンは週あたり2~3本のペースで映画を鑑賞するということを、50年間やりとおした。それだけじゃない。何百もの映画のシナリオや、人物、印象的な場面といったディテールを記録していた。

取材の間、コパケンはぼくに映画『Dearフランキー』を観て、いかに感動したかを回想しているうちに感極まって泣き始めてしまった。彼は、子供のことを最優先する両親のもとに育った。そのためか、コパケンの子煩悩ぶりはひとかたならず、冷戦の最中、ミサイル配置をめぐってマーシャル諸島で米国政府とともに着いてた交渉の席を、娘が主人公を務める学芸会に間に合わせるため中座し、交渉を中断させたエピソードも残っている。そうした子煩悩ぶりが、Dear Frankieの主人公の少年の不遇といじらしさにより敏感に”感応”するがゆえに泣いてしまうんだ、とコパケンは言う。
はたして本当にそうなのか?
甲斐性のない父親と不遇の中に育つ子供なんてシナリオはハリウッド映画にはありふれている。コパケンほどの映画好きでもうまく説明できない”なにか繊細な組み合わせ”が彼をここまで感動させているのだ。でもそれを”解明”することなんてできる芸当なのだろうか?

『レイダース・失われたアーク』の企画がでまわったとき、ハリウッドで製作してもかまわないと手をあげたのはパラマウントだけだった。最大手のユニバーサルは関心を示さなかった。なぜか?
ハリウッドを代表する脚本家は言う。「どの映画がなぜウケるのかなんてハリウッドの誰もほんとうはわかっちゃいないんだ」

ミュージックの世界も似たり寄ったりだった。業界のエキスパートが”売れる”と予想したミュージックが本当にヒットした確率は20パーセントを下回っていた。
テクノロジー・ベンチャーのプラティナム・ブルー(Platinum Blue)はこうした状況を改善できると考えた。彼らは”スペクトル解析ソフトウェア(spectral deconvolution software)”なるプログラムを開発して歌曲を構成するメロディ、ハーモニー、ビート、テンポ、リズム、音階、スピード、コード進行、終止パターン、音律調整、周波数といった要素を数値化していった。結果、彼らはヒットソングにみられる”パターン”を検出することに成功し、80%の精度でヒット度を予測できるとの確信に至る。このプラティナム・ブルーがやってのけたことこそ、コパケンが映画ビジネスでやってみたいことそのものだった。

マンハッタンを見下ろすプラティナム・ブルーのオフィスを訪ねると、同社を率いるマックグリーディが迎えてくれる。彼が指差すパソコンのモニターには何千もの点が分布していた。一つ一つがミュージックソングを現すのだという。ボタン一つで過去5年間の間にビルボード30位以内に入ったミュージックソングの分布だけを残すこともできる。すると、これまで偏りなく分布していた母集団はわずか60の偏った点に絞られてしまった。つまり過去5年間にヒットした歌曲はこのわずかなパターンから発生していたのだ。
マックは言う。「レーベルが発売を予定しているニューアルバムがあると、ぼくたちは全曲を解析にかけ、このヒット・パターンとどれだけマッチするのかを報告するんだ。ヒット・パターンに残るのが必ずヒットするってわけじゃない。ヒット・パターンから漏れている曲はどんなにすばらしく聴こえてもヒットにはならないってことを事前に把握することができるんだ」

4年前、マックがバルセロナにあるレーベルから依頼をうけて発売直後の30アルバムを解析したところ、ひとつのアルバムがきわだったスコアを示した。収録されている14曲のうち9曲がヒットパターンにはまっていた。それはノラ・ジョーンズという無名のアーティストのものだった。当時マックたちの試みに関心を持った地方紙の取材に対し、彼は「次にヒットするのはノラ・ジョーンズだ」と答えている。事実、彼女のそのアルバム『Come Away With Me』は2000万枚売れ、グラミー賞の8部門を獲得する大ヒットとなった。

こうしてマックたちプラティナム・ブルーはつぎつぎとヒットソングを”事前”に発掘していく。
マックは言う。「新曲を編集するプロデューサーにはね、この要素がヒットパターンにはまってて、この要素が足を引っ張っているって教えるんだ。たとえば低音部分がとかね。すると、かれらはそこをいじってまた持ち帰ってくる。改善しているんだったら僕らはこういうんだ。その編集した調子でもうちょっといじってよ、ってね」

「ベートーヴェンもモーツァルトも数値パターンはこのヒットパターンに合致するんだ。つまりぼくたちにとってすばらしい音色は300年前の彼らにとっても素晴らしいモノなんだ。ただ現代はそれを全然違うスタイルで楽しんでいるだけ。ぼくたちを満たしてくれる、その中核にあるものはかわってないんだよ。」

ある種特殊なタイプの者たちは、世界を”紐解くことができるコード”と捉える。
彼らは現象が示すパターンやルールに魅せられ、個人や組織といった枠にとらわれず、専門領域や序列といった類のものにもひるまない。どんな世界も内側の人間が強みをもつなんて思ってもいなくて、下町の屋根裏部屋からこっそり開始して、またたくまに例えばミュージック業界全体に影響を与えるようになる。
コパケンもそんなタイプの人間だった。

コパケンは述懐する。「高校二年の時だったかな、トイレで手を洗ってたら泡の動くパターンに魅せられちゃったんだよ。じぃーっと見入っていると父親がきて、何してるのか?ってきかれたから、泡だよ、泡の動きをみてるんだよって言ったんだ。そしたら父は、どうせヒマをつぶすんだったらもっと価値のあることをしなさい、だってさ。それでじゃあやってやろうとおもって、その夏、ぼくは数マイル離れたカンザス・シティの図書館に自転車で通い詰めて、毎日、泡に関する書物や記事を読み漁ったんだ」

泡のうごきはまったくデタラメに見えるのだが、コパケンはそうは思わなかった。
学校に頼みこみ、おおきな水槽にエアレーター(通気装置)をとりつけて、泡発生システムを作り、数学の先生に二次方程式を教えてもらい、泡がどうやってできるか実験を繰り返したと言う。その結果、彼はその年の国際科学フェアーで銅メダルを手にした。彼の泡に抱いた関心はホンモノだった。
彼を魅了したのは、”ある現象があるとしたらそれは紐解くことができるものなのか?”という考え方だった。

それからぐ~んと進んで2003年のこと。

コパケンの友人にミーニーなるものがいる。ミーニーはリスク管理を専門としており、その原則を映画ビジネスに応用できないものかと考えているような人物だった。
コパケンがそのミーニーとダーラムに向けてイギリスの田舎をドライブしているとき、ミーニーの大学時代のある友人に話題が及んだ。学生の時、”作品批評論”なるもの学んだ彼はもう一人の仲間と、映像作品がもつ商業的可能性について思索を重ね、ついには脚本そのものを要素単位で分解し、それをさらに大まかなテーマ別に振り分けた映像の百科事典的データベースをつくりあげてしまったのだという。それを使うと脚本一つ一つを採点することができ、しかもそれが実に細かいというのだ。そしてそのデータベースなるものはアップデートされつづけているという。コパケンとミーニーは映画「レザボア・ドッグス」に敬意を表し、その作品批評家ふたりをそれぞれMr. ピンク、Mr.ブラウンと呼ぶことにしたという。

Mr.ピンクとMr.ブラウンは映像作品に特徴的な要素をあらいざらい抽出して、それを成功した映像とそうでない映像にひもづけていくことまではやっていたが、そんな彼らでもどの要素がなぜ影響をあたえたのかを説明する理論に関してはまったく考えてなかった。彼らはただ”何がよかったのか”だけを整理していったのだ。

コパケンとミーニーの二人はコンピュータを使った人工の神経ネットワークが膨大なデータの中からパターンを発掘するそのパワーに魅了されていた。彼らがこの技術とMr.ピンク&ブラウンのデータベースを組み合わせることを発想するのに時間はかからなかった。このデータベースのカテゴリーにもとづき、彼らは映画の脚本を数学の命題として扱ってみることにした。そうプラティナム・ブルーが音楽にたいしてそうしたように。

こうしてコパケンとミーニーが中心となり、Mr.ピンク&ブラウンが契約に応じることでエパゴギクス(Epagogix: 帰納的学習をすこしもじった命名)は誕生した。彼らはまず”トレーニング・セット”と呼ぶ神経ネットワークシステムを用意し、Mr.ピンク&ブラウンがすでに採点してある脚本にもとづいて、評価パターンを認識させた。その時、脚本のパターンだけでなく脚本それぞれの興収成績も一緒にネットワークに学習させていった。この神経ネットワークはミーニーの知り合いの科学者がコーディングしたものだった。科学者の活躍は続く。彼はそれからMr.ピンク&ブラウンの採点結果データを使って、神経ネットワークシステムにすべての脚本の興収成績を予測させる訓練を施した。

例えば最初の脚本では

  • ヒーローの葛藤:10ポイント中7.0 ∴700万ドル相当を加算
  • 赤毛の魅力的な女の子の登場:10ポイント中6.5 ∴300万ドル相当を加算
  • ヒーローと4歳の男の子が共演するシーン:10ポイント中9.0 ∴200万ドル相当を加算

という具合に、Mr.ピンク&ブラウンが付けた採点すべてに値付けがされていった。

そして最終的に算出された予測価額は実際の興収と比較された。もちろん最初からぴしゃりと一致などするわけない。たとえば予測価額が2000万ドルで実際の興収が1億1000万ドルなら、今度はそれぞれの採点への重みづけを変えて再計算する・・・これを繰り返して最初の作品を的確に予測できるフォーミュラができあがる。

次にこのフォーミュラを使って、最初の作品と二番目の作品の二つの興収を的確に算出できるようフォーミュラを改良する・・・こうして膨大な反復作業の末、データベースに収納されている全作品の興収すべてを的確に算出できる最終的なフォーミュラができあがったのだった。

後編はこちら≫

0 件のコメント:

コメントを投稿