風が吹けばジュンク堂で「機械学習の学習」

先週の木曜日(*1)、ジュンク堂書店池袋本店で行われたトークセッションに、サイボウズ・ラボのメンバー3人が登壇者として参加してきました。題して「今度こそわかる!? PRMLの学習の学習」。

PRMLとは、人工知能の分野で世界的に有名な教科書、パターン認識と機械学習(Pattern Recognition and Machine Learning)のことです。「どうしてジュンク堂でPRML?」「学習の学習って何?」「で、なぜサイボウズ・ラボ?」——そこには、PRMLをめぐる1つのストーリーがあったのでした。

ジュンク堂池袋本店で行われたトークセッションの様子
ジュンク堂池袋本店で行われた「PRML同人誌 『パターン認識と機械学習の学習』(暗黒通信団) 刊行記念トークセッション──今度こそわかる!? PRMLの学習の学習」には、神嶌敏弘氏、naoya_t氏に加え、サイボウズ・ラボから光成滋生、中谷秀洋、竹迫良範の3人が講師として参加。木曜夜にもかかわらず事前予約で会場(50席)は満席でした。質疑応答やディスカッションも盛り上がり、お開きとなったときには、終了予定時間を少しオーバーしていたほど。

すべては、2006年にChristopher M. Bishop氏が「Pattern Recognition and Machine Learning」(通称PRML)という機械学習の教科書(洋書)を出版したことに始まります。この分野の基礎知識から最新の応用まで幅広く網羅した内容は関係者の間でたちまち話題となり、ほどなくamazon.comで部門トップセラーとなりました。

それにいち早く目を付けたのが、機械学習の研究者である神嶌敏弘氏(トークセッション登壇者のお一人)。神嶌氏は、この本の翻訳書を日本で出版すべく出版社探しから翻訳者のアサインまで奔走し、2007年12月、ついに翻訳書「パターン認識と機械学習──ベイズ理論による統計的予測」(上下巻、当時シュプリンガー・ジャパン、現在は丸善出版)の刊行にこぎ着けます。

トークセッションのもう一人の登壇者であるnaoya_t氏は、この翻訳書を用いた読書会(勉強会)を2009年5月から主宰し、教科書とはいえ細部まで理解するには高度な数学の知識が必要になるなど、一筋縄ではいかない本書の内容を、同好の士とともに少しずつ理解していこうという、1つの流れを作り出しました。この勉強会は「復習レーン」「復々習レーン」として今も続いています。

その勉強会に途中から参加していたのが、サイボウズ・ラボの中谷秀洋です。そして2011年春ごろから、「言語処理に必要そう」ということで中谷が音頭を取り、社内でもPRML(の翻訳書)を輪読する勉強会が始まりました。

しかし、これがなかなか困難を極めました。その様子を、中谷が書いた文章から引用してみます。

……それ以上に参加メンバーが四苦八苦したのは、やはり「計算」でした。たとえばPRMLの2章ではベクトルや行列による偏微分という大技がいきなり炸裂しますし、行列の固有値は常識中の常識、積分の変数変換なんかはもう当然知ってるもの。そして全編に渡ってLagrangeの未定乗数法という謎の魔法に支配されている……。数学科出身の約2名から「そこはなんでそんな計算になるの? 明らかにおかしいよね?」と突っ込まれながらPRMLの要所要所が省略された数式を追いかけるという経験は、世の中は「数学ガール」のようには行かないということをきっと教えてくれたことでしょう。(「パターン認識と機械学習の学習——ベイズ理論に挫折しないための数学」序文より一部抜粋)

ここに出てくる「数学科出身の約2名」の1人が、サイボウズ・ラボの光成滋生。メンバーの苦闘ぶりを見かねた光成は、勉強会の補助資料として、PRML本に出てくる数式を省略なしに展開し、合わせて必要な数学的知識を解説する文章を書き始めました。社内勉強会の進行とともに光成による解説文書は増えていき、やがて、彼が自作ソフトウェアでしているのとまったく同様に、それらの文書がgithubで公開されることになります。

それに目を付けたのが、同じくサイボウズ・ラボに所属する竹迫良範でした。光成が書きためていたPRML本の解説文書を編集してまとめ、同人誌として刊行するとブログで発表したのです。それが「パターン認識と機械学習の学習——ベイズ理論に挫折しないための数学」(光成滋生、暗黒通信団)です。2012年4月1日のことでした。最初は竹迫もシャレのつもりだったようですが、予想以上に反響があり、またISBNを取得するなど書籍として流通させるための手はずが整えられたこともあり、やがて一般の書店でも販売されることになりました。

ジュンク堂書店池袋本店でコンピュータ書を担当する長田氏は、仕事の情報収集のため日ごろから竹迫のブログをチェックしていて、この本の存在を知ります。さっそく手配して店頭に並べてみると、最初に仕入れた100冊が1週間で売り切れてしまったそうです。この本の噂は竹迫のブログからTwitterなどを通じて口コミで広まり、遂には同店の週間ランキングで総合1位を獲得してしまいました(*2)。

数式だらけのコンピュータ書籍が、しかも組織的な営業力を持たない同人誌として発刊された書籍が、これだけ求められ、話題になったのは、1つの奇跡と言ってもいいのではないでしょうか。神嶌氏の奔走がなければ、naoya_t氏の勉強会がなければ、そこへ中谷が足を運ばなかったら、サイボウズ・ラボの勉強会に光成が参加していなければ、竹迫がエイプリルフールの気まぐれを起こさなかったら、長田氏が竹迫のブログをウォッチしてなかったら……と考えると、どのピースが欠けても、トークショーという形での楽しい出会いは生まれなかったはず。改めて人と人のつながりの面白さ、大切さを実感した夜でした。(編集部)

*1:2012年10月11日(木) *2:2012年7月2日(月)~7月8日(日)の週間ランキングで同店の総合1位となった。

【変更履歴】 2012年10月19日:ブログへのリンクを修正しました。