Alpha Zeroの衝撃と技術的失業
2016年、Google DeepMind社から恐ろしい論文が出された、AlphaGoその名を冠した囲碁プログラムが既存の囲碁ソフトに勝率99%を叩き出したのだ。AlphaGoは強化学習とDeep Learningを組み合わせた囲碁プログラムで、その年に最強の囲碁棋士の一人である李世ドルさんに4勝1負で勝利した。その後も進歩を続けて今のAlphaGoの強さは人類が体感できるレベルを超えるほど強くなったと予想される。
2017年も終わりのころ、Google DeepMind社からまた途方もない論文が発表された。囲碁とほぼ同じ手法で最強レベルのチェスや将棋プログラムを超えたということだった。実際のところ正確に超えたのかどうかちょっとだけ疑問もあるのだが、まず前提として彼らの新手法が途方もない成果をあげたこと素直に祝福したい。彼らは自分たちのプログラムをAlpha Zeroと名付けた。
コンピュータチェスの歴史は長い。実際のコンピュータが生まれるより前にコンピュータチェスの論文があったくらいだ。MinMax理論から始まる様々な手法があった。コンピュータ将棋もベースの考えの多くはここから輸入したものがたくさんある。
が、全てそれらをAlpha Zeroは壊した。Alpha Zeroは強いだけではなく、全く異なる思考方法でチェスと将棋の山を登って来たのだ。人間流、以前のコンピュータ流とは異なる第3の道なのだ。
Alpha Zeroは旧来手法をなにも知らない。LMRもFutility PruningもRazor PruningもKKPもKPPもList38化も一手詰関数もMove Count Based PruningもNull Move Pruningもkillerもhistoryもなにも知らない。でも強いのだ。
この感情をどう表現すればいいのだろうか。多分これが技術的失業なのだろう。おそらくだが、DeepMind社がこのまま本気を出し続ければ、Ponanzaをはるかに超える途方もないプログラムが完成するだろう。それくらいこの新手法は“まだ”洗練されておらず、とてもバニラだ。伸び代がたくさんある。
ただ変な話だが、これで正しいのだ。私が技術的失業感を味わうのが正しいのだ。Alpha Zeroのアルゴリズムはある意味とてもシンプルで、人工知能を志したことがある人なら誰しもが考える王道を走っている。技術は職人の神秘を科学に還元して、誰もが手軽に使えるようにしていく。
悔しい。