FC2ブログ

AlphaGoZero

2017年10月22日 22:30

大橋拓文さんのTwwiterでAlphaGoZeroのことを知った。いままでのAlphaGoは人工神経網の中で指導学習という人間の棋譜学習を経たが、新しいバージョンのZeroはこの過程を経なかった。ただ自ら対局して強化学習だけで独学したものである。囲碁の基本ルールだけを入力されたZeroは40日間約3000万局対局して訓練した後AlphaGoMasterに89勝11敗の成績を上げた。この対局の83局が公開されている。今朝はおちおち寝ていられない気分で早く起きてプリントアウトした。数局並べてみたがZeroはMasterより人間味を感じた。全局並べたら自分の碁が変わるのでは、と期待感が湧いてきている。
最多手数の一局
   


コメント

    コメントの投稿

    (コメント編集・削除に必要)
    (管理者にだけ表示を許可する)


    最新記事