旅cafe

旅行会社の元社員が書く旅日記です…観光情報、現地の楽しみ方、穴場スポットなどを紹介します。…当ブログ記事は転載OK…リンクを貼っていただけるなら遠慮なくお好きにお使いください。

将棋コンピューター こうして元名人に勝利する

f:id:tabicafe:20200331190250j:plain

NHK クローズアップ現代
将棋コンピューター こうして元名人に勝利する

人間のような知性や感情を持ち、社会の役に立つロボット、鉄腕アトム…最近、掃除機やカーナビに搭載された人工知能の飛躍的な進歩でアトムが夢物語ではなくなってきています。

こうした中、人工知能の研究者たちが注目する一戦は先月行われました…究極の頭脳戦、将棋で急速な進歩を遂げてきたコンピューターが元名人に挑戦、見事勝利したのです。

大局観と呼ばれる人間にしか持ちえない知性に挑んだコンピューター…勝利の背景には、過去の名棋士の指し手を徹底的に学ぶ機械学習という技術革新がありました。

極めて高度な思考能力を手に入れたのです。…コンピューターはどこまで人間に近づけるのか、歴史的大局を通して人工知能の可能性を探ります。


人間 VS コンピューター
人工知能はどこまで進化したか

究極の頭脳ゲームともいわれる将棋、それが人工知能、つまりコンピューターに人間と同じような知性を持たせようという研究の試金石になっています。

人工知能の研究が始まったのは1950年代です…最初はチェスを題材に開発が進み、1997年には世界チャンピオンを下すまでレベルがアップしました。

しかし将棋の世界では、プロ棋士たちに追い付くのは、まだ遠い先だと思われていたのです…それは将棋がチェスなどより遥かに複雑なゲームだからです。

f:id:tabicafe:20200331190321j:plain

将棋では、僅か10手指す間に10,730,000,000,000,000,000通り(1073京通り)の局面が考えられます。1京という単位は、1兆の1万倍ですから無限とも言える数字でその奥深さは、81ますの宇宙とも表現されます。

この膨大な選択肢からたった一つの指し手を選び出すのは、いかに高性能なコンピューターでも難しいとされてきました。

それが最近ハードウエアの進歩で計算能力が向上し、更に人間の考え方に近づこうというこれまでにないソフトウエアの開発によって人間とコンピューターの差が急激に縮まってきました。…両者の知性のぶつかり合いを通して人工知能、その能力に迫ります。


将棋コンピューター
元名人との頭脳戦

1月14日、東京・千駄ヶ谷将棋会館…この日、大局に臨むのは元名人で日本将棋連盟会長の米長邦雄さんです。…現役時代19のタイトルを獲得した永世棋聖です。

今回、米長さんに挑戦するコンピューター、それは「ボンクラーズ」です。3年前に開発され改良を重ねてきました。…すでにアマチュアトップクラスは寄せ付けづ、勝率9割5分を誇ります。

ボンクラーズの先手で対局がスタート…。

先手ボンクラーズ「7六歩」…対して米長さんは、驚くべき手を指します「6二玉」。

f:id:tabicafe:20200331190259j:plain

通常、飛車や角といった強い駒の道を開けるために歩を動かす事が一般的な指し方、しかし米長さんは、最初から玉を動かすというプロ棋士同士の対局ではありえない手を指しました。…元名人とコンピューターとの戦いは、前例のない出だしとなりました。

f:id:tabicafe:20200331190306j:plain

その後も米長さんは、飛車や角といった攻め駒を使わず、玉の回りに金や銀を集める前例のない指し方を続けます。…これはコンピューターの弱点を突くために練り上げた作戦です。


人間の知性に迫る
コンピューター

知性を賭けた人間とコンピューターの戦い…それが世界的に注目を集めたのが今から15年前の事でした。

1997年
チェス世界王者カスパロフ VS コンピューター ディープ・ブルー

チェス専用のコンピューター、ディープ・ブルーが世界チャンピオンを破ったのです。

f:id:tabicafe:20200331190314j:plain

ディープ・ブルーは考えうる全ての手を読み進め、未来の局面に点数を付けて評価、その中で最も点数が高い局面につながる一手を選んでいたのです。…いわば計算力に物を言わせ、力づくで人間をねじ伏せたのです。

しかし、この方法は将棋では通用せずプロ棋士の足元にも及びませんでした…将棋の盤はチェスよりも広く、敵から奪った駒を自分の駒として使えます…その為、考えられる局面が圧倒的に多いのです。

f:id:tabicafe:20200331190343j:plain

その数は、チェスが10の120乗、…これに対して将棋は、桁が100個も多い10の220乗の局面が存在するのです。

その奥深さから81マスの宇宙といわれる将棋、スーパーコンピューターでも全ての局面を読み切ることは不可能なのです。


トップ棋士の知能
その源とは?

こうしたコンピューターの弱点を突くために複雑な局面に持ち込もうとする米長さん…中盤になってもその戦略を徹底させて行きます。

f:id:tabicafe:20200331190328j:plain

それは、玉の回りに駒を従えて敵陣を突破する入玉、プロ同士の戦いでもめったに見られない戦いに持ち込んだのです。…その狙いは、コンピューターにはない人間独特の能力で相手を圧倒する事、…大局観です。

米長邦雄 永世棋聖
「私は、自分の頭の中で大局観だとか勝負勘とか、そういうもので形勢判断する…狙い通り対局を進めることが出来ました」

一流の棋士ほど優れていると言われる大局観、複雑な曲面の中であらゆる指し手を読むのではなく、最善と思われる手を直感的に素早く選び出す能力です。

f:id:tabicafe:20200331190335j:plain

昭和の大名人、大山康晴は、「一手だけ読めば良い」と語ったと言います。

棋士 渡辺明 竜王
「将棋は、プロレベルになるとかなり漠然としたゲーム、本当にわからないところが多いのです。直感というと偶発的な要素が多い言葉ですが、それよりも裏付けがある感覚です」

人間の思考のメカニズムを研究している電気通信大学伊藤毅助教…伊藤さんは将棋界のトップの一人、羽生善治の協力を得て大局観の実験を行いました…すると意外な結果が出たのです。

f:id:tabicafe:20200331190400j:plain

次の一手を選ぶとき、読む局面を選ぶとき、初級者から上級者になるにつれ増えます…しかし羽生は初級者を少し上回る程度でした。

一流の棋士は、無数に存在する局面を全て調べるのではなく、僅か数パターンの道筋を瞬時に見つけ出す能力があることがわかったのです。

電気通信大学 伊藤毅助教
「局面をその場だけで判断しているのではなく、一つの流れとして記憶していて『感触のよい手『悪い手』』という表現をする…いい手を取捨選択できる要因になっていたのだと思います」


将棋コンピューター
元名人との頭脳戦

対局が始まって2時間、ここでボンクラーズは奇妙な動きを見せ始めました…攻撃の要である飛車を右や左に動かすだけ、米長元名人が玉の前に築いた三枚の壁を攻めあぐねていたのです。

f:id:tabicafe:20200331190407j:plain

控室(観覧席)では、米長さんがコンピューターの弱点を上手く突いたとうい声が上がっていました。

棋士 船江恒平 四段:「じっくり指す方針を続けています…米長先生は」
棋士 遠山雄亮 五段:「コンピューターなりに若干困っている部分があると感じます…米長先生の作戦は上手くいってますね」

しかし、この時、当の米長さんは別の見方をしていました…。

米長邦雄 永世棋聖
「あれは単に飛車が行ったり来たりしているというよりも、コンピューターは私が襲いかかるのを待ってカウンターパンチを狙っっている指し方です。極めて実践的で私が挑発に乗ってくるのを待っていたのです」

不利な曲面でもじっとチャンスを待つボンクラーズ、そこには人間の知性に近づこうとするコンピューターの技術革新がありました…それは人間の思考に近づける画期的なプログラム、機械学習です。

ボンクラーズにはプロの対局を中心に江戸時代から現在までの5万局に及ぶ対局データが入力されています。…ボンクラーズはこれらのデータを単に記憶するだけじゃありません…プロ棋士がどんな手を指した時に有利になったかを膨大なデータから分析し、優れた指し方の原則を見つけ出します。

その原則を高い計算能力を武器に自ら次々に増やし、未知の局面でも応用できる能力を身につけたのです…いわばコンピューターが自分で学習するのです。

ボンクラーズには、もうひとつ棋士に近づくための工夫が凝らされています…もっとも良さそうな局面を見つけると他の点数の低い局面を調べるのをやめます…そして、その良さそうな局面の先を読み進めることに集中するのです。

その結果、プロ棋士が行う取捨選択に近い作業を可能にしたのです…機械学習と取捨選択、この2つの技術によってボンクラーズは、名棋士たちに対抗できる実力をつけていったのです。

飛車を左右に振るという米長さんが警戒心を抱いたボンクラーズの動き、それはコンピューターが新たに身に付けた能力の賜物でした。…この飛車を左右している最中もボンクラーズが予想した米長さんの次手は予想通りだったのです。

その後も米長さんの動きをほぼ的中させ、自分から動かない方が得策と判断していたのです…対局開始から3時間、米長さんがついに動きます。

「8三玉」入玉を進めるため玉を一段上げたのです。…更に72手目「5三金」、遠くの金を引き寄せました。…ところがこの一手が勝負の流れを変えました。…その瞬間ボンクラーズは鉄壁の守りを崩す糸口を見つけたのです。

f:id:tabicafe:20200331190424j:plain

狙いを定めたのは3枚の壁の真ん中、それまでは米長さんが金と銀の2枚で守っていたのに対し、ボンクラーズの攻め駒は飛車と銀の2枚しかありませんでした。

f:id:tabicafe:20200331190350j:plain

しかし米長さんが金を動かした直後、ボンクラーズは角を移動、飛車・角・銀の三枚の駒を集中させることに成功し、力関係を逆転させたのです。

f:id:tabicafe:20200331190416j:plain

金を動かしたことで角の道が閉ざされ、守りに使えなくなった瞬間を突いたのです。

f:id:tabicafe:20200331190433j:plain

その後、ボンクラーズは米長さんが築き上げてきた鉄壁の守りを瞬く間に突き崩して行きます…そして113手目、7時間に及ぶ対局、ついにコンピューターが元名人を打ち負かしたのです。

米長邦雄 永世棋聖
「コンピューターは、私が間違うのをジッと手待ちしていました。…そういう点では『昭和の大名人』と言われた大山康晴と指した感じでした」

チェスに続き将棋もコンピューターに負ける時代が来た…人工知能機械学習が新たなステップに入った…今後あらゆる分野に活かされる事でしょう…技術者の努力に脱帽します。

 

 

 

www.tabi.cafe

www.tabi.cafe