送君千里终须一别,1胜2负,唯一战胜过AlphaGo的人退役了

今天,**棋手李世石九段退役纪念赛第三局在韩国全罗南道新安郡举行,前两局,李世石一胜一负。第三局,韩国AI“韩豆”(Handol)执白(让二子)中盘战胜,李世石九段以惜败于AI的结局宣布:唯一战胜过AlphaGo的人退役了
在这里插入图片描述
至此,李世石结束长达24年零8个月的职业生涯。从此以后,「李世石九段」不会再以职业棋手的身份出现在众人面前。

上午11时,李世石退役赛第三局在李世石九段的家乡新安郡落子。

李世石九段的老师权甲龙先生也来到电视直播现场为高徒加油助威,希望自己的爱徒能交出一份满意的答卷,笑着离场,为自己的围棋生涯画上一个圆满的句号。

今天开局的序盘战,AI韩豆就在右下角给李世石出了难题。为此,李世石不得不频频“长考”,寻找应对良策。双方在右下角形成对杀。韩豆白1“一路点”好手,令黑棋陷入困境。李世石经过“长考”,弈出了黑2“一路点”、黑4“二路托”组合妙手,成功化险为夷。战至黑66,李世石胜率为81%。

但李世石在即将用完2个小时规定时间进入读秒之前,意外出现了失误,导致了形势的大反转。白棋的胜率也从35%一下子就跃升至75%,枰上的形势瞬间发生了大反转。

后半盘,形势占优的AI韩豆越战越勇,没给李世石九段任何反扑的机会。

最终,下午15时40分,在行至 181 手时,李世石无奈地向裁判挥了挥手示意投子认负。

这是三局之中耗时最长的一局,双方对弈超过四小时。

看到败局,恩师权甲龙也一脸沮丧,难掩失落。
在这里插入图片描述
李世石九段的退役纪念就此落幕。曾经的“不败少年”李世石九段24年辉煌的职业围棋**就此落幕。

作为李世石曾经的对手和一生的挚友,曾经「绝代双骄」的另一人——中国围棋职业选手古力九段,今天上午,也在社交媒体上关注好友李世石的退役赛。

“送君千里,终须一别。就让我们再一次为他呐喊助威吧!”,古力如是说道。
在这里插入图片描述
也有网友在页面下留言:

“小李飞刀成绝响,不觉山川岁月长,祝福!”

此前有消息称,韩国棋院最初准备邀请古力来跟李世石下这场告别战。但李世石得知后婉拒了,“最后跟我下棋的人会多有负担,多不舒服呀。”

李世石退役赛对韩豆战绩:

首局(让子):李世石 胜
在这里插入图片描述

(第一局最终棋局)

次局(分先):李世石 负
在这里插入图片描述

(第二局最终棋局)

最终局(让子):李世石 负
在这里插入图片描述

(第三局最终棋局)

人类再次在围棋「人机大战」中取得了一场胜利。谷歌 DeepMind 资深研究员、ALphaGo 主要程序开发者黄士杰曾在看完前两盘对决之后表示,如果再有两年的算法更新和优化,AlphaGo Master 将会是最强的棋手。但 AI 要做到万无一失,仍需要解决 bug 问题。
在这里插入图片描述

从此棋坛再无「李世石九段」

在这里插入图片描述

2019年11月19日,韩国棋院发布了李世石辞去职业棋手职务的消息,并在该文中总结了李世石九段在其24年职业生涯中,一共获得50个冠军,所获奖金总额大约98亿韩元(约合人民币5900万元)。

作为一名围棋选手,今年才36岁的李世石在惯例中显然仍算得上年轻一辈,在此时选择提交“辞职申请书”宣布退役,对于外界来说无疑特别突然。

然而如果对李世石的过去有所了解,这已不是他第一次表露退役的念头。

而这一切,都与李世石的强烈个性脱离不开。

布局

进入中盘拼杀之前,尽可能地抢占实地,创造有利条件。大到对弈经验,小到临场心情,都会影响到布局。
在这里插入图片描述
那个“飞禽岛少年”。

李世石出生在韩国全罗南道新安郡的飞禽岛。小岛交通闭塞,离它最近的陆地都有四十公里。

李世石的父亲虽长年在岛上务农,却曾是师范大学的毕业生。喜爱围棋的他从未抛弃教育者的情怀,经常教李世石兄妹五人下围棋。五个孩子中,李世石天赋最高,是父亲的重点培养对象,直到他八九岁时,父亲已经不是他的对手了。于是,十岁的李世石以入段为目标,来到了首尔的权甲龙围棋道场。

1994年的入段选拔竞争激烈,即便是天赋异禀的李世石也未能一蹴而就,第一次入段尝试以半目之差落败。第二年,李世石凭借强烈的胜负欲战胜了年长自己3岁的同门师兄韩文德七段,终于成为了一名职业围棋选手,那一年,李世石13岁。

回顾起自己的入段之路,李世石觉得自己的好教练起了很大的作用。

在权甲龙道场的三年零六个月里,李世石的师傅权甲龙自始至终都没有对他采取“手把手教”和“人盯人管”的方式。相反,教练认为学习围棋并不是久坐在棋盘之前就能学好的,重点在于因材施教,尤其像李世石这样爱玩好动的弟子,要等他自己顿悟。三年来,权甲龙对他采取的是“不接触”的教学方式,只有在出现成绩严重下滑,或是李世石主动请教的情况下才会出手相教。帮他做复盘交流时,用的也是“这样下会不会正确啊”这样引导性的语言,绝不会直接指挥他具体该如何落子。

一位言传身教、倾尽全力将李世石引领上围棋生涯的父亲,一位慧眼识人、懂得因材施教的好师傅,在加上自己的天赋和努力,李世石的围棋生涯布下了一个很好的序盘。

中盘

围棋的中盘变化莫测,是围棋精妙之所在。布局,官子这两个阶段皆有定式,可从书籍,高手对局中学习模仿。而在中盘的战斗中,棋手能依靠的只有自身的修为,眼力,和随机应变能力。

初入段的职业棋手李世石早早便被一件事拖入了人生的中盘。

就在李世石决定退学并一心走上围棋道路的那一年,他的父亲去世了。这之后,由于未能在父亲健在的时候让他看到自己夺冠,李世石被悔意填满,很长一段时间都无法摆脱父亲去世的影响,成绩一路下滑。直到2000年,李世石才重新振作,接连在巴卡斯杯天元战中击败柳才馨九段,倍达王战中击败刘昌赫九段,十天之内连获两个冠军,并在2000年拿到了32连胜的战绩。父亲的去世,让李世石获得了之前不曾拥有的胜负欲和杀气。他曾因自悔而消沉,如今又因自省而崛起。

蜕变后的李世石一发不可收拾,2003年以三段的身份击败宋泰坤获得富士通杯。心直口快的李世石当时宣称段位根本无法体现实力,并拒绝参加段位赛提升自己的段位。

韩国棋院无法容忍“三段选手”李世石接连横扫九段选手,为了维护段位的权威性,便针对李世石制定了“国内比赛亚军升一段,冠军升两段,世界冠军升三段”的规定。之后,李世石便两夺世界冠军,“被迫”晋升九段。引用韩国棋院的一位官员的评价:“赶快把李世石弄到九段,免得他老在段位赛中捣乱。”特立独行实力强悍的李世石收获了许多赞誉,却也因自己的直来直去与韩国棋院产生了嫌隙。

无论如何,处于职业生涯中盘期的李世石可以说是围棋界最恐怖的猎手。如果说韩国围棋名宿李昌镐的棋风是序局稳健布局,中盘步步为营建立优势,官子阶段稳稳拿下胜利的话,那李世石就是一头攻击性极强的猛兽。他往往会草草结束布局阶段,将所有火力集中在中盘对杀,用稳准狠的攻击将比赛杀死在中盘,让终盘官子阶段变得毫无意义。从2002年到2012年,这种凶狠的下法为李世石赢得了14座世界冠军奖杯。

2016年3月,围棋机器人AlphaGo横空出世,挑战全世界人类棋手。年满33岁的李世石代表全人类躺在了它的砧板上。

常年收割着胜利的猎手李世石连续三局任人宰割,0:3输给了AI棋手AlphaGo。赛后他向人们道歉:“输给电脑的只有我李世石一人,并不是整个人类。”

3月15日,人机大战进入第四局,放下包袱的李世石执白子在第78手下出“神之一手”,AlphaGo陷入混乱,走出废棋,李世石赢下一局,为人类做出了唯一一次像样的抵抗。

之后的AlphaGo在互联网上化名Master,连续横扫十余名人类棋手,获得60胜0负的战绩。2017年五月,AlphaGo 3:0击败排名世界第一的中国选手柯洁,围棋界公认AlphaGo的弈棋能力已超出人类顶尖水平。李世石之后,人类一败涂地。
在这里插入图片描述

李世石之后,人类再无像样的抵抗。

终局

收官的功力,凝聚着棋手一辈子的心血。或功成名就,或功亏一篑,全在一念间。

2019年11月19日,李世石九段向韩国棋院递交辞呈,选择在当打之年结束自己的职业生涯。一时间,围棋界众说纷纭,最终却都指向两件事:李世石竞技水平下降,和他与韩国棋院长达十余年的纠葛。

早在今年三月,李世石在“三一运动一百周年纪念对局”中完败于柯洁九段,之后便提出“将于一年之内放下职业棋手的职务”。

李世石的哥哥李相勋九段也曾表示,李世石之所以要求退役,是因为他“赢得越来越少”,而且现在基本“无棋可下”。自去年7月30日于朴永训九段对弈之后,李世石再也没下过一盘棋。

人类真的永远不会再战胜 AI?

自从 2016 年 AlphaGo 大战李世石之后,围棋 AI 即被推上风口浪尖。基于近年以来深度学习和强化学习的发展,AlphaGo 和各类围棋 AI 的不断升级,人们一度认为,人类再不可能战胜 AI。

Handol 是韩国 NHN 娱乐公司推出的一款围棋 AI,用以训练的数据来自 1999 年以来 NHN 公司在游戏业务方面的大量积累。

2019 年 1 月,Handol 连续战胜了申旻埈九段、李东勋九段、金智硕九段、朴正焕九段和申真瑞九段五位韩国顶级围棋选手,8 月在山东举行的「中信证券杯」世界智能围棋公开赛中,Handol 也捧回了季军奖杯。

据「Handol」研发团队估算,「Handol」的棋力水平相当于世界围棋中的 4500 积分,而目前李世石的积分为 3414 分,柯洁、朴廷桓等人类顶尖棋手的积分接近 3700 分。

在围棋 AI 领域,棋力最高的选手仍然是 DeepMind 公司的 AlphaGo,它也是第一个击败人类围棋世界冠军的人工智能程序。在 2017 年柯洁与 AlphaGo 对战之后,David Silver、谷歌大脑负责人 Jeff Dean 等人曾在乌镇围棋峰会现场对 AlphaGo 背后的技术进行过解读。

AlphaGo 最初主要是依靠大量学习人类棋手的棋谱来提高棋艺,之后 进入到完全的自我深度学习阶段,也就是完全摒弃人类棋手的思维方式,按照自己(左右互搏)的方式研究围棋。结合监督学习与强化学习的优势,AlphaGo 通过训练形成一个策略网络,将棋盘上的局势作为输入信息,并对有所可行的落子位置形成一个概率分布。然后训练一个价值网络对自我对弈进行预测,以-1(对手的绝对胜利)到 1(AlphaGo 的绝对胜利)的标准,预测所有可行落子位置的结果。
在这里插入图片描述
AlphaGo 真正的优势来源于将策略网络和价值网络整合进基于概率的蒙特卡罗树搜索(MCTS)中。在获取棋局信息后,AlphaGo 会根据策略网络探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。在分配的搜索时间结束时,模拟过程中被系统最繁琐考察的位置将成为 AlphaGo 的最终选择。经过先期的全盘探索和过程中对最佳落子的不断揣摩,AlphaGo 的探索算法就能在其计算能力之上加入近似人类的直觉判断。2016 年 1 月 28 日,击败李世石的 AlphaGo 版本登上《Nature》封面,随后在 3 月即 4:1 击败李世石,名声大振。

乌镇之后,DeepMind 宣布 AlphaGo 从此不会再参与比赛,但在几个月后推出了更强版本的围棋 AI「AlphaGo Zero」。如果说 AlphaGo 版本最初还需要观察数千场人类围棋比赛来训练如何学习围棋,AlphaGo Zero 则直接跳过这一步,从自己完全随机的下围棋开始来学习围棋,几天之内即超越人类棋手的水平,并且以 100:0 的比分打败了之前战胜世界冠军的 AlphaGo。

在围棋 AI 领域,国内研究机构和企业也在发力,其中最有代表性的要数上文中李世石提到的腾讯围棋 AI「绝艺」。「绝艺」诞生于 2016 年,实力或仅次于 AlphaGo。

绝艺」的训练主要包括人类棋谱数据库和机器自对弈,它的算法基于策略网络与价值网络两大核心,并创新性地大幅提升了价值网络的精度,使其大局观表现更好。在 2018 腾讯世界人工智能围棋大赛中,「绝艺」在决赛中 7:0 大胜另一款围棋 AI「星阵」夺冠,半决赛五番棋和决赛七番棋不失一局,赛后「星阵」研发团队亦称赞「绝艺」已经「达到了 AlphaGo 的水准」。

虽然在围棋的算力上,人类已经难以与机器相比,但棋手们可以通过与 AI 的对弈不断提升自己的水平,甚至发展出更为先进的战术。据古力此前透露,「绝艺」已经成为中国国家围棋队训练专用 AI。

参考链接:
http://baijiahao.baidu.com/id=1650783145603674826&wfr=spider&for
http://baijiahao.baidu.com/id=1653521400125023901&wfr=spider&for
https://mp.weixin.qq.com/s/5P_5qV7JhLucHkVkHpSOBQ
https://en.yna.co.kr/view/AEN20191218004052315?section=search
https://pulsenews.co.kr/view.php?year=2019&no=1014122

更多文章请搜索公,众。号“StrongerTang”,众多资料分享,一起学习!