AlphaGo程序在大优局面的情况下被李世石的妙手打懵了,导致在随后的20来步进入疯狗状态。
鲍云表示:“AlphaGo前半盘大优,不是放水的态度。至于AlphaGo第97步的表现可以用“疯狗病发作”来形容。78-97步,机器应该有足够的(时间来)缓冲调整计算出局面走势。97确实是很“丢狗”的一步,说明算法还是有极大的问题,抗击打能力不足,崩溃的太脆了”。
那么,AlphaGo为何会出现如此明显的异常表现?
根据谷歌DeepMind创始人、Alphago原论文第一作者之一的戴密斯·哈萨比斯(Demis Hassabis)在赛后发布会上说,“衷心祝贺李世石获胜,让我们看到他是多么伟大的棋手。看AlphaGo的统计,也知道形势的变化。李世石下得非常好,给AlphaGo制造了失误。我们也非常高兴,在韩国举行这个比赛,也是为了看看AlphaGo实力,测试极限、改善提高他,也需要李世石这样优秀的天才棋手。李世石今天下得非常精彩。”
随后,哈萨比斯还在推特上发布了总结,“李世石下出白78后,AlphaGo自我感觉良好,在程序的‘值网络’(用于评估电脑胜率)中,误以为胜率达到70%,在第79手犯了错,直到第87手才反应过来它错了。”
AlphaGo的开发者哈萨比斯发布的twitter
AlphaGo另一创造者大卫·席尔瓦(David Silver)指出,李世石的神之一手,点中计算机此前不为人知的漏洞。他说:“AlphaGo是自我对局来进行学习,这样有可能会存在缺陷。我们不是职业棋手,正需要进行这场比赛,希望能寻找到这样的缺陷,发现AlphaGo的极限。今天在棋盘中央就看到了,李世石下得非常漂亮,我们希望能促进AlphaGo的进步。期待周二的第五局比赛。”
专家表示,AlphaGo的弱点,可能是在极为复杂的局面,计算存在误区及盲点,当遇到无法想象的问题时,可能会按照人工智能的本能处理,做出奇奇怪怪的举动。
高飞龙猜测,很可能是蒙特卡洛算法本身的一个缺陷。“78步本身是盲点,(李世石)小概率的选点,很可能导致(AlphaGo)在正确率很高的算法上出现意外事件,导致出错。”如果这一猜测成立,人类将可能找到每盘打败阿尔法的策略。而谷歌公司,将需要很长的时间来修正这一“缺陷”问题。
在赛后的记者招待会上,李世石则谈到了AlphaGo的两个弱点:一个是AlphaGo执黑棋时似乎挣扎比较多,相较执白棋时更难赢。另一个是,当它遇到出其不意的招数时,有可能会导致失误,未必是失误,就是bug。
一直低调、板着脸的李世石走进发布会场听到在场记者的掌声与欢呼声时终于露出了笑容,说出的第一句话就是感谢:“谢谢大家,我第一次因为获胜受到如此祝贺。今天能赢,我非常开心。非常感谢大家,只赢了一盘,不需要这么隆重祝贺的。”
当被问到为何在78手使出“神之一手时”,李世石坦言,这是在当时那种情况下,他唯一能走的一步棋。
“因为我前面已经输了3场,所以我的压力没有这么大。这场胜利对我来说很重要,但如果没有大家的支持,我今天也赢不了。”李世石坦言,放下了胜负的包袱,轻装上阵确实对良好的发挥起了作用。
李世石同时向DeepMind询问,“这局执白获胜,下一局能否不猜先,让我执黑,这样获胜更有意义?”哈萨比斯和席尔瓦均表示同意。
此前有专业棋手称李世石仍过于保守,并未施展出擅长的狠辣棋风。今日的人机大战第四局战至中盘,压力大减的李世石乭终于勇敢反击,打入黑棋厮杀。当他苦思25分钟打出第78手后,观战棋手纷纷惊呼喝采,视之为极为勇悍的妙着。
今天的第四局比赛,李世石执白终于战胜“阿尔法围棋”,为人类也更为他自己赢得一局可以保留颜面的胜利。
那么最后的悬念来了,两天后的第五局比赛,是李世石再下一城还是AlphaGo 4:1 荣耀收官?
加拿大华人网 http://www.sinoca.com/