神话里有珍珑棋局,不过我觉得最近的是阿尔法狗对李世石的胜利确实让人类无法淡定了。
阿尔法狗第一次引起大家的关注,是因为它打败了围棋的欧洲冠军樊麾。但这个事情并没有引起太多人的关注。毕竟围棋这个东西是一个东方的游戏。中国、日本和韩国这三个国家才代表着围棋的水平。其他地方,无论是欧洲还是美洲,下围棋的人都要弱很多,所以虽然是欧洲冠军,但樊麾在世界各国棋手中的排名,其实已经蛮靠后了。大家都觉得,之所以阿尔法狗能5比0大胜樊麾,只是因为樊麾太弱了。
不过,很快阿尔法狗就对这些人还以颜色了。在和韩国最好的棋手李世石的比赛中,它以4比1的比分轻松获胜。你可别小瞧李世石从阿尔法狗身上拿下的这一分,就凭着这一分,李世石成了世界到上目前为止唯一一个赢过阿尔法狗的人——因为在此之后,再也没有人类赢过这个专门下围棋的电脑程序。
其实,直到阿尔法狗大胜李世石,很多人还是不服的——李世石不还赢了一局嘛,说明还是可以打一打的嘛。不过,很快大家就觉得不太对头了。阿尔法狗的新版本“阿尔法狗·大师”出现在一个著名的围棋网站上,并且连续和各国顶级高手下了60盘棋,全都取得了胜利。今年5月份的时候,阿尔法狗和目前世界上围棋排名最高的人,中国棋手柯洁进行了三场比赛,取得了全胜。虽然这场比赛后,阿尔法狗的研发者宣布它退役,但它的崛起已经让所有人看到了人工智能的力量。
阿尔法狗的4种武器
那你肯定会问了,阿尔法狗到底是怎么下棋的呢?
很多人认为,阿尔法狗是靠着电脑的力量硬算出每一步棋所导致的结果来,比对出最好的一个选择,再下的。其实,它并不是这样做的。因为围棋是世界上最复杂的棋类游戏,运算的步数会非常非常多,硬算的话,那可就太慢了。阿尔法狗其实使用了4种武器来下棋:
一叫蒙特卡洛树。这是一种计算方法,在你每一步棋下出之后,它会试探各种可能性的输赢情况,然后不断地推导向赢面最大的那几步。
二叫深度神经网络。它实际上用来优化蒙特卡罗树,让机器学习到更加快速高效的办法找到最好的那几步,它所需要计算的东西,就更少啦。
三叫监督学习,天才也是从菜鸟成长起来的,我们会把人类千年来的经验交给它。
四叫强化学习,不仅仅让机器学会了所有人类的经验,还要让他超越人类专家,我们让它双手互搏,继续成长。
就靠着这四个秘诀阿尔法狗成了围棋界的一个传奇。不过,你可不要觉得阿尔法狗退役之后,这个传奇就结束了哦。就在不久之前,研发阿尔法狗的那个团队做出了一个新版本的阿尔法狗,名字叫“阿尔法狗·零”。为什么要叫“零”呢?因为阿尔法狗本身,它最开始学习围棋的时候,是由研发人员输入了许许多多的厉害的棋手们下过的棋谱,从这个开始学习的。但这个零不是,它在根本一点围棋都不会的情况下,就开始直接下棋了。最后,它只用了3天时间,就打败了当年“阿尔法狗·李世石”这个版本,然后只用了21天就胜过了“阿尔法狗·大师”,到了40天的时候,它已经是所有阿尔法狗版本中最强的一个了。
“深蓝”的战绩
前面我们说过,阿尔法狗下棋不是靠硬算的,而是用了4种特殊的方法,配合在一起,先选出大概的方向,然后在具体的方向上再去算每一步棋。但这并不等于说硬算这个方法不能用。实际上,在此之前,就有电脑程序通过硬算的方法,战胜了世界上最好的棋手——准确地说,是世界上最好的国际象棋棋手。他的名字叫卡斯帕罗夫。
那是20年前的事儿了。当时美国的IBM公司研发出了一套程序名字叫深蓝。深蓝就是通过硬算来下棋的。在1996年的时候,它和当时的国际象棋第一人卡斯帕罗夫进行了一次比赛,在6局棋里,它只赢得了两局。
不过深蓝显然不会善罢甘休,造这种程序出来,不就是为了赢过人类嘛。所以,只用了一年的时间,深蓝就升级成了“更深的蓝”,再次杀了过来。这一次,更深的蓝的性能得到了很大的提升,它每秒钟能计算两亿次,能够计算出每一步棋之后紧接着的12步该怎么走——而最优秀的人类棋手,大概能计算10步左右。
这一次,更深的蓝终于赢了。刚赛完的时候卡斯帕罗夫还不相信,觉得一定是有其他棋手在背后帮助更深的蓝。但是电脑的棋力还在不断增长,很快所有人都承认了电脑远远超越了人类。
现在,在华盛顿的美国国家历史博物馆,可以看到当年更深的蓝的一部分。
永远无法战胜的对手
世界上最好的国际象棋手卡斯帕罗夫和世界上最好的围棋手柯洁,都败给了电脑程序。但从某种意义上说,他们并不是人类当中最好的棋手。从战绩上来说,人类最好的棋手是一个叫马里昂·廷斯利的人,在自己的棋手生涯里,他只输过7局,但没有输掉过任何一场比赛。这是世界上战绩最好的棋手。他下一种叫西洋跳棋的棋。
更重要的是,他也曾经和电脑程序对战,并且可能是世界上唯一一个无法被电脑程序战胜的棋手。
那是卡斯帕罗夫和深蓝比赛之前的1994年。当时,廷斯利参加了一场包含30局的比赛,对手是一个叫“钦努克”的电脑程序。比赛的前5局,双方都下成了和棋,谁都没输,同样谁也没有赢。但在第五局结束之后不久,廷斯利住院了。医生检查之后发现,他得了很重的癌症,而且仅仅7个月后,他就去世了。
和钦努克比赛没有在继续下去。廷斯利依然没有败绩。
但钦努克的创造者并没有就此善罢甘休。他觉得,按理说自己创造的程序一定会赢的。他后来写了一篇论文,设计了一个用数学方法穷尽西洋跳棋所有可能性的程序。没有人能赢过它,即使它自己跟自己下,也只能下成和棋。
然而,这一切廷斯利已经永远无法看到了。
注:阿尔法go的go,是日语里围棋的意思。阿尔法狗之所以能胜过人类围棋手,靠的是蒙特卡洛树算法、深度神经网络、监督学习和强化学习和4种方法;
国际象棋程序深蓝曾经在1997年打败过当时世界上最好的国际象棋大师卡斯帕罗夫。它每秒钟能运算2亿次,推算出12步棋的走法;
廷斯利可能是世界上唯一一位不会被计算机打败的棋手。他是西洋跳棋的世界第一人,在与计算机对弈的比赛中,他因为癌症去世了。而在去世之前,他和计算机的比赛一直是平局。