AI是自学成才的?

新版“AlphaGo”计算机程序可以从空白状态开始自学围棋,而且是自学、自学,不需要任何人类棋手动输入。这款新程序名为“AlphaGo Zero”,其100-0的不败战绩严重打击了曾经书写历史的老版“阿尔法狗”。

人工智能“阿尔法狗”来自谷歌的DeepMind公司。早在2016,1年6月,《自然》杂志就报道过,这个程序以99.8%的胜率战胜了所有其他围棋程序,以5∶0击败了欧洲围棋冠军。

随后在同年3月,“阿尔法狗”挑战围棋世界冠军李世石。经过五局激战,人类以1∶4输给了人工智能,引起了极大的轰动。人们的震惊源于,在围棋19×19的棋盘上,一步棋甚至有上百步棋,传统的人工智能算法很难估计形势和下一步棋。

但“阿尔法狗”还在积蓄力量。今年5438年6月+10月,一个神秘的账号主宣布自己是新版“阿尔法狗”。该账号曾在知名围棋平台上挑战过柯洁、朴俊焕、宇太山等顶尖棋手,并取得胜利,进而击败“棋圣”聂卫平,直到第60盘自爆,最终赢得决赛。

3天,“阿法源”自学。

在最新的论文中,伦敦Deep Thinking公司阿尔法狗项目的负责人大卫·西尔弗、戴密斯·哈萨比斯和他们的同事报告了阿尔法狗软件的新版本——阿尔法元。

“阿法源”最引人注目的地方在于它的自学能力。它的学习从“零”开始,纯粹基于自己的游戏。它不需要任何象棋历史的指导,也不需要任何人类经验的启发。

对于这个新软件,人类的输入仅限于一个棋盘和一组棋子,没有任何人类数据。“阿法源”只用了一个神经网络,这个神经网络被训练来预测程序自己的走法和游戏的胜负,让“阿法源”在每一次自我游戏中都能取得进步。

经过三天的训练——包括近500万回合的自我发挥——阿法源已经能够超越人类,打败之前版本的阿法源。大卫·西尔弗说“阿法源”远比“阿法源”强大。它不再受限于人类的知识,而是可以自己发现新的知识。