“阿尔法狗"凭什么打败世界冠军
①曾经,一场举世瞩目的围棋比赛以“阿尔法狗”4 :1击败前世界围棋第一人李世石九段告终。
②打败世界 冠军的“阿尔法狗”其实不是狗,这只是它的“网名”,它的英文名叫AlphaGo,中文名叫“阿尔法围棋”,它的真实身份是谷歌公司开发的一款人工智能软件。
③什么是人工智能软件呢?顾名思义,就是一种能够产生人类智能行为的计算机软件,它具有现场感应和环境适应的能力,具有表示、获取、存取和处理知识的能力,同时还能够采用人工智能的问题求解模式来获得结果。击败世界冠军的“阿尔法围棋”便是这样的一款智能软件。
④就下棋而言,一种直观的思路就是列举所有能赢的方案,然后优选出一个最佳方案。一般来说,下一盘围棋大约需要150步,每一步有250种可选的方法,要是人工智能采用这种思路,需要计算大约10 360种情况。这样看来,在有时限要求的比赛中,列举所有情况的思路是不可行的,所以,研究者们选择了模仿人类大师的下棋方式,这就是“深度学习”。其原理是通过两种不同的深度神经网络——“策略网络”和“价值网络”合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围内。其中,“策略网络”负责减少搜索的宽度。面对眼前的一盘棋,人工智能机器人会观察棋盘布局并试图找到最佳的下一步,相当于“落子选择器”。而“价值网络”则负责减少搜索的深度。人工智能机器人会评估棋局的整体局面并预测双方胜负,相当于“棋局评估器”,在局面处于明显劣势的时候,会直接抛弃某些线路,从而辅助落子选择器。在“两个大脑”的配合下,“阿尔法围棋”具有了像人类棋手那样的思维方式。同时,研究者通过“监督学习”让机器人掌握海量的专业棋局;通过“强化学习”让机器人从每次对弈中获得新的经验。而且,一个人或许一年能玩1 000局,但机器人一天就能玩100万局;人类在长时间比赛时会犯错,但机器不会。所以,从理论上说,“阿尔法围棋”只要经过足够的训练,就能击败所有人类选手。
⑤如果你认为智能软件就是陪你下棋的娱乐工具,那你就错了。智能软件在商务管理、家政服务、精准医疗、环保检测和巡航导弹武器控制等领域有着广泛的运用。日前,中国科学院技术研究所发布了全球首个能够深度学习的神经网络处理器芯片“寒武纪”,这项成果正式投产后,反欺诈的刷脸支付、图片搜索等将更加可靠、易用。
⑥“阿尔法围棋”战胜世界冠军,是人工智能研究的标志性成就。随着整个科学体系演化进程的加快,在与多学科的交叉研究与发展中,人工智能一定会进入人类生活的方方面面,从而开启人机协同思考的新纪元。