首页 动态 > 正文

科技信息: 第一次电脑Beats围棋冠军

21世纪是科技高速发展的时代,互联网渐渐走入人们的生活。互联网就像一张网。把我们紧紧联系起来,现在的衣食住行都离不开互联网科技,下面分享一篇关于互联网科技的文章给大家。

自上世纪90年代以来,电脑在国际象棋、跳棋、扑克和危险游戏中不断超越我们!但是有一种游戏是人类专家继续统治机器的游戏:围棋。这款有2500多年历史的棋盘游戏非常复杂,使得电脑很难掌握。在这款游戏中,两位玩家用黑白石试图夺取比对手更多的地盘。不过,围棋的人类霸权似乎终于结束了--谷歌(Google)DeepMind的研究人员今天宣布,他们开发了一个复杂的人工智能(AI)程序--一个由深度神经网络和搜索技术组成的组合--这在历史上首次击败了围棋冠军。

去年10月在伦敦,DeepMind队邀请了欧洲围棋冠军范晖与他们的项目AlphaGo比赛。这场比赛是私下进行的,只有几名观众见证了这场比赛。许和AlphaGo在19比19的网格板上玩了一场全尺寸的比赛.AlphaGo已经通过了对最先进的围棋项目的测试,比如疯狂的石头和禅宗,并且赢得了495场比赛中的一场。但与一位人类专家比赛比玩其他电脑要大得多,因为他们的专业技术仍然要好得多--他们有多年的游戏经验,对如何玩游戏有一定的直觉。所以当AlphaGo以5-0获胜时,这是一件大事。

许多人预测,至少再过10年,电脑就不会打败围棋冠军。亚马逊(Amazon)的软件工程师大卫·福特兰(David Fotland)说:“这种性能的飞跃是完全出乎意料的,也是前所未有的。”

为了理解DeepMind研究人员做了什么来创建这样一个令人印象深刻的程序,你必须首先理解为什么围棋对于计算机来说是一个很难玩的游戏。首先,GO有很多可能的动作和结果--根据研究人员的说法,Go中的可能位置比宇宙中的原子数量更多。研究报告的作者之一,DeepMind的联合创始人德米斯·哈萨比斯对国际象棋进行了比较,他说,在一盘棋中,平均每回合有20个可能的动作,而在每回合中,平均有200个动作是可能的。这意味着,如果一台计算机要搜索Go中所有可能的动作和结果,就需要大量的计算能力才能做到这一点,有些人甚至认为这是不可能的。

艾伯塔大学(UniversityofAlberta)的计算机科学家乔纳森·谢弗(JonathanSchaeffer)解释说,另一个原因是,围棋玩家需要大量的知识--过去的游戏经验--才能从中吸取教训。“有了国际象棋,你可以投入少量的知识,你可以建立一个强大的游戏程序,”没有参与这项研究的舍弗说,“在围棋中你不能。”这是因为在国际象棋中,电脑可以遵循预先编程的规则,但是使用这种策略对围棋是不可行的,因为游戏很大程度上是关于模式的,而不是一组可以记录下来的逻辑规则。

DeepMind团队的系统解决了大规模搜索和缺乏知识的问题。在本周发表在“自然”杂志上的一项新研究中,他们描述了将搜索技术与深度学习相结合来克服这些障碍。(“科学美国人”是“自然”出版集团的一部分。)

为了解决知识问题,他们使用了所谓的深层神经网络--在这个例子中是两个13层深的网络--由数百万个连接组成,类似于人脑中的神经连接。研究人员用两种方法对这些网络进行了训练:一是他们向计算机展示了人类专家玩的游戏中的3,000万多个动作(这有助于系统了解最优秀的玩家是如何获胜的);对于这两个网络,研究人员让计算机自己玩数千个游戏,这样它就可以发现新的策略,独立学习游戏。这两种训练策略使计算机能够识别游戏中的模式,并确定哪些动作给了它赢得比赛的最佳机会。

对于棘手的搜索问题,研究人员利用了一种称为MonteCarlo树搜索的特殊搜索技术。这种方法多年来一直在其他计算机游戏程序中使用,基本上允许系统使用统计作为快捷方式来确定最佳移动,而不是播放给定移动的每一个可能的结果(其将永远占用)。

DeepMind团队使用的搜索技术和深度学习工具并不是什么新鲜事。许多已经使用蒙特卡罗树搜索和神经网络的计算机围棋程序也被采用。但让DeepMind的AlphaGo如此先进的是他们把这些工具组装在一起的方式,以及深层神经网络的高性能。蒙特利尔大学没有参与这项工作的计算机科学家Yoshua Bengio说:“主要的新奇之处在于他们如何将这些不同的成分组合在一起--他们在这方面进行了创新。”谢弗说,他对研究结果印象深刻:“这是一种比过去更简单、更全面的方法,而且更优雅,”他说,“我认为这是一个巨大的飞跃。”这正是让AlphaGo在他们的比赛中领先范辉的原因--电脑以5比0获胜。

虽然并不是每个人都关心电脑胜过围棋冠军,但这一进步在其他领域也很重要。那些用“通用方法”构建这个系统的研究人员,而不是专门为玩围棋而制造的东西,打算“最终将这些技术应用于重要的现实世界问题,”哈萨比斯说,“我们希望有一天,这些技术能够被扩展到帮助我们解决社会上一些最棘手和最紧迫的问题,从气候建模到复杂的疾病分析。”Yoshua Bengio说,另一个可能的重要应用是计算机化的对话,舍费尔说,将来这些程序可能能够找到抽象的社会问题的答案,这些问题可以用游戏来表达,比如国家政治或国际气候谈判。

但是AlphaGo首先有一个更直接的问题:如何击败世界上最好的围棋选手LeeSEDOL。今年3月,两人将在韩国首尔相互比赛。尽管AlphaGo在对阵范辉的比赛中踢得很好,舍费尔和福特兰仍然预测SEDOL将赢得这场比赛。“我认为职业选手会赢,”福特兰说,“但我认为职业选手会对这个项目有多么强大感到震惊。”目前,至少有一些人仍在把赌注押在人类身上。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。