机械必威体育网址

 找回密码
 注册会员

QQ登录

只需一步,快速开始

搜索
查看: 3753|回复: 6
打印 上一主题 下一主题

人工智能终于在围棋游戏上击败人类

[复制链接]
跳转到指定楼层
1#
发表于 2016-2-18 19:04:36 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
据日本共同社1月28日报道,英国《自然》杂志当地时间27日发文称,美国google公司旗下的人工智能(AI)开发商“DeepMind”(位于英国)研发的围棋电脑软件“AlphaGo”(阿尔法围棋)打败了职业棋手,开创全球先河。  围棋下法复杂,一般认为围棋的对弈软件开发比国际象棋和日本将棋更难,此次凭借人工智能新技术大幅提高了判断力。开发人员等召开记者会时称“正因为规则单纯才很难做,可应用于疾病图像的诊断等需要判断情况的场合”。
! \/ G2 [& s8 i, S7 S  与“AlphaGo”一较高下的棋手是2013年至2015年的欧洲围棋冠军、生于中国的樊麾。2015年10月,双方以正式比赛中使用的十九路棋盘进行了无让子的5局较量,“AlphaGo”赢得满堂红。, _3 E1 s. {* B3 H! Y
  今年3月,“AlphaGo”将挑战全球顶级的韩国九段棋手李世石,奖金是100万美金。李世石表示:“(人工智能)厉害得让人吃惊,听说一直在进化,不过我有信心取胜。”2 Y8 ]: e3 d4 H; A: c. @$ }
  围棋因为其非常复杂,之前最强的围棋软件基本上连业余棋手都无法战胜,而google改变了思路,通过机器学习的方式提高AI,并且直接战胜了围棋职业棋手,如果今年3月份的比赛李世石战败的话,人类最后一个能战胜人工智能的棋类游戏就将终结了。) c' I: r9 q) _' {( T2 _, p! ^
1952年计算机掌握了第一款游戏——井字棋 (也称三连棋),接下来是1994年的西洋跳棋,1997年,“深蓝”赢得了国际象棋比赛,国际象棋AI第一次打败顶尖的人类;2006年,人类最后一次打败顶尖的国际象棋AI。欧美传统里的顶级人类智力试金石,在电脑面前终于一败涂地,应了四十多年前计算机科学家的预言。- f  N  f2 C: q6 ]' A
  至少还有东方,人们自我安慰道。围棋AI长期以来举步维艰,顶级AI甚至不能打败稍强的业余选手。长期以来,围棋仍然是横亘在人工智能研究者面前的难题:计算机的围棋水平只能达到业余选手的程度。这似乎也合情合理:国际象棋中,平均每回合有35种可能,一盘棋可以有80回合;相比之下,围棋每回合有250种可能,一盘棋可以长达150回合。这一巨大的数目,足以令任何蛮力穷举者望而却步——而人类,我们相信,可以凭借某种难以复制的算法跳过蛮力,一眼看到棋盘的本质。. V, b% B6 m: ~. y' f% Y& L
  但是,无论人怎么想,这样的局面当然不可能永远延续下去。就在今天,国际顶尖期刊《自然》报道了google研究者开发的新围棋AI。这款名为“阿尔法围棋”(AlphaGo)的人工智能,在没有任何让子的情况下以5:0完胜欧洲冠军,职业围棋二段樊麾。
" F* }& \3 [$ L' @+ ]3 X: w  U* ZAI下围棋到底有多难?$ Y# r6 T' V+ c$ f: Y1 |
  计算围棋是个极其复杂的问题,比国际象棋要困难得多。围棋最大有3361 种局面,大致的体量是10170,而已经观测到的宇宙中,原子的数量才1080。国际象棋最大只有2155种局面,称为香农数,大致是1047。
7 [) |+ S6 ?. A  面对任何棋类,一种直观又偷懒的思路是暴力列举所有能赢的方案,这些方案会形成一个树形地图。AI只要根据这个地图下棋就能永远胜利。然而,围棋一盘大约要下150步,每一步有250种可选的下法,所以粗略来说,要是AI用暴力列举所有情况的方式,围棋需要计算250150种情况,大致是10360。相对的,国际象棋每盘大约80步,每一步有35种可选下法,所以只要算3580种情况,大概是10124。无论如何,枚举所有情况的方法不可行,所以研究者们需要用巧妙的方法来解决问题,他们选择了模仿人类大师的下棋方式。+ ~3 Z- _: d+ ^/ d
  机器学习
/ w4 u1 o0 |8 {+ K! q  研究者们祭出了终极杀器——“深度学习”(Deep Learning)。深度学习是目前人工智能领域中最热门的科目,它能完成笔迹识别,面部识别,驾驶自动汽车,自然语言处理,识别声音,分析生物信息数据等非常复杂的任务。
, d0 w9 _" {1 W; G4 e: L8 I+ w3 {2 D  传统的人工智能方法是将所有可能的走法构建成一棵搜索树 ,但这种方法对围棋并不适用。所以在征服围棋的过程中,google决定另辟蹊径,将高级搜索树与深度神经网络结合在一起。这些神经网络通过12个处理层传递对棋盘的描述,这些处理层包含数百万个类似于神经的连接点。其中一个神经网络“策略网络”(policy network)选择下一步走法,另一个神经网络“价值网络”(value network)预测比赛胜利者。/ W! \7 X! m5 B) R/ B6 d
  google用人类围棋高手的三千万步围棋走法训练神经网络,直至神经网络预测人类走法的准确率达到57%。不过google的目标是击败最优秀的人类棋手,而不止是模仿他们。为了做到这一点,AlphaGo学习自行研究新战略,在它的神经网络之间运行了数千局围棋,利用反复试验调整连接点,这个流程也称为巩固学习(reinforcement learning)。
2 A6 o. t0 w: \" N
- |8 c8 k8 m9 F" w9 z0 V( r/ D
9 a% b" t& q9 ^AlphaGo 的核心是两种不同的深度神经网络。“策略网络”(policy network)和 “值网络”(value network)。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。
9 M4 X+ ~6 B  y/ e2 m) ^& }- `  其中,“值网络”负责减少搜索的深度——AI会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑;而“策略网络”负责减少搜索的宽度——面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。将这些信息放入一个概率函数,AI就不用给每一步以同样的重视程度,而可以重点分析那些有戏的棋着。' v  P8 K0 l- D# `* O/ e
AlphaGo利用这两个工具来分析局面,判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推断未来的局面一样。这样AlphaGo在分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。( r0 i% w& e* x
  研究者们用许多专业棋局训练AI,这种方法称为监督学习(supervised learning),然后让AI和自己对弈,这种方法称为强化学习(reinforcement learning),每次对弈都能让AI棋力精进。然后他就能战胜冠军啦!& m# d/ m9 b, `* X# y# f
  人类在下棋时有一个劣势,在长时间比赛后,他们会犯错,但机器不会。而且人类或许一年能玩1000局,但机器一天就能玩100万局。所以AlphaGo只要经过了足够的训练,就能击败所有的人类选手。' }; R5 r' ]% h& ~5 |# A8 Y2 o) U! }
人工智能研究者面对这样的成就当然欣喜。深度学习和强化学习等技术完全可以用于更广泛的领域。比如最近很火的精准治疗,我们可以训练它们判断哪些治疗方案对某个特定的人有效。
4 W" E$ W. l" V" K+ V& u7 q- f  但是,围棋毕竟不仅仅是一项智力成就。就像十多年前的国际象棋一样,围棋必定也会引发超出本领域之外的讨论。等到计算机能在围棋上秒杀人类的时候,围棋是不是就变成了一种无聊的游戏?人类的智力成就是不是就贬值了?AI还将在其他层面上继续碾压人类吗?传统认为AI不可能完成的任务是否也都将被逐一打破?人类最后是会进入AI乌托邦还是被AI淘汰呢?
/ N& F2 p; o. f- n, w( {- c# j  没人知道答案。但有一点毫无疑问:AI一定会进入我们的生活,我们不可能躲开。这一接触虽然很可能悄无声息,但意义或许不亚于我们第一次接触外星生命。人工智能如果能实现自我学习,那将是一件很可怕的事情,因为机器学习的速度远远高于人类学习的速度,史蒂芬·霍金曾警告说“一旦经过人类的开发,人工智能将会自行发展,以加速度重新设计自己。由于受到缓慢的生物演化的限制,人类不能与之竞争,最终将会被代替”. X8 i* W7 v+ _6 v. C. K' Q

4 M3 z$ W& k* H+ R9 p1 m" s4 B# ?) Z8 t, C2 A- ?1 J

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册会员

x
回复

使用道具 举报

2#
发表于 2016-2-18 19:38:45 | 只看该作者
据说樊麾跑到中国来的话,只有业余4段水平,棋局在百度贴吧有详细拆解,水平确实不高,见链接 http://tieba.baidu.com/p/4329163733?pn=15 @+ G/ l; V/ Y* O  y! }0 c' x

& o8 b) l% D5 S* M* c碰上了李世石,电脑估计会惨败' F. }0 d% }3 y0 z
' m) X3 v) s, B  y, B! W) D3 K3 M  l
其实对于人工智能,我们大可不必惊慌,数学上有个NP完全问题,就说明了计算机的计算能力是有极限的,很多问题计算机都解决不了
回复 支持 反对

使用道具 举报

3#
发表于 2016-2-18 19:56:31 | 只看该作者
不同意楼上的想法,没人说机器完全替代人。但是每次技术进步后,对人的需求就变少了。
回复 支持 反对

使用道具 举报

4#
发表于 2016-2-18 20:06:02 | 只看该作者
额,感觉没什么,毕竟是程序么。。。
回复 支持 反对

使用道具 举报

5#
发表于 2016-2-19 21:45:35 | 只看该作者
电脑走的是程序,是一种按照公式的逻辑推理,是死的,人是有反馈,思考,执行,这个全过程的,机器人就是COPY前人的经验,人可以COPY,也可以创新
回复 支持 反对

使用道具 举报

6#
发表于 2016-2-19 21:45:45 | 只看该作者
电脑走的是程序,是一种按照公式的逻辑推理,是死的,人是有反馈,思考,执行,这个全过程的,机器人就是COPY前人的经验,人可以COPY,也可以创新
回复 支持 反对

使用道具 举报

7#
发表于 2016-3-9 12:08:17 | 只看该作者
学习学习 呵呵
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

小黑屋|手机版|Archiver|机械必威体育网址 ( 京ICP备10217105号-1,京ICP证050210号,浙公网安备33038202004372号 )

GMT+8, 2024-10-8 02:23 , Processed in 0.050786 second(s), 17 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表