FreeOZ论坛

标题: AlphaGo真的很牛逼吗? [打印本页]

作者: 周星星1832    时间: 11-3-2016 08:43
标题: AlphaGo真的很牛逼吗?
[attach]396219[/attach] 对于围棋界专业人士而言,或许没有哪一刻会像现在这样心情复杂:马上开赛的人机对弈——韩国职业9段李世石对阵谷歌的AlphaGo(阿尔法围棋)的人工智能系统吸引了全世界的目光。而此前,围棋不过是局限于亚洲,主要是中日韩三国的小众棋类项目。

有人可能会不以为然,计算机不是很多年以前就战胜国际象棋的世界冠军了吗?这不就是又搞定了一种棋么?实际上,围棋和国际象棋有很大的不同,这导致了计算机的智能程度有很大差别。

“国际象棋就64格,最大只有2^155种局面,称为香农数,大致是10^47。虽然没法全部去遍历(也没必要),但实际只要把开局库和残局库多输一些进去,结合一些中盘的策略选择和部分遍历就很牛了。但围棋最大有3^361 种局面,大致的体量是10^170,而已经观测到的宇宙中,原子的数量才10^80。(围棋压根没有残局库这个概念,千古无同局)。”“出门问问”人工智能公司高级工程师李理在接受本刊记者采访时分析了围棋和国际象棋的差别,“国际象棋的最终目标很清晰,就是吃掉对方的王,而过程中的阶段性目标也很简单,吃个车很好,吃个马也不错;但围棋不是,围棋不是以吃掉对方几个子,也不是围了多大一个空。围棋在对弈过程中,有厚薄、味道、形状等各种概念,很难量化的判断,而是很模糊的。”


                               
登录/注册后可看大图

                               
登录/注册后可看大图

比赛正在进行(图片由记者陈赛发自首尔四季酒店比赛现场)

就好比在采访围棋选手时,当你问他“为什么觉得局面好”,他很难用语言清楚地去描绘,而这种对局面的判断,高手们会用“棋感”这种唯心的词语来形容。指标如此模糊,计算机很难用算法来描述,自然一筹莫展。所以,1997年深蓝就战胜了国际象棋冠军,但围棋的AI的顶尖水平仍然很差,下个普通的业余棋手也常下不过。

“围棋需要的并不仅仅是计算的能力,还有图形处理的能力,后者是计算机的弱项。局部的死活就是一个例子,计算机有一个总体目标,就是赢棋,它很难像人一样灵活构建不同的局部目标。围棋高手对棋形的判断近似于对人脸的判断,这更接近人工智能的本质。”李理说。

早在1986年,台湾应昌期老先生就悬赏了140万美元,奖励给能战胜职业棋手的围棋程序,可是直到2000年悬赏截止,围棋程序的水平依然非常臭。2015年11月,电脑程序世界冠军“石子旋风”和中国著名棋手连笑下,一直被打到让6子才赢了一盘,感觉离战胜人类还很遥远(其实那时候AlphaGo已经和樊麾下完5盘了,为了在Nature发论文当时尚未公开)。但这次AlphaGo横空出世,展现出了巨大的飞跃进步。


                               
登录/注册后可看大图

2015年10月樊麾和AlphaGo以正式比赛中使用的十九路棋盘进行了无让子的5局较量,AlphaGo全胜

在看过AlphaGo5:0胜樊麾的棋战棋谱后,刚在农心杯再次战胜李世石的中国年轻职业棋手柯洁表示,在不知道谁执黑和执白的情况下,完全看不出谁是AI。“感觉就像是一个真正的人类下的棋一样。无论是占地、对杀、打入、侵消、弃子、收官,都有模有样,该弃的地方也会弃,该退出的地方也会退出,非常均衡的一个棋风。因为之前的ZEN那样的程序,经常会莫名其妙的抽风,突然跑到一个无关紧要的地方下棋。它这个不会。它知道哪个地方重要,会在重要的地方下棋,不会突然短路。这一点是非常厉害的。”

5盘棋下来,除了第一局是铺地砖式的按部就班,后面4盘虽然都没有大规模的对杀,但每盘都有些小范围的战斗。从结果来看都是樊麾脆败。每每樊麾下出一些无理手、随手,马上就被电脑抓住机会扩大战果。而电脑的失误很少。


                               
登录/注册后可看大图

AlphaGo与樊麾的五局较量

从业余棋手的角度来看,AlphaGo比较喜欢实地,很少去取势。AlphaGo还有个很重要的特点就是追求简明。除了喜欢取实地外,其他时候也都经常会去主动定型,尽可能地让局面明晰。这和高手的特点不太一样,一般来说,高手都不喜欢定型,这样留有味道,未来有多种可能性(尤其它接下来的对手李世石特别喜欢把局面复杂化,乱中取胜)。AlphaGo这么一定要定型,会失去一些机会,有时会有点缓。但这个也不算很大的弱点,估计这个和算法有关,它把局面定型了才能判断到底哪个局面更优。

著名职业棋手李喆曾经说,如果是他来对付AlphaGo,有两个突破口:一个是布局,一个是打劫。布局我觉得的确是,5盘里AlphaGo没有表现出任何布局的才能来,但布局并不关键,当年李昌镐布局也很平庸,照样靠官子赢回来。而对于打劫,很多认为AI无法战胜人类的观点,很重要的依据就是围棋有个很复杂的事情就是经常会打劫,AI肯定会晕。但这次和樊麾对局的第5局是出现了打劫的。过程中AlphaGo找劫、应劫都有模有样,来回了十几手,最后是樊麾消劫形成转换。过程中应对没有问题。所以,我感觉打劫并不会成为AlphaGo的软肋。


                               
登录/注册后可看大图

李世石

综合来说,AlphaGo的实力已经很强了。中国围棋男队主教练俞斌九段的评价是职业初段。这个其实并不重要,就像柯洁虽然表示震惊,但让他震惊的并不是从棋谱上表现出AlphaGo有多么高的围棋水平,“可怕的是它是可以学习进化的。”

“AlphaGo实际上是搜索算法和深度学习的结合。”“出门问问”CTO,曾在谷歌研究院领导开发谷歌基于深度神经网络的离线语音识别系统的人工智能专家雷欣告诉本刊记者,“在AlphaGo中,蒙特卡洛树搜索算法结合了经过训练的策略网络和价值网络,具备了不断学习、智能判断的能力,是一种算法的创新应用。当然,这一切的基础仍然存在于蒙特卡洛树算法、神经网络等现有技术的基础之上,AlphaGo的能力一部分是建立在无数人类专家的棋谱之上的,但它也通过自己和自己对弈的左右互博来提高了自己,它自己和自己下了2000万局了。”

雷欣说,神经网络是80年代就已经提出来的算法,曾经风靡一时,但那时的神经网络层次还比较浅,直到2006年,随着搜索技术的发展,Hinton等人提出了深度学习的概念,这个领域又重新热起来了。深度学习和普通的多层人工神经网络的区别在于,前者让网络每一层都进行无监督学习,让网络每一层都自己提炼特征。很多模糊信息的抽象归纳,人类都还做不到,所以没法直接给神经网络直接明晰的输入输出,但计算机通过无监督学习来提炼特征可以进行抽象。


                               
登录/注册后可看大图

“在机器学习流行之前,都是基于规则的系统。因此做语音的需要了解语音学,做NLP的需要很多语言学知识,做深蓝的需要很多国际象棋大师。而到后来统计方法成为主流之后,领域知识就不再那么重要,但是我们还是需要一些领域知识或者经验来提取合适的feature(特征),feature的好坏往往决定了机器学习算法的成败。对于NLP来说,feature还相对比较好提取,因为语言本身就是高度的抽象;而对于Speech或者Image来说,我们人类自己也很难描述我们是怎么提取feature的。比如我们识别一只猫,我们隐隐约约觉得猫有两个眼睛一个鼻子有个长尾巴,而且它们之间有一定的空间约束关系,比如两只眼睛到鼻子的距离可能差不多。但怎么用像素来定义‘眼睛’呢?如果仔细想一下就会发现很难。当然我们有很多特征提取的方法,比如提取边缘轮廓等等。”

但是人类学习似乎不需要这么复杂,我们只要给几张猫的照片给人看,他就能学习到什么是猫。人似乎能自动“学习”出feature来,你给他看了几张猫的照片,然后问猫有什么特征,他可能会隐隐预约地告诉你猫有什么特征,甚至是猫特有的特征,这些特征豹子或者老虎没有。

“深度学习为什么最近这么火,其中一个重要的原因就是不需要(太多)提取feature。

从机器学习的使用者来说,我们以前做的大部分事情是feature engineering,然后调一些参数,一般是为了防止过拟合。而有了深度学习之后,如果我们不需要实现一个CNN或者LSTM,那么我们似乎什么也不用干。(机器让工人失业,机器学习让搞机器学习的人失业!人工智能最终的目的是让人类失业?)”


                               
登录/注册后可看大图

简单的说,以前的计算机只能用来做精确的计算,但现在能够对模糊判断做出最佳决策的话,计算机基本能做各种人能做的事情了。“我们为什么没有清理房屋或者收拾孩子杂物的机器人呢?这并非因为我们在技术上无法做到。现在已经有机器人能够做到。但是问题在于,每一座房屋,每一间厨房都是不同的。你不能为每个机器提前编程,因此,它必须从自己所处的环境中学习。”

打个拔高一点的比方,就像《三体》3里,维德给程心展示,用曲率驱动把一根头发吹动了,程心当时还很木然(就像现在很多人对AlphaGo击败了樊麾不以为然,不就赢了个职业初段),但维德和他的小伙伴们非常兴奋,曲率真的可以驱动啊!以后就可以驱动飞船实现光速飞行啊!

那么这么牛逼的人工智能技术,能用来干嘛呢?“比较传统的应用如谷歌的无人驾驶,比如人脸识别;比如自然语言处理,可以用服务机器人来一定程度替代客服。如果进一步脑洞大开一下:人类到现在也没弄明白中医的阴阳五行阴虚阳虚是啥原理,也很难在古人的基础上改进配方,但也许未来计算机可以。再比如天气预报、交通状况等都可以预测,也包括危机预警,无论机器设备、车辆、人体健康状况、恐怖分子活动等,出现问题之前都会有各种征兆,计算机系统都可能提前预警。当然,所有深度学习的最大问题是足够多的数据样本,而这类预测预警的有效数据收集会相对麻烦一点。”


                               
登录/注册后可看大图

还记得那个能走能跑能跨越障碍物的机器人Altas吗?除了动作稍微笨拙一点外,其行动能力已经有点像人类了,如果人工智能真正成熟以后,它具备深度学习的能力,能像人类那样对模糊判断作出最佳决策,那么它和人类的差距还有多少?


作者: 周星星1832    时间: 11-3-2016 08:44
如果真的能够自我学习,创新就很nb
作者: 蓝山夜妖    时间: 11-3-2016 10:08
真的很牛逼
作者: 周星星1832    时间: 11-3-2016 10:13
蓝山夜妖 发表于 11-3-2016 10:08
真的很牛逼

哪牛鼻。。。
作者: 蓝山夜妖    时间: 11-3-2016 10:25
周星星1832 发表于 11-3-2016 10:13
哪牛鼻。。。

车双马下赢了新科奥斯卡影帝李世石的车马炮
作者: 周星星1832    时间: 11-3-2016 10:30
蓝山夜妖 发表于 11-3-2016 10:25
车双马下赢了新科奥斯卡影帝李世石的车马炮

擦。。。。。。。
作者: colordance    时间: 11-3-2016 12:14

作者: yang738    时间: 11-3-2016 12:31
我是彻底震惊了。

去年最好的围棋软件还是业余5,6段,还下不过业余高手。

一月底就有新闻说alphago战胜了fanhui(曾为专业棋手),现在又2:0领先于李世石。不出意外,应该是5:0.



作者: yang738    时间: 11-3-2016 12:34
而且这款软件和以前的软件不同的,它可以自己学习。

这是非常强大而且非常可怕的。

如果只学习围棋,当然没什么问题。 想象一下,如果这种软件学习了人类的阴暗面,控制发电厂或用太阳能供电,就马上就可以毁来人类了。


以前有许多类似的科幻小说,没想到马上就要变成现实了。


作者: yang738    时间: 14-3-2016 10:20
昨天李世石终于赢了一盘。

疑似电脑软件还不够完善,昨天下了许多昏着,与前三次的比赛中的表现相差比较大。
作者: linallen    时间: 14-3-2016 10:31
yang738 发表于 14-3-2016 10:20
昨天李世石终于赢了一盘。

疑似电脑软件还不够完善,昨天下了许多昏着,与前三次的比赛中的表现相差比较 ...

电脑知道可以防水了。。。
作者: 周星星1832    时间: 14-3-2016 13:11
yang738 发表于 14-3-2016 10:20
昨天李世石终于赢了一盘。

疑似电脑软件还不够完善,昨天下了许多昏着,与前三次的比赛中的表现相差比较 ...

恩。。离完善还远。。。真的完善了就是真的ai了
作者: 西澳海豚    时间: 14-3-2016 13:39
alphago 突然惊觉不能让人类输的太难看,以免妨碍它的 skynet 计画!
作者: 周星星1832    时间: 14-3-2016 13:48
西澳海豚 发表于 14-3-2016 13:39
alphago 突然惊觉不能让人类输的太难看,以免妨碍它的 skynet 计画!


作者: 朵朵豆豆    时间: 12-12-2017 17:34
真的很牛逼诶!据说这系统还能打星际争霸!




欢迎光临 FreeOZ论坛 (https://www.freeoz.org/ibbs/) Powered by Discuz! X3.2