UFO灵魂捕手 2017年10月19日 15:12
DeepMind公布了AlphaGo的最新升级版本AlphaGo Zero,并于最新一期的《自然》杂志上,对其使用的相应技术做出详解。
DeepMind称,“AlphaGo Zero与AlphaGo最大的不同是做到了真正的自我学习,经过3天的训练,就以100:0的战绩完胜前代AlphaGo。
[领优惠券元后元]
UFO灵魂捕手 2017年10月19日 15:21
之所以 AlphaGo Zero 比通过人类数据学习获得更好的成绩,是因为:
首先,AlphaGo Zero 仅用棋盘上的黑白子作为输入,而前代则包括了小部分人工设计的特征输入。
其次,AlphaGo Zero 仅用了单一的神经网络。在此前的版本中,AlphaGo用到了“策略网络”来选择下一步棋的走法,以及使用“价值网络”来预测每一步棋后的赢家。而在新的版本中,这两个神经网络合二为一,从而让它能得到更高效的训练和评估。
第三,AlphaGo Zero 并不使用快速、随机的走子方法。在此前的版本中,AlphaGo用的是快速走子方法,来预测哪个玩家会从当前的局面中赢得比赛。相反,新版本依靠地是其高质量的神经网络来评估下棋的局势。
阿尔法狗的学习围棋知识的过程
UFO灵魂捕手 2017年10月19日 15:32
阿尔法狗的学习曲线,如何3天快速掌握围棋的
水电费 2019年4月7日 06:55
楼主的帖子实在是写得太好了。文笔流畅,修辞得体,深得魏晋诸朝遗风,更将唐风宋骨发扬得入木三分,能在有生之年看见楼主的这个帖子。实在是我三生之幸啊。看完楼主的这个帖子之后,我竟产生出一种无以名之的悲痛感——啊,这么好的帖子,如果将来我再也看不到了,那我该怎么办?那我该怎么办?直到我毫不犹豫地把楼主的这个帖子收藏了,我内心的那种激动才逐渐平静下来。可是我立刻想到,这么好的帖子,倘若别人看不到,那么不是浪费楼主的心血吗?经过痛苦的思想斗争,我终于下定决心,牺牲小我,奉献大我。我要拿出这帖子奉献给世人赏阅,我要把这个帖子一直往上顶,往上顶!顶到所有人都看到为止!
zbzj2000 2019年7月6日 05:57
从您这学习很多,最棒的自媒体!哈哈哈哈哈啊啊
cocof1b2 2019年8月27日 00:50
,你若安好,便是晴天,哈!
王颜 2019年8月28日 19:25
鸡冻啊……马上就要去和楼主进行深入交流,实现了解自我,认识自我的过程
lq小77 2019年8月28日 23:48
任何成长都需要伴随着自省和与外界交流的,封闭的环境下如果能自省还好,自省以后需要从外界吸取新的营养来充实,如果只是自恋自闭,那就是恶性循环了
jerryye 2019年8月29日 00:52
一片树叶落下,文科生:叶的离去,是风的追求,还是树的不挽留;理科生:是脱落酸
我在指尖分想 2019年8月29日 11:56
现实是残酷的,我们无法控制,能控制的只有心态!
你你你 2019年8月29日 12:23
人生如戏,全靠演技!顺其自然,随遇而安,一切随兴,能不能
用户kbp84w1n50 2019年8月29日 20:47
,虽然帖子不怎么样但还是支持一下
骄傲像个王 2019年8月29日 21:29
万能的神啊!保佑我吧!我的愿望是,一觉睡到小时候
995786282a 2019年8月30日 01:05
我需要一盏灯,看清前路的泥泞,我又怕光明,映出我褴褛的身影
showshow 2019年8月30日 22:19
唯独对你,我可以什么都不要;可是,你却不要什么都不要的我
ldy413 2019年8月30日 23:52
专心盖楼,珍爱生命,远离卧槽
走进猕猴桃 2019年9月3日 01:28
是谁只手遮天,压制祸国殃民的东林党? 答案:魏忠贤,是太监!是阉党!
是谁写下了史家之绝唱,无韵之离骚?答案:司马迁,是太监!是阉党!
是谁伏边定远,为大唐平定西南蛮夷?答案:杨思勖,是太监,是阉党!
是谁改良了造纸术,传承了人类文明?答案:蔡伦,是太监!是阉党!
是谁扬帆远航,扬国威于万里之外?答案:郑和,是太监!是阉党!
是谁操持国政,挽唐廷于既倒?答案:鱼朝恩,是太监,是阉党!
是谁拓边西北,经略幽燕?答案:童贯,是太监,是阉党!是谁写下此帖,是LZ,是太监,是阉党!
登录 后才能发表回复哦~