- 
				最强“新狗”AlphaGo Zero发布 柯洁:对于它的自我进步来讲,人类太多余关键字: 阿法狗新版发布新版阿法狗远胜旧版柯洁:人类太多余北京时间今天(10月19日)凌晨,谷歌旗下的DeepMind团队公布了进化后的最强版AlphaGo ,代号AlphaGo Zero。AlphaGo曾打败了中国顶尖棋手柯洁,而AlphaGo Zero经过3天的训练,就以100:0的比分完胜AlphaGo。这条消息点燃了中国围棋界,连柯洁也发微博感叹:对于AlphaGo的自我进步来讲,人类太多余了…… 谷歌今天发布的这款名为AlphaGo Zero有多厉害?据“快科技”网站文章的介绍,它的系统可以通过自我对弈进行学习,它利用了一种名为强化学习的技术。在不断训练的过程中,这套系统开始靠自己的能力学会围棋中的一些高级概念。 经过3天的训练后,这套系统已经可以击败AlphaGo Lee,也就是去年击败韩国顶尖棋手李世石的那套系统,而且比分高达100比0。经过40天训练后,它总计运行了大约2900万次自我对弈,使得AlphaGo Zero得以击败AlphaGo Master(今年早些时候击败世界冠军柯洁的系统),比分为89比11。   AlphaGo之父戴密斯·哈萨比斯(Demis Hassabis) 与学习大量人类棋谱起步的前代AlphaGo不同,AlphaGo Zero是从“婴儿般的白纸”开始,通过3天数百万盘自我对弈,走完了人类千年的围棋历史,并探索出了不少横空出世的招法。 值得注意的是,虽然AlphaGo Zero在几周的训练期间学会了一些关键概念,但该系统学习的方法与人类有所不同。另外,AlphaGo Zero也比前几代系统更加节能,AlphaGo Lee需要使用几台机器和48个谷歌TPU机器学习加速芯片。其上一代AlphaGo Fan则要用到176个GPU芯片。AlphaGo Zero只需要使用一台配有4个TPU的机器即可。 DeepMind团队创始人David Silver介绍AlphaGo Zero说,这款程序超越了过去所有的AlphaGo版本,目前是世界上最大强大的围棋程序。   (视频截图,下同) 它的学习不使用人类数据,而是自我学习,完全从零开始。之所以它能比向人类数据学习的程序效果更好,是因为它每次对弈的“陪练”都被校准为与它持平的水平,它的“陪练”从非常基础的水平开始,逐渐上升为非常高的水平。   David Silver还说,人们一般认为机器学习就是大数据和海量计算,但是他们在AlphaGo Zero的研究中发现,算法比所谓计算或数据可用性更重要。   以下是完整视频: DeepMind联合创始人和总裁David Silver介绍新版阿法狗。 (视频自腾讯) - 原标题:柯洁:对于AlphaGo的自我进步来讲 人类太多余
- 请支持独立网站,转发请注明本文链接:
- 责任编辑:魏其濛
 
- 
				 
				
				
				
				
				
				●  观察者头条  ●风闻 · 24小时最热 查看全部>>最新视频最新闻 Hot- 
									  《科学》揭露美国医药审查黑幕 或许证实了你的猜想
- 
									  这片子观众少到没评分,却看透日本如何培养队长小翼
- 
									  “仗势欺人美国佬”加渔船在争议水域被美巡逻队拦下
- 
									  泰沉船事故致42人遇难 为何一上船就收走救生衣?
- 
									  靠香港群众的捐款,他在内地做了件了不起的事
- 
									  独立日,自由女神像上的抗议者被捕
- 
									  印航回应改成“中国台北”:外交部指示
- 
									  “为什么美国不直接入侵委内瑞拉呢?”
- 
									  “美关税清单200多亿由外资生产 美企占相当比例”
- 
									  英媒在美独立日发文 美国人上去就怼
- 
									  只是觉得好玩?男子在上海地铁多次点火烧纸被刑拘
- 
									  日本老牌女子大学将招收男生:只要内心是妹子就行
- 
									  最近美国高官吃个饭真是坎坷
- 
									  亲妈把孩子罩在凳下打麻将?警方回应来了
- 
									  有这样一个“阴谋论”在美国疯传…
- 
									  我,默克尔,不慌了!真的吗?
 快讯
- 
									







 沪公网安备 31010502000027号
 沪公网安备 31010502000027号 中国互联网举报中心
 中国互联网举报中心 上海市互联网违法与不良信息举报中心
 上海市互联网违法与不良信息举报中心 
	