北京时间10月19日凌晨,谷歌旗下的人工智能公司DeepMind在世界顶级科学杂志Nature杂志上宣布了AlphaGo的新进步,可以在没有人类干预的情况下自我学习,新的AlphaGoZero在自我学习3天之后,就以100比0的成绩战胜了第一代AlphaGo。
自我学习能力的出现,对于人工智能和机器学习来说,是一个新的突破。“过去人们普遍认为机器学习是基于海量的大数据,但是从AlphaGoZero身上,我们发现算法比数据更重要。”AlphaGo项目的主要负责人戴维·席尔瓦(David Silver)说道。
也由于使用了更多的算法和更少的数据,所以AlphaGoZero只使用了一台计算机器和4个TPU,被它打败的一代AlphaGo则用到多台机器和48个TPU。
当人们惊讶于AlphaGoZero在围棋领域的神级水平时,对于DeepMind团队来说,这才只是刚刚开始,他们的目的是通过培养自主学习的能力,来解决更多其他领域目前无法解决的棘手问题。
从AlphaGo、AlphaGoMaster到AlphaGo Zero
AlphaGo于2015年10月面世,在广为人知的与棋手李世石对弈之前,它已经打败了欧洲围棋冠军樊麾。樊麾接受《财经》记者采访时表示,当时在他看来,一个计算程序要打败职业棋手是不可能的事情。
结果他以0-5输给了AlphaGo,但他也因此加入了DeepMind团队,帮助训练AlphaGo。2016年3月,在他帮助训练下的AlphaGo以4-1的成绩打败了人类顶尖棋手李世石。2017年初,AlphaGo化名为“Master”,在网络上挑战60名人类棋手,保持全胜的成绩。2017年5月,在乌镇的,名为Master的第二代AlphaGo以3-0战胜了目前人类最强棋手柯洁。
今年5月的比赛期间,DeepMind的多位高管就已经向《财经》记者透露,Master已经实现了自我学习能力,甚至有了自己的“直觉”,“我们发现AlphaGo已经不需要依赖人类训练师了。”戴维·席尔瓦告诉《财经》记者。
与柯洁的对弈中,AlphaGo已经能下出很多人类棋手完全无法想象的路数,比赛后柯洁表示,第一代的AlphaGo还能找到破绽,Master已经实现了“从人到神”的飞跃。
而AlphaGoZero在“独立”上更进一步,在训练的过程中,它是自我对弈。从训练图上可以看出,由于一开始并不熟悉围棋,对弈双方的水平都很弱,但是随着时间的推进,在短短3天互相博弈490万局后,越来越强,实现了围棋水平的突破。
人类顶尖棋手柯洁被认为是围棋天才,6岁开始学棋,17岁时在世界范围内排名第一,一个人类天才十几年的学习,被AlphaZero用3天时间超越。
但DeepMind团队志不在此,“AlphaGo的意义不在于打败人类,而是领悟知识,解决更多的问题。”戴维·席尔瓦表示。
商业化加速:1/4精力用于商业变现
今年5月,DeepMind创始人杰米斯·哈萨比斯在接受《财经》记者采访时表示:“如果说谷歌是火箭,DeepMind就是燃料。”
在此定位之下,AlphaGo虽然进化神速,但绝对不会止步于围棋。
这家公司一开始只是一家位于英国伦敦的人工智能实验室,研究方向是开发通用自我学习算法。2011年,哈萨比斯在埃隆·马斯克等人的投资下,成立了DeepMind。2014年,谷歌以4亿英镑(约6.5亿美元)的价格收购该公司,当时这家公司只有50名员工。AlphaGo就来自于这家公司。
AlphaGo战胜韩国第一棋手李世石引爆了AI技术和市场,也让DeepMind在谷歌AI战略中地位举足轻重。
不过,DeepMind团队从一开始研发AlphaGo系统的目的就是能实现行业应用,并带来商业价值。围棋为AlphaGo带来了光环,却并非最终目标。
哈萨比斯对《财经》记者说,“下一阶段,DeepMind整个团队75%的精力用于人工智能技术的研发,另外25%精力放在行业应用上。”
具体分工上,哈萨比斯继续主导技术研究,另一位创始人穆斯塔法·苏莱曼则负责主导商业化。
穆斯塔法认为,继续技术研究和商业化是一种平衡。“我们手里有很多实验室里的新技术,都是宝贵的资源,而这些技术的商用不仅能造福社会,一家公司也必须有可持续的商业利润来源。”他告诉《财经》记者。
据他介绍,目前DeepMind由两个团队组成,哈萨比斯负责研发团队,而他负责技术应用业务。技术应用团队又再分为三个组,一个组服务谷歌的产业和谷歌的其他业务部门;第二个是医疗组,已经与英国的国家医疗健康局合作;第三个组是能源组,目前还在启动阶段。
“这样的分组是为了方便与不同领域的专家更好地合作。”他说。
此前,DeepMind已经牛刀小试,成功利用机器学习为谷歌大幅度节约电量,带来实际收益。
2016年,DeepMind团队就利用AlphaGo的学习能力,不断模拟探索更加省电的方案。DeepMind接管了谷歌数据中心的一些控制单元,包括风扇、空调、窗户和服务器等,通过机器学习,帮助谷歌数据中心的冷却系统节约用电40%,并提高了15%的能源使用效率。
哈萨比斯对《财经》记者说:“谷歌在数据中心设备上的用电太多,几个百分点就意味着每年几百万美元,节约电力的算法每分钟都在给公司省一大笔钱。”
这个算法团队的开发团队仅有5、6个人,耗时仅两三个月。
目前,DeepMind的部分研发项目已经开始用于能源基础设施管理、医疗系统和洁净水源的改进等方面,公司也已经从中获得收益。
DeepMind也已开始进军医疗市场并从中盈利。2015年11月,它与英国伦敦皇家自由医院签订了为期五年的合同,任务是处理170万名患者的医疗记录。
在这次Nature杂志上发表的论文中,戴维·席尔瓦也强调了未来的行业应用,例如蛋白质折叠(用于破译遗传密码)、能量节约以及新材料的研发等等。
在过去,机器学习未能得到广泛应用,主要原因之一就在于很多人类无法解决的领域中,也缺少大量的数据样本来让机器进行学习,例如医疗图像处理等。AlphaGoZero能够摆脱人类的依赖,不需要人类给出数据和样本,这为更广泛的行业应用提供了新的可能性。
这与谷歌成立母公司Alphabet实现组织变身的目的一致。母公司Alphabet创立后,整个企业资产负债表开始分账计算,业务被独立出来,明确了职责和成绩,提升创新效率。
一位资本市场分析人士向《财经》记者分析评价,如果一直在之前的架构中,DeepMind对谷歌的技术输血价值难以清晰衡量,DeepMind也很难有一个明确、长期、符合谷歌战略的研究目标。
更重要的一个原因是,资深科学家和强大的计算能力对AI业务的开展固然重要,但DeepMind走出去,获取真实环境数据同样重要,这些深入到行业的数据,比如医疗,恰恰是谷歌缺失的数据源。作为一家搜索、社交基因的互联网公司,谷歌手中的巨量数据,多是开放社交属性类数据。
(来源:财经)