在B站和英伟达官网刷英伟达新一代游戏显卡消息的玩家们可能会有些失望了。在自家公司的图形处理器技术会议录播视频中,英伟达CEO黄仁勋在自家厨房大谈的是GPU在人工智能、机器学习和自动驾驶的用途。
5月14日晚,英伟达在线放出了其年度GTC大会主题演讲,正式发布了其最新图形芯片NVIDIAA100,该芯片为首个基于安培(Ampere)架构的计算芯片产品,定位数据中心的AI、通用运算、数据分析、科学计算与云端影像分析等用途,采用台积电7纳米制程。
黄仁勋在演讲中花大量篇幅展示了新的安培架构GPU,以显示其与前一代伏特架构相比更为强大的性能。作为安培架构首发的NVIDIA A100搭载高达540亿个晶体管,是目前当前最大的7纳米制程芯片。在满足AI运算需求上, 新GPU可使AI运算性能提高20倍;在数据中心高性能计算用途方面,NVIDIA A100相较前一代可提高2.5倍运算量。
颇受瞩目的是,新一代GPU既可迅速完成计算任务,又可根据需求在AI训练和推理两种用途中切换。这意味着GPU打破边界,侵入到通常负责AI推理任务的CPU计算领域。也就是说,新一代GPU架构推出后,英伟达希望能在数据中心乘机取代更大、更昂贵以及更耗电的英特尔处理器。
黄仁勋认为,新一代数据中心等级的运算平台,不仅要有高效能运算处理能力,还要能够涵盖网络、储存,甚至从上层应用到底层,所有软件堆栈优化都包含在内,藉此来达到优化的加速运算。
“服务器已不是数据中心的最小运算单元,数据中心本身已成为新的运算单元。”黄仁勋说,他进一步称,在下一个十年,具备有数据中心处理等级的运算设备,将会是一种常态。
数据中心将成为数据运算的最基本单位,这也是英伟达的新战略方向,未来也要能够提供全程端到端的数据中心等级的GPU运算平台方案。无论以69亿美元收购以色列网络设备商Mellanox,还是收购网络软件公司Cumulus,就是英伟达这种思路的体现。
黄仁勋介绍说微软、亚马逊、谷歌、戴尔以及阿里巴巴等大型云服务提供商已计划将单个A100 GPU整合到自己的产品中。在需求上,他更表示新客户对安培架构GPU的热情“前所未有”。
擅长玩梗的英伟达还在这次“厨房谈话”中揭晓了一个悬念,早在主题演讲前两天,就有一段黄仁勋从家里烤箱热腾腾端出超大型GPU计算卡的短片在网络疯传。这款计算卡就是伴随着安培架构推出的还有新一代人工智能计算系统DGX A100,其采用8张NVIDIA A100加速卡,用来处理大规模数据或进行AI训练,每台售价19.9 万美元,可用于研究新冠肺炎潜在治疗方法,美国能源局阿贡国家实验室已经宣布率先采用DGX A100。
作为今年兴起的AI计算的弄潮儿,GPU代表的并行计算因踩准机器学习计算需求而大获成功,GPU在架构优势下进行机器学习训练可获得更高效率,当研究人员试图运用数据来研究算法时,GPU能够以更快速度进行训练和数据处理。此后,英伟达便持续根据高性能运算、数据中心和自动驾驶来开发产品。
过去五年来,英伟达成功建立价值超过30亿美元业务,并建立了一个围绕GPU计算和的广泛生态系统。英伟达GPU芯片已在数据中心的AI训练领域获取不少市场,根据英伟达2月份公布的第四季度财报,数据中心业务收入增长42.6%,达到9.68亿美元,数据中心业务目前占到英伟达收入的约三分之一,
但英伟达在数据中心方面也面临挑战,在英伟达推出新产品同时,英特尔即将推出旗下新款GPU,挑战英伟达市场地位。同时,英伟达在GPU领域最大竞争对手AMD,也正在为旗下数据中心业务努力推广宣传。如何应对其他两大芯片巨头的竞争态势,将是未来一段时间英伟达公司不可避免的重要命题。
最后,颇受全球消费者关注的是,在GPU新安培架构宣布后,下一代消费级显卡何时正式落地?
显然,英伟达本次发布更关注的是数据中心用途,与消费级应用大相径庭。当前,英伟达消费级主推的图灵架构显卡采用12纳米制程,主打光线追踪技术和人工智能计算核心,而与伏特架构主打的数据中心AI计算进行区分。但安培架构带来的制程和架构升级,对已经采用图灵架构近两年的消费级显卡意义巨大。
英伟达下一代显卡是否采用安培架构仍是未知数,但就其最赚钱的游戏业务而言,如何平衡显卡架构在游戏图形和AI计算的关系是一个需要小心处理的问题。“架构上存在很大的重叠,这是毫无疑问的。” 英伟达发言人在回答媒体提问时称,他解释道,面向消费者时,新显卡将更侧重于满足图形需求,而非计算性能。
考虑到下一代游戏主机即将面世,当新一代显卡架构正式奠基后,英伟达也确实需要在未来几个月给玩家带来一些新东西了。