英伟达创建统一的硬件和软件开发接口 应对AI芯片厂商的挑战

时间:2019-3-19 分享到:

北京时间周二凌晨,一年一度的GTC(Graphic Technology Conference,每年由Nvidia主办的GPU技术会议)在硅谷圣克拉拉正式拉开了帷幕。Nvidia CEO 黄仁勋的主题演讲往往是每年GTC的热点,本文将为大家带来今年GTC黄仁勋主题演讲的内容分析。

英伟达创建统一的硬件和软件开发接口 应对AI芯片厂商的挑战

PRADA:GTC2019 关键词

近几年,人工智能持续得到关注,Nvidia的GPU则成为了人工智能计算的基础设施。同时,Nvidia也借着这股东风在近几年内硅谷最炙手可热的公司之一。

事实上,Nvidia的GPU成为人工智能的基石,不仅仅是因为其GPU支持大规模并行(这一点AMD的GPU也能做到),更因为其生态系统。Nvidia早年研发的在GPU上做通用计算的CUDA生态在经过数年艰苦经营后成为了人工智能开发者的首选,从而为Nvidia的GPU在人工智能领域的领先地位建成了坚实的护城河。

然而,随着人工智能的走火,Nvidia在芯片领域也受到了不少初创公司的挑战。毕竟,GPU原本并非为人工智能专门设计,因此其效率相比专门为人工智能优化的专用芯片来说相差不少。因此,Nvidia在这一领域最大的优势并非芯片,而是其CUDA生态。这也是今年GTC黄仁勋主题演讲的焦点。

黄仁勋在今年的主题演讲中作为纲领的关键词是PRogrammable Acceleration (for multiple) Domains (with one) Architecture,即PRADA。PRADA的意思是“使用一个统一的硬件和底层软件接口架构(CUDA-X),通过编程可以为不同的领域做定制化的高效率加速”。在这里,PRADA有明显的回应AI芯片初创公司的意味,首先AI芯片往往宣称GPU无法做domain-specific acceleration,因此效率差;而Nvidia则用PRADA回应说GPU通过编程也可以做高效domain-specific acceleration。更进一步,由于AI芯片往往只针对特定应用,因此不同的应用需要不同的芯片,不同的软件API以及系统框架,因此会造成碎片化的问题;而使用GPU配合其强大的CUDA生态则可以完美解决这个问题,使用同一类硬件,同一种框架就可以解决不同领域的问题。

英伟达创建统一的硬件和软件开发接口 应对AI芯片厂商的挑战

今年的GTC的开场中,Nvidia列举了众多基于GPU的AI能担任的角色,包括Visionary(智能设计),Guardian(计算机视觉),Navigator(无人车和无人机),Scientist(数据挖掘),Healer(深度学习医疗),以及Artist(基于AI的内容生成)。这些内容都包含在了PRADA的领域中,也让我们看到了Nvidia在AI时代的野心。

英伟达创建统一的硬件和软件开发接口 应对AI芯片厂商的挑战

计算机图像:Nvidia的基本盘

在今年的GTC上,Nvidia在计算机图像领域的主题是实时ray tracing(RTX)。这个主题从去年开始就开始宣传,在今天Nvidia在GTC上则主要是给出了一些RTX的落地应用。有趣的是,重点不再是游戏,而是智能设计中的渲染和多媒体设计中的渲染。

首先展示的demo是汽车智能设计中的实时RTX。在demo中,使用RTX渲染的图像和真实的汽车图像让人难辨真假,而更重要的是RTX可以做到实时。因此,设计者可以实时更改设计,更改表面材料属性,从而实时看到更改造成的表面光反射等。在这里,Nvidia同时宣布了对于最新版Unity的支持,强强结合为智能设计赋能。

英伟达创建统一的硬件和软件开发接口 应对AI芯片厂商的挑战

此后,Nvidia展示了RTX在游戏中的应用。比较令老玩家感动的是Nvidia对于Quake II做了RTX的重制,从而让经典游戏焕发出了新的光彩。

英伟达创建统一的硬件和软件开发接口 应对AI芯片厂商的挑战

最后,Nvidia展示了其GPU在多媒体内容(电影等)渲染中的应用,包括其强大的生态伙伴,包括微软的DirectX,Unity等。

英伟达创建统一的硬件和软件开发接口 应对AI芯片厂商的挑战

AI与超级计算机

在传统的图像渲染之外,Nvidia的第二个主题是行业用大数据分析。

在这里,黄仁勋首先重申了Nvidia在大数据时代的愿景。在大数据时代,最关键的基础设施是计算能力。本环节的看点是,Nvidia的关注点已经从“神经网络”这一种狭义的机器学习方法拓展到了更广阔的大数据处理能力,包括对XGBoost等传统机器学习算法的支持。这一方面说明了Nvidia对于大数据时代的看好,另一方面也体现了GPU的通用性。

Nvidia首先展示了一个微软Bing基于其GPU的智能助手demo,该助手类似Siri,可以识别用户的语音命令,并且使用自然语言处理方法理解用户的意图,通过搜索引擎搜索到相关结果呈现在用户面前,同时把最关键的一条结果用语音播报给用户。在这里,处理延迟是关键指标(GPU计算高延迟也往往是为人诟病的痛点),而Bing的演示中该助手使用非常流畅,可见是做了很多优化,体现了GPU在低延迟应用中的潜力。

之后,Nvidia把重心放到了超级计算机上。为了帮助大数据应用,Nvidia提出了“数据科学服务器”的概念。传统的服务器大致可以分成两类,一类是超级计算机supercomputer,其处理的任务计算量大,但是任务数目有限;另一类是hyperscale,其处理的任务计算量并不大,但是任务并发数量非常大,类似于网络搜索等。而大数据应用则是在两者之间,其处理的任务计算量较大(如训练任务),同时任务数量也不小。Nvidia认为其GPU架构非常适合这类数据科学计算应用,并发布了数据科学服务器。该服务器的性能将比原有的DGX-2略低,但是其对于RDMA等关键技术的支持可以使这样的服务器能快速形成计算集群,从而满足数据科学对于算力的需求。

英伟达创建统一的硬件和软件开发接口 应对AI芯片厂商的挑战

机器人应用

这次Nvidia的演讲的第三部分是关于机器人。机器人部分其实是从原来的自动驾驶概念拓展而来(自动驾驶也属于机器人的一部分)。机器人与自动驾驶事实上都是一脉相承,其要点在于能在本地提供低延迟、高可靠性的强算力系统,而目前机器人在各大智能工业领域纷纷落地得到使用,因此Nvidia将其概念拓展到机器人可谓是顺势而为。

首先发布的是Jetson Nano开发板,是基于之前的Tegra X1芯片,在板子设计上做了精简,以$99的低价发售。

英伟达创建统一的硬件和软件开发接口 应对AI芯片厂商的挑战

之后的重点仍然是自动驾驶。在自动驾驶方面,第一个上场的是最新版本的Drive Ap2X,它是Nvidia的level-2自动驾驶系统。该系统可以实现自动收集本地高精度地图,并实现交通标志检测等。

在这之后,黄仁勋隆重介绍了Drive AV,这是Nvidia的路线规划系统。该系统可以对于其他车辆的行动路径做预测,从而实现安全驾驶。此外,还有Constellation系统,该系统是包括了软件和计算硬件的自动驾驶模拟系统。该系统可以让用户可以以驾驶员的角度来实时观测驾驶的效果,从而尽可能保证安全驾驶。最后,Nvidia还发布了和丰田的全方位合作,将从硬件到软件上一起构建下一代自动驾驶系统。

结语

在本次GTC的主题演讲中,我们看到了一个重要的方向,即人工智能已经在进入了落地阶段。对于人工智能,Nvidia不再有太多花哨的概念和宏大的前景预期,而是踏踏实实将几个可以落地的应用落到实处。在落地的过程中,也不再拘泥于“深度学习”,“自动驾驶”等热门风口,而是合并同类项,将“深度学习”拓展到了“大数据”,同时将“自动驾驶”拓展到了“机器人”。我们认为对于人工智能行业来说,确实也进入了落地的阶段。在未来的数年内,我们将看到这些概念的一一实际应用,为我们的生活带来更多实际变化。

此外,面对AI芯片初创公司的挑战,Nvidia则是重申了“生态”这一利器并多次提及了其CUDA-X生态,而生态也确实是目前Nvidia最高的护城河。预计AI芯片初创公司只能先从一些较小但是有明确痛点的地方入手,才能慢慢站住脚跟并挑战Nvidia的位置。

版权所有:https://www.shgopi.cn 转载请注明出处