满洲仔仙门户网站
当前位置:满洲仔仙门户网站>>综合>>sg电子官网-英伟达的AI芯片霸主之路

sg电子官网-英伟达的AI芯片霸主之路

2020-01-11 12:58:03   来源:满洲仔仙门户网站   阅读:3816


sg电子官网-英伟达的AI芯片霸主之路

sg电子官网,随着人工智能发展如火如荼,我们看到Nvidia的GPU成为了人工智能时代的基础设施,为人工智能服务提供必不可少的算力。本文为大家回顾Nvidia走上人工智能加速硬件主导者位置的历程,希望能给大家带来一些启示。

Nvidia缘起:PC游戏时代

Nvidia的诞生还要追溯到多媒体PC机时代。在上世纪90年代,PC机走向了多媒体时代,其中3D游戏又是多媒体时代最闪耀的明星。为了能加速3D游戏的运行,图像处理芯片就成了多媒体PC时代的一种热门新品类。最初,加速3D游戏运行在常规的显示卡之外还需要一张3D加速卡,而3D加速卡的首创者——3dfx也凭借着其Voodoo系列加速卡成为了当时的3D加速引领者。

看到了3D显示这个巨大机会的并不只3dfx一家公司。Nvidia于上世纪90年代中成立,公司的目标市场就是显示市场。1998年,Nvidia推出了TNT系列显卡,拥有了与3dfx同台竞技的资格。之后,3dfx的后几代显卡产品存在各种问题,而Nvidia却在2000年顺势拿出了同时支持3D加速和transformation and lighting (T&L,指一系列图像处理中需要的坐标和光照变幻运算)的GeForce系列显卡,在性能上大幅领先3dfx,并最终奠定了其游戏显卡领域的霸主地位。事实上,在GeForce之前,显卡并不负责繁重的T&L计算,而必须由CPU来做这些运算;GeForce是第一个用显卡支持T&L来大幅提升系统性能的显卡,并且Nvidia认为显卡支持了之前必须由CPU来完成的工作,因此提出了GPU这个概念。可以说GeForce是Nvidia最重要的产品之一,同时我们也可以从GeForce的诞生看到Nvidia并不是拘泥于产品传统品类定义的公司,而是会积极地拓宽其产品的应用范围。这样的公司基因也直接造就了之后Nvidia在人工智能领域的领先地位。

GPGPU和CUDA:Nvidia最好的一笔投资

在推出GPU之后,Nvidia顺利地占领了游戏显卡市场的主导地位。游戏市场虽然不小,但是其增长天花板也较低。因此,Nvidia也在尝试各种不同的市场机会。

在2000年左右,学术界对于使用GPU做通用计算(GPGPU)产生了兴趣。当时,主要面向执行通用算法的CPU是执行科学计算的主力,但是CPU为了能在通用算法上都有较好的性能,因此很多芯片面积事实上用在了片上内存和分支预测等控制逻辑,而真正用于计算的单元并不多。相反,GPU架构中的控制逻辑较为简单,绝大多数芯片面积都用于渲染、多边形等计算。学术界发现,运算中的矩阵等计算可以很简单地映射到GPU的处理单元,因此能实现非常高的计算性能。

当时,GPGPU最主要的瓶颈在于难以使用。由于GPU是面向图像应用而开发,因此要在其编程模型中支持通用高性能计算并不容易,需要许多手工调试和编码,因此造成了很高的门槛,能熟练使用的人并不多。另一方面是厂商对于GPGPU应用的态度。事实上,当时GPGPU的研究主要在学术界,在工业界并没有很多人清楚GPGPU未来能有多少价值,不少公司虽然也有研究GPGPU的团队,但是大多仅仅是做一些评估和尝试性的工作,并没有认真打算大规模应用。

Nvidia对于GPGPU却是抱着另一种态度。在2006年,Nvidia推出了Tesla架构。在这个架构中,Nvidia一改之前使用矢量计算单元做渲染的做法,而是把一个矢量计算单元拆成了多个标量计算渲染单元,并称之为“unified shader”。这样一来,Tesla GPU的渲染单元除了在渲染性能更强之外,也更适合做通用计算了。在2007年,Nvidia顺势推出了CUDA系列编程环境。CUDA是GPGPU领域的一个创举,通过CUDA可以大大降低用GPU做通用计算的难度,因此大大降低了GPGPU应用的门槛。

究竟是Nvidia之前就策划要做GPGPU,因此才推出Tesla架构以及CUDA,还是Nvidia在推出Tesla架构之后为了充分发挥其潜力而顺便推出CUDA,我们今天不得而知。但是,我们能看到的是,CUDA首先在GPGPU领域引起了很大的反响,因此在第二年有了开源版本的OpenCL来在其他GPU上实现类似的功能;另一方面,我们看到Nvidia在GPU领域最大的竞争对手AMD在当时对于GPGPU并没有太多动作,以至于一年后的OpenCL事实上是苹果而非由AMD发起的。在当时,苹果希望能在各种设备(尤其是移动设备)上充分利用GPU来完成计算,因此发起了OpenCL组织,参与的公司除了苹果之外还有ARM、AMD、Nvidia等。然而,为了兼容性考量,OpenCL并无法在所有GPU上都实现最优的性能,因此相比于专注于给自家GPU做优化的CUDA来说性能差了一截。AMD在当时并没有自己提出一个与CUDA争锋相对的协议而只是选择加入OpenCL组织也证明了当时AMD对于GPGPU的观望态度。

AlexNet + Nvidia GPU引领了人工智能风潮

时间走到了2012年,Nvidia在经过移动市场的失望后,迎来了新的蓝海市场。2012年的重要性在于,深度学习开山鼻祖之一的Geoff Hinton的学生Alex Krizhevsky成功训练出了深度卷积神经网络AlexNet,并凭借该网络在图像分类识别领域大幅提升了性能(15%的错误率,比第二名真正高出了十个绝对百分点),从而成为人工智能的标志性事件。

在2012年之前,绝大多数图像分类任务都是使用类似支持矢量机(SVM)这样的经典算法实现。SVM这样的算法非常适合应用在数据量较少的应用中。然而,随着互联网时代的来临,人们积累的数据量远远大于之前的时代,而在拥有大量数据的情况下,神经网络就成了理论上更好的选择。然而,在当时训练一个深层神经网络还存在一个挑战,就是算力问题。使用普通的CPU在ImageNet上训练一个深度学习网络需要数年的时间,因此无法实用。而Alex Krizhevsky的创举在于使用Nvidia GPU成功训练了一个性能有突破性提升的深度神经网络,从而开启了新的人工智能时代。

AlexNet性能的大幅提升使得人工智能在图像分类等有大量实际应用的场景达到了可用的性能,而Nvidia GPU则伴随着深度学习模型训练和推理所需要的大量算力成为了人工智能时代的新基础设施。这也可以说是Nvidia数年前在GPGPU领域投资所收获的回报:如果没有CUDA这样的高性能GPGPU编程工具,或许AlexNet就无法被训练出来,而人工智能时代可能就无法被开启。而在之后,随着深度学习网络热潮的兴起,高校和工业界在越来越多的场景使用深度学习——目前在图像、语音、自然语言处理、推荐系统等大量场景深度学习都已经落地。随之而来的是对于GPU算力的进一步需求,而Nvidia也是顺势而为,在最近几年接连推出为了人工智能而优化的GPU以及相关配套软件资源(用于推理的TensorRT,基于CUDA的高性能深度学习加速库CuDNN,CuBLAS等等),从而让自己在人工智能时代的地位更加稳固。

反观AMD,事实上由于AMD一直处于追赶阶段,因此迟迟不敢下决心去做一些新的尝试。当年GPGPU领域AMD投入不足,导致Nvidia的CUDA占据了先机。在性能上,AMD所依赖的通用OpenCL性能据调查比起CUDA要差30%以上。更关键的是AMD的人工智能开发者生态一直做不起来,因为OpenCL性能差且使用不方便,导致使用OpenCL的开发者少,开发者少就更少人能为OpenCL开发方便的接口和共享设计资源,这进一步导致OpenCL开发社区人气不足,有GPGPU开发需求的开发者都会把Nvidia的CUDA作为其第一选择。在GPU硬件上,直到Nvidia已经推出专门针对人工智能优化的TensorCore之后,AMD对于要不要在GPU上加入对人工智能的支持仍然迟疑不决,一直到2018年才推出对人工智能的相关支持,因此导致在人工智能领域远远落后了。最后必须指出的是,一直以来AMD的思路都是性价比,而人工智能的主要客户却是对于价格不怎么敏感的企业客户,因此AMD之前的低价战术也没办法打动这些客户。

Nvidia人工智能的今天和未来

目前,Nvidia已经占据了人工智能算力领域的主导位置。在数据中心领域,即使有一些初创公司推出训练和推理加速芯片,但是想要取代Nvidia需要相当长的时间。首先,大规模部署芯片对于产品的可靠性有相当高的需求,而且分布式系统是一个系统工程,需要芯片在各类指标上(不只是算力,还包括通信,接口带宽等)都达到优秀的指标,光这一点就需要初创公司相当多的时间去打磨。此外,Nvidia更高的壁垒在于开发者生态,需要开发出一个易用的编程模型和相关编译器的难度并不亚于设计芯片,而要孵化开发者生态则需要更多的时间。我们认为,至少在未来3-5年内,Nvidia在数据中心的地位难以被撼动。

但这并不意味着Nvidia在人工智能时代就可以高枕无忧。Nvidia 的软肋仍然在于其移动端——随着人工智能从云端逐渐走向边缘和终端,边缘和终端类的AI加速芯片或许是其他公司的机会。Nvidia之前推出的终端/边缘类产品并不算特别领先或成功,例如Jetson系列终端GPU的能效比并不领先,芯片架构也是沿用数年前的设计。我们认为,AI加速在终端的市场份额可能会占据总体AI芯片市场不小的份额,如果Nvidia无法抓住终端AI市场,那么其最终在整个AI市场的份额可能会被局限在云端数据中心。

推荐

    北京人都不知道,200公里外的曹妃甸现在竟然是这么的美
    北京人都不知道,200公里外的曹妃甸现在竟然是这么的美
    听说曹妃甸这里也是蓝天白云湖畔水秀,美不胜收,活脱一个苏州园林的写照。五月天的清晨,清风习习,凉凉爽爽的,走在曹妃甸湖畔,但见湖中碧水荡漾,清风习习,微波轻盈,岸边人行道游人如织,岸旁,翠竹婷立,绿树掩映,令人心况神怡。这些季节中,我最喜欢春天,更喜欢曹妃甸小湖旁的春天。当城市的眼睛一笑百媚生,间或填充波光、山色、霓虹灯以及如织的人流,树影巨大的黑漆阴影,也成为一种美。[详细]
    篮球晚报:勇士轻取鹈鹕获首胜 76人险胜老鹰取三连胜
    篮球晚报:勇士轻取鹈鹕获首胜 76人险胜老鹰取三连胜
    末节勇士保持良好手感,没有给鹈鹕留下任何机会。最终,6人得分上双的勇士在客场以134-123轻取鹈鹕,取得赛季首胜,同时送给鹈鹕4连败。nba常规赛继续进行,老鹰坐镇主场对阵76人,两队在前两场比赛中未尝败绩。最终马刺在主场险胜开拓者,迎来开赛三连胜。[详细]
    民国时期的设计竟如此惊艳!
    民国时期的设计竟如此惊艳!
    说起民国的广告设计大家印象最深的应该就是美人图搭配文字的设计同时将产品展现在大家的眼前今天micu特意搜集了一大波民国广告设计这其中包含商标、海报、以及字体的应用可以说相当齐全让我们一起来欣赏一下吧!民国海报设计民国广告招贴设计民国纸币设计民国商标设计民国美术字设计民国装饰字体设计[详细]
    联想个人云存储发布 用科技构建未来家庭数据中心
    联想个人云存储发布 用科技构建未来家庭数据中心
    手机、电脑等设备内存告急现象将一去不返,一台联想个人云存储即可容纳家庭中全部设备的数据,轻松搞定家庭海量数据的存储需求。联想个人云存储作为一款存于本地的智能存储产品,数据放在用户家中,用户完全不必担心重要内容被泄露,数据可控性更高。联想个人云存储人性化的地方除了使用简单,还具备智慧的数据管理能力。[详细]
    违规核销电话费、私车公养……河北通报3市11起违反八项规定案例
    违规核销电话费、私车公养……河北通报3市11起违反八项规定案例
    6月4日,河北省纪委监委网站通报了石家庄市、承德市、秦皇岛市共11起违反中央八项规定精神及“四风”问题典型案例,共有11人受到党纪政纪处分。其中,石家庄市通报3起违反中央八项规定精神典型问题,具体是:晋州市营里镇卫生院院长刘海涛超标准使用办公用房问题;高邑县开发区正科级干部郝振献报销烟酒招待费问题;石家庄市公安局交通管理局长安交警大队督察室主任张彦军违规使用公务用车问题。[详细]
    “他考上济大 我烤上地瓜”魔性烤地瓜广告火了
    “他考上济大 我烤上地瓜”魔性烤地瓜广告火了
    “你考上了山财,他考上了济大,我烤上了地瓜,烤地瓜,烤地瓜,又香又甜的烤地瓜。”近日,一段烤地瓜的视频被网友上传到网络后登上了热搜。记者还未走进店里,就听到了喇叭中播放的魔性叫卖声:“你考上了山财,他考上了济大,我烤上了地瓜……”。27日,前来购买烤地瓜的济南大学的美同学对记者说,她比较喜欢吃烤地瓜,经常来这家店。[详细]
    粗心市民将银行卡遗忘在ATM机,竟被盗刷2800元!
    粗心市民将银行卡遗忘在ATM机,竟被盗刷2800元!
    日前,韶关乐昌市公安局城北派出所侦破一宗盗窃案,嫌疑人因一时贪念,盗刷支取他人遗忘在atm机的银行卡内2800元,现已被公安机关刑事拘留。3月20日晚20时许,蔡先生在市区某银行atm机取款后,一时粗心把银行卡遗留在atm机。离开银行不久,蔡先生的手机收到了银行卡支出的短信提示,显示支出2800元。办案民警前往银行调取了监控视频,发现当时有一名男子紧跟在蔡先生身后。目前,郭某辉因涉嫌盗窃罪被公安机[详细]
    致公党中央十五届九次常委会在北京召开 万钢讲话
    致公党中央十五届九次常委会在北京召开 万钢讲话
    中新社北京11月8日电 中国致公党第十五届中央常务委员会第九次全体会议8日在北京召开。全国政协副主席、致公党中央主席万钢出席会议并讲话。会议由全国政协常委、副秘书长,致公党中央常务副主席蒋作君主持。万钢要求,致公党各级组织要全面贯彻中共十九届四中全会精神,发挥好新时代参政党作用。会议审议通过了《致公党中央关于学习贯彻中共十九届四中全会精神的决议》。[详细]
    34款可爱的钩针花朵,四季百搭,可以做出各种作品!附图解
    34款可爱的钩针花朵,四季百搭,可以做出各种作品!附图解
    而在钩针爱好者中,很多伙伴们都喜欢钩针花朵或者花片,作为各种装饰品点缀及拼出各种日常用品。今天小爱同学给大家整理很多钩针花朵图解分享大家。但是这些花朵,还是需要有一定基础的钩针针法,才可利用毛线钩针出渐变色的可爱小花。下面几十款钩针花朵图解,大家收藏好了。也可以自己动手钩件爱心作品,送给最美的人!最后,给大家整理一款花束组合图解。[详细]
    怀孕13周的B超检查,哪些指标显示宝宝的健康问题?注意这4个指标
    怀孕13周的B超检查,哪些指标显示宝宝的健康问题?注意这4个指标
    每次产检都有每次产检的意义,怀孕13周去做b超,是孕早期非常重要的一次检查,可以查到胎儿的一部分健康问题。胎儿的胎心率这时也是代表胎儿健康发育的一项指标。nt的临界值为3mm,国内某些医院使用的标准是2.5mm。如果nt值大于临界值,说明患有唐氏综合征的风险很高,下步一定注意做侵入性检查以及b超检查,进一步确认。总之,怀孕13周去做b超,是可以通过上述3-4个方面检查出肚子里的宝宝有什么健康问题的[详细]