橘子百科-橘子都知道橘子百科-橘子都知道

正、异、新,正异新的区分

正、异、新,正异新的区分 “AI春晚”英伟达放大招:亮算力“杀器”、助游戏“捏人”;黄仁勋帮算账:GPU多买多省

  “AI热潮(cháo)”最大赢家之一、英(yīng)伟达背后的那个身(shēn)穿(chuān)黑色皮衣的(de)男(nán)人又来了。

  前脚才交(jiāo)出亮(liàng)眼业绩狂拉股(gǔ)价,英伟达CEO黄(huáng)仁勋后脚就在昨日的COMPUTEX大会(huì)上宣布,“我们(men)已到达生成式AI引爆点。从此,全世界的(de)每(měi)个角落,都会有(yǒu)计(jì)算需求。”

  如今(jīn)英(yīng)伟达掌握着全(quán)球多家科技公司“算力命脉”,而在(zài)这场大会上,黄仁勋激情演(yǎn)讲2个小时,甩出(chū)了多项重(zhòng)磅新发布,包括算力“杀器(qì)”DGX GH200超级(jí)计算机、针(zhēn)对游戏的ACE代工服务、MGX服务器规范等内容。

  算力“杀器”:DGX GH200超级计算机+GH200超(chāo)级芯(xīn)片(piàn)

  先看“集成了(le)英(yīng)伟达最先进加速计(jì)算和(hé)网络技术”的DGX GH200人工智能超级计算机

  这(zhè)款超算专为(wèi)大规模生成式(shì)AI的负载所(suǒ)设计,由256块GH200超级芯(xīn)片组成(chéng),拥有1 exaflop超凡AI性能、144TB内存(是英伟达目前(qián)DGX A100系统(tǒng)的近500倍(bèi))、150英里光纤、2000多个(gè)风(fēng)扇。

  DGX GH200重达40000磅(约(yuē)合18143千克),堪比四只成年大(dà)象的体重(zhòng)。

  预计(jì)DGX GH200将于今年年底投(tóu)入问世,英伟(wěi)达暂未公布价(jià)格,而(ér)谷歌云、Meta与微软将是首批用户

  同时,英伟达(dá)也正在打造自家基于DGX GH200的(de)大型AI超级计算机NVIDIA Helios,以支持其(qí)研究和开(kāi)发团队的工作。其中采用4个DGX GH200系统、1024颗Grace Hopper超级芯片,每个(gè)都将(jiāng)与英伟达Quantum-2 InfiniBand网(wǎng)络连接,带宽高达400Gb/s,将(jiāng)于今年年底上线。

  值(zhí)得(dé)一提的是,黄仁勋透露,DGX GH200集(jí)成(chéng)的GH200 Grace Hopper超级芯片(piàn)已(yǐ)进(jìn)入全面生产

  “拉踩”CPU:成本(běn)、功耗、处(chù)理数据量不如GPU

  在(zài)本次大(dà)会(huì)上,黄仁勋还“拉踩”了一波CPU。他从功(gōng)耗、处理数据量等(děng)方面,指出使用(yòng)GPU胜过CPU。

  举(jǔ)例来说,花费1000万美(měi)元,可以建设一(yī)个(gè)有(yǒu)960颗CPU的数据中(zhōng)心,其可处理1X LMM(大语言模型)数据(jù)量,需要11GWh功耗;

  同样成本下,也可(kě)以建设一个(gè)有48个(gè)GPU的数据中(zhōng)心,其(qí)可处理44X LLM数据量,仅(jǐn)需要3.2GWh功耗。

  若(ruò)只想处理1X LMM数据量,则(zé)只(zhǐ)需40万美元(yuán),便(biàn)可拥有一个(gè)搭载2个(gè)GPU、功耗仅0.13GWh的(de)数据中心(xīn)。

  “买越(yuè)多,省(shěng)越多(The more you buy, the more you save)。”黄仁(rén)勋再(zài)次表(biǎo)示(shì)。

  同时,他也(yě)列出了数据中心成(chéng)本公(gōng)式:数据中心总持有成本=f[成本(芯片、系统、硬件生态系统)、吞吐(tǔ)量(liàng)(GPU、Algo软(ruǎn)件(jiàn)、网络、系统软件、软件生态系(xì)统)、使用率(Algo Lib, 软(ruǎn)件(jiàn)生(shēng)态(tài)系(xì)统)、采购(gòu)运(yùn)营、生命(mìng)周(zhōu)期最(zuì)佳化、电力]

  ACE代(dài)工(gōng)服务(wù):用AI激活NPC生(shēng)命

  游戏(xì)一直是(shì)备受关(guān)注的(de)一大AI应用落地领域(yù)。英伟达(dá)也在大会上宣布(bù),推出面向(xiàng)游(yóu)戏的定(dìng)制(zhì)AI模型代工服务(wù)NVIDIA Avatar Cloud Engine(AC正、异、新,正异新的区分E)

  它能赋予非玩家角色(NPC)更智能且不断进(jìn)化的对(duì)话(huà)技能(néng),中(zhōng)间件(jiàn)、工(gōng)具(jù)和游戏开发(fā)者可使用(yòng)它来构(gòu)建和部署定制的语(yǔ)音、对话(huà)和动画(huà)AI模型(xíng)

  其中包括(kuò):英伟(wěi)达(dá)NeMo,使用专有数据构建、定制和部署语言模型(xíng);英伟达Riva,用于自(zì)动语音(yīn)识别和文本转语音实现实(shí)时语(yǔ)音(yīn)对话(huà);英伟达Omniverse Audio2Face,用于即时(shí)创建(jiàn)游戏角(jiǎo)色表情动画,以匹配(pèi)任何语音轨道(dào)。

  开发人(rén)员可(kě)选择(zé)集(jí)成整(zhěng)个(gè)NVIDIA ACE for Games解(jiě)决方(fāng)案,也(yě)可仅使用需要的组件。

  新参考工(gōng)作(zuò)流(liú)程:帮(bāng)助建(jiàn)设(shè)数字化智能工厂(chǎng)

  黄仁勋(xūn)表示,全(quán)球电子制造商正在使用一种全新的综合(hé)参(cān)考工作(zuò)流程(chéng)推进工业数(shù)字化(huà)工作(zuò),该工作(zuò)流程结合了英伟达用于生成式AI、3D协(xié)作、仿真和(hé)自主机器的技(jì)术,包括:

  英伟达Omniverse,其连(lián)接了顶级(jí)计算机辅助设计应用以及生成式(shì)AI的API和前沿(yán)框架;用于模拟和测(cè)试机器人(rén)的(de)英伟(wěi)达(dá)Isaac Sim应用(yòng)程序(xù);英伟(wěi)达Metropolis视觉AI框架,用于自动光学检测(cè)。

  同时,黄仁(rén)勋现场展示了(le)一个完全(quán)数字化(huà)的智能工厂的演示。

  目前(qián)富士康工业互联(lián)网、宜鼎国(guó)际、和硕(shuò)、广达和纬创正(zhèng)在使用这一参考工作流程,具(jù)体用例包括(kuò)电路板质保检(jiǎn)测(cè)点(diǎn)自动化、光(guāng)学检测自动化、建设虚拟工厂、模拟协(xié)作机器人、构建及运营数字孪(luán)生(shēng)等。

  MGX服务器(qì)规(guī)范:快速高效构建百余种服(fú)务器配(pèi)置

  英伟达发布(bù)NVIDIA MGX服(fú)务器规范,为系统制(zhì)造(zào)商提供模块化参考架构(gòu),满足各种(zhǒng)规(guī)模的(de)数正、异、新,正异新的区分(shù)据中心需求。系统制造商可使用它快速且经济高效地构建100多(duō)种服(fú)务(wù)器(qì)配置(zhì),以适应广泛(fàn)的(de)AI、HPC及NVIDIA Omniverse应用。

  MGX支持(chí)英(yīng)伟达(dá)全系列GPU、CPU、DPU和网络(luò)适配器、各(gè)种x86、完(wán)整软件堆栈及Arm处理器,还可集成到云和企业数据中心(xīn)中。

  华硕(shuò)、和(hé)硕、QCT、超微(Supermicro)等都将采(cǎi)用MGX构建下一代加(jiā)速(sù)计算机,可将开发(fā)成本削减多(duō)达3/4,并将(jiāng)开(kāi)发时间缩(suō)短2/3至(zhì)仅(jǐn)需6个月

  其中,QCT和超微基于MGX的设(shè)计(jì)将于8月面世。超微(wēi)昨日公(gōng)布的ARS-221GL-NR系统将采用Grace CPU,而QCT的S74G-2U系统将采用(yòng)Grace Hopper。

  推(tuī)出Spectrum-X网络平台 构(gòu)建(jiàn)超大规模生成式AI超级计算(suàn)机Israel-1

  另(lìng)外,黄仁勋宣布推(tuī)出NVIDIA Spectrum-X网络平台,旨在提(tí)高基于以太网的AI云的(de)性能和效率。

  相比传统以太网结构(gòu),Spectrum-X可实现1.7倍(bèi)的整体AI性能(néng)和(hé)能效(xiào)提(tí)升,并具有(yǒu)高度(dù)通用性,可用于各种AI应用。它使用(yòng)完全基(jī)于标准的以太网,并可(kě)与基于以(yǐ)太(tài)网的(de)堆栈互操(cāo)作。该平台支持(chí)256个200Gb/s端口,通过(guò)单个交换(huàn)机连(lián)接(jiē),或在两层leaf-spine拓扑中提供16000个端口,以(yǐ)支(zhī)持AI云增长和(hé)扩展,在(zài)保持性(xìng)能的同时最大限度减(jiǎn)少网络延迟。

  全球领先云计算提供商(shāng)正在采(cǎi)用Spectrum-X平台扩展生成(chéng)式(shì)AI服务,而Spectrum-X、Spectrum-4交换机、BlueField-3 DPU等已在戴尔、联想等系统制造商处提供(gōng)。

  此外,作为Spectrum-X参考设计的蓝图和测(cè)试平(píng)台,英(yīng)伟(wěi)达(dá)正构建一(yī)台超大规(guī)模生成式(shì)AI超(chāo)级计算机Israel-1。这台AI超算价值数亿美元,将采用戴(dài)尔PowerEdge XE9680服务器、英伟(wěi)达HGX H100超级(jí)计算平(píng)台、内(nèi)置BlueField-3 DPU和Spectrum-4交换(huàn)机的Spectrum-X平台。

  结语

  “40年(nián)来(lái),我们创造了PC、互(hù)联网、移动、云,现在是人(rén)工(gōng)智能时代。你会创造什(shén)么?不管是什(shén)么(me),都要(yào)像我们(men)一(yī)样追赶它。要奔跑,不(bù)要(yào)走。要么为了(le)食物奔跑,要么(me)作为食物奔跑。”

  在5月(yuè)27日的台湾大学发表了毕(bì)业(yè)典礼演讲上,黄仁勋再次强(qiáng)调了掌(zhǎng)握AI技术的重要性:很多人担(dān)心,AI会抢走(zǒu)自己的工作。但真正(zhèng)会(huì)抢走你饭(fàn)碗的,是掌握了(le)AI技术的人。

  他表(biǎo)示,从(cóng)各方(fāng)面来看(kàn),AI的兴盛是(shì)计算机产业的再(zài)生契(qì)机。在下个(gè)十年,我(wǒ)们的产业将使(shǐ)用(yòng)新型AI电脑(nǎo),取代价值万亿美元(yuán)的传统电脑(nǎo)。

  而(ér)从(cóng)昨日大会上(shàng)黄仁(rén)勋的展示(shì)中,人工智能时代的(de)未来轮廓似乎已逐渐浮现。

未经允许不得转载:橘子百科-橘子都知道 正、异、新,正异新的区分

评论

5+2=