新闻资讯 NEWS

老黄携最强AI芯片GB300闪亮登场,将DeepSeek推理性能提升30倍!
来源: | 作者:点动科技 | 发布时间: 2025-03-24 | 158 次浏览 | 分享到:

英伟达GTC大会划重点!


1、Blackwell全家桶上线

2、老黄预览了英伟达下一代AI超级芯片——Vera Rubin。

3、每秒千万次计算!Nvidia发布两款个人AI超级计算机DGX Spark 与 DGX Station!

4、Nvidia推新Dynamo软件,计划将DeepSeek的AI推理速度提升30倍!


[1]Blackwell全家桶


一年一度的“AI春晚”,英伟达GTC大会盛大开幕。


今天上午,英伟达创始人兼CEO老黄,穿着他的标志性皮衣,进行了一场激情澎湃的演讲,首先带来的就是最强AI芯片——GB300!  也就是Blackwell Ultra,简单理解就是Blackwell的大内存版本。和去年发布的GB200相比,推理性能直接提升1.5倍!


还发布了GB300 NVL72机架、HGXB300 NVL16机架的系统方案,一个机架能像单个大型CPU一样运行。


[2]提前预告“核弹” GPU Rubin芯片


各位小伙伴是不是觉得 GB300就已经超级牛逼了!


别着急,除此之外,老黄直接借这个场子,预告了2026年的核弹芯片——Vera Rubin。还有更强的机柜Vera Rubin NVL144——72颗Vera CPU+144颗 Rubin GPU,采用288GB显存的HBM4芯片,显存带宽13TB/s,搭配第六代NVLink和CX9网卡。


这个产品有多强呢?FP4精度的推理算力达到了3.6ExaFLOPS,FP8精度的训练算力也达到了1.2ExaFlOPS,性能是Blackwell Ultra NVL72的3.3倍。


英伟达官方提供的Rubin Ultra NVL144和 NVL576参数


如果你觉得还不够,没关系,2027年还有更强的 Rubin Ultra NVL576机柜,FP4精度的推理和FP8精度的训练算力分别是15ExaFLOPS和5ExaFLOPS,14倍于Blackwell Ultra NVL72。并且提前公布Vera Rubin NVL144机架、Rubin Ultra NVL576机架性能,基于Rubin的AI工厂性能达到Hopper的900倍。


[3]个人超级计算机


老黄说:“这是这是人工智能时代的计算机。这就是计算机应该有的样子,这就是未来计算机的运行方式。我们现在有全系列企业级产品,从小型计算机到工作站计算机。”


首先,DGX Spark 让我们感受到了一种 “未来已来” 的震撼。


官方售价3000美元,大小和Mac Mini相当!英伟达官网已经可以预订了!


采用的是英伟达GB10芯片,能够提供每秒1000万亿次的AI运算,用于微调和推理最新AI模型。


其中,GB10采用了NVLink-C2C互连技术,提供CPU+GPU的相关内存模型,带宽是第五代PCIe的5倍。


真是贵有贵的道理哈哈~


至于第二款超级电脑,就说DGX Station。


就是采用GB300,也是首个采用这款芯片的AI电脑。


我们直接来看配置:


1、拥有784GB的内存空间


2、拥有英伟达的ConnectX-8超级网卡,支持高达800Gb/s的网络速度


3、拥有Nvidia的CUDA-X AI平台,可访问NIM微服务和AI Enterprise


老黄直言:“这就是PC应该有的样子。”


DGX Spark 与 DGX Station 的设计理念不仅仅是提供计算力,更是为企业和开发者提供了一种新的工作方式。在这个 AI 渗透生活的时代,能够在本地快速处理数据,减少延迟,显然是企业发展的一大助力。


[4]开源软件Dynamo 加速AI模型推理


刚刚看了硬件,下面这个是软件,老黄还是太全面了!


最重磅的当属NVIDIA Dynamo,一个用于加速AI模型推理的分布式推理服务库。


按照英伟达的说法,在NVIDIA Blackwell上使用Dynamo,可以让DeepSeek-R1 的吞吐量提升30倍!真是太疯狂了!


目前Dynamo已完全开源,在GitHub获取后即可将推理工作分配到多达1000个NVIDIA GPU芯片。


最后还给大家看一个小彩蛋——人形机器人小蓝!


我说英伟达,你别太全面了!


小蓝作为主题演讲的压轴嘉宾,摇头晃脑的向老黄撒娇,并且听从老黄的指令,乖乖的站到了他的旁边。



好了,这就是今天小编分享的全部内容啦,详情还是得看官方网站哦~