英伟达GTC大会划重点!
1、Blackwell全家桶上线
2、老黄预览了英伟达下一代AI超级芯片——Vera Rubin。
3、每秒千万次计算!Nvidia发布两款个人AI超级计算机DGX Spark 与 DGX Station!
4、Nvidia推新Dynamo软件,计划将DeepSeek的AI推理速度提升30倍!
[1]Blackwell全家桶
一年一度的“AI春晚”,英伟达GTC大会盛大开幕。
今天上午,英伟达创始人兼CEO老黄,穿着他的标志性皮衣,进行了一场激情澎湃的演讲,首先带来的就是最强AI芯片——GB300! 也就是Blackwell Ultra,简单理解就是Blackwell的大内存版本。和去年发布的GB200相比,推理性能直接提升1.5倍!
还发布了GB300 NVL72机架、HGXB300 NVL16机架的系统方案,一个机架能像单个大型CPU一样运行。
[2]提前预告“核弹” GPU Rubin芯片
各位小伙伴是不是觉得 GB300就已经超级牛逼了!
别着急,除此之外,老黄直接借这个场子,预告了2026年的核弹芯片——Vera Rubin。还有更强的机柜Vera Rubin NVL144——72颗Vera CPU+144颗 Rubin GPU,采用288GB显存的HBM4芯片,显存带宽13TB/s,搭配第六代NVLink和CX9网卡。
这个产品有多强呢?FP4精度的推理算力达到了3.6ExaFLOPS,FP8精度的训练算力也达到了1.2ExaFlOPS,性能是Blackwell Ultra NVL72的3.3倍。
英伟达官方提供的Rubin Ultra NVL144和 NVL576参数
如果你觉得还不够,没关系,2027年还有更强的 Rubin Ultra NVL576机柜,FP4精度的推理和FP8精度的训练算力分别是15ExaFLOPS和5ExaFLOPS,14倍于Blackwell Ultra NVL72。并且提前公布Vera Rubin NVL144机架、Rubin Ultra NVL576机架性能,基于Rubin的AI工厂性能达到Hopper的900倍。
[3]个人超级计算机
老黄说:“这是这是人工智能时代的计算机。这就是计算机应该有的样子,这就是未来计算机的运行方式。我们现在有全系列企业级产品,从小型计算机到工作站计算机。”
首先,DGX Spark 让我们感受到了一种 “未来已来” 的震撼。
官方售价3000美元,大小和Mac Mini相当!英伟达官网已经可以预订了!
采用的是英伟达GB10芯片,能够提供每秒1000万亿次的AI运算,用于微调和推理最新AI模型。
其中,GB10采用了NVLink-C2C互连技术,提供CPU+GPU的相关内存模型,带宽是第五代PCIe的5倍。
真是贵有贵的道理哈哈~
至于第二款超级电脑,就说DGX Station。
就是采用GB300,也是首个采用这款芯片的AI电脑。
我们直接来看配置:
1、拥有784GB的内存空间
2、拥有英伟达的ConnectX-8超级网卡,支持高达800Gb/s的网络速度
3、拥有Nvidia的CUDA-X AI平台,可访问NIM微服务和AI Enterprise
老黄直言:“这就是PC应该有的样子。”
DGX Spark 与 DGX Station 的设计理念不仅仅是提供计算力,更是为企业和开发者提供了一种新的工作方式。在这个 AI 渗透生活的时代,能够在本地快速处理数据,减少延迟,显然是企业发展的一大助力。
[4]开源软件Dynamo 加速AI模型推理
刚刚看了硬件,下面这个是软件,老黄还是太全面了!
最重磅的当属NVIDIA Dynamo,一个用于加速AI模型推理的分布式推理服务库。
按照英伟达的说法,在NVIDIA Blackwell上使用Dynamo,可以让DeepSeek-R1 的吞吐量提升30倍!真是太疯狂了!
目前Dynamo已完全开源,在GitHub获取后即可将推理工作分配到多达1000个NVIDIA GPU芯片。
最后还给大家看一个小彩蛋——人形机器人小蓝!
我说英伟达,你别太全面了!
小蓝作为主题演讲的压轴嘉宾,摇头晃脑的向老黄撒娇,并且听从老黄的指令,乖乖的站到了他的旁边。
好了,这就是今天小编分享的全部内容啦,详情还是得看官方网站哦~