|
||||||
|
|
|
随着GB200 芯片在2024年的推出 释出,NVIDIA 把其GPU 的TDP(热功耗设计)推升至新的高度,单颗B200 来到了1,200W(液冷状况下);由两颗B200 加上一颗Grace CPU 组成的GB200 芯片组总TDP 则高达2,700W。
在NVL72/36 的设计架构下,每层Compute Tray 配备两组GB200,这意味着在1-2U 的伺服器高度内,需承载与过去H100 HGX 系统相近的总TDP。为了满足这样的需求,采用散热效率更高的液冷技术成为必要选择,不仅能有效负担散热需求,同时也能改善整体数据中心的能源使用效能。
而不论是使用L2A(Liquid-to-air)或L2L(Liquid-to-liquid)的散热解方,都会使用到Cold plate(液冷板)、CDU(Coolant distribution unit,冷却液分配单元)、Manifold(冷却水歧管)和UQD(Universal Quick Disconnect,冷却液快接头)四大零组件,由这些零组件将废热从芯片表面带离后,L2A 会再透过风扇背门和热交换器、L2L 则透过室外冰水机使冷却液降温并重新再回到系统进行循环。
![]()
根据产业调研结果,在GB200 NVL72 / 36 中,每层Compute Tray 在CPU 和GPU 上方都会使用到一片液冷板,并在机壳后方放置6~10 组的散热风扇;Switch Tray 部分则在2 颗NVLink Switch ASIC 各使用一片液冷板,并放置6 组的散热风扇;整机柜部分,会使用到一对冷却水歧管、一组搭配柜式液冷背门的CDU;另外在包含Manifold、液冷板部分都会使用到UQD。其BoM 表拆解如下:
过以上拆解和计算,GB200 NVL72 / 36 散热模组总组成价值分别落在约10 万美元和7 万美元(其中不包含针对液冷系统改变的基础建设和管线重设),其中四大零组件的组成价值即占90% 以上,显示有出货此四大零组件的业者将能最大程度受惠于液冷解方大量采用之趋势。
![]()
SemiAnalysis 称,B300 将在2025年三月在GTC大会发布,25年Q3出货。Nvidia 的 B300 系列处理器采用了经过大幅调整的设计,仍将采用台积电的 4NP 制造工艺(针对 Nvidia 进行优化的 4nm 级节点,性能增强)。 在芯片侧方面,GB300 超级芯片将基于更新的 B300 GPU,拥有更强的 FP4 性能。该 GPU 功耗将从 B200 的 1000W 进一步提升至 1400W,达到初代 B100 的两倍;同时 HBM 内存规格也将升级共计 288GB 的 8 堆栈 12Hi HBM3E。
此外 B300 GPU 有望采用插槽设计以提升良率、简化售后维护;而在 Grace CPU 部分则将采用 LPCAMM 内存条代替现有的板载 LPDDR5。 互联方面,英伟达将在 GB300 服务器上导入新一代 ConnectX-8 SuperNIC 和理论带宽翻倍的 1.6Tbps 光模块。
液冷方面,新一代 GB300 AI 服务器将采用“Blackwell Ultra”架构,由于性能显著提升,导致功耗也大幅增加,将取消风扇风冷版本因此将采用全水冷散热方案,全面采用液冷系统并以「液对液」方式为主,主要原因是风扇容易故障且维修成本较高,另外补充一下GB300 的其他规格,CPU 及GPU 将改用插槽(Socket)设计,快接头用量有望倍增,同时NVL72 机柜将加入BBU(电池备援电力模组)与超级电容(Capacitor Tray)。液冷市场参与大厂方面,除了NVIDIA 为主要的参与者,从云端业者自行研发高阶AI ASIC 来看,主要以Google 为最积极采用液冷方案的业者,同时也因为液冷散热商机庞大、散热零件单价(ASP)与毛利率皆较风冷来的高,利好液冷赛道。
本次英伟达GB300全液冷方案也推高了服务器成本,预计 GB300 服务器的顶配价格将远超目前约 300 万美元(当前约 2196.6 万元人民币)的 GB200 NVL72 服务器。 部分素材源自网络,版权归原作者所有。分享目的仅为行业信息传递与交流,不代表本公众号立场和证实其真实性与否。如有不适,请联系我们及时处理。欢迎参与投稿分享!
关于我们 北京汉深流体技术有限公司 是丹佛斯中国数据中心签约代理商。产品包括FD83全流量双联锁液冷快换;液冷通用快速接头UQD & UQDB;OCP ORV3盲插快换接头BMQC;EHW194 EPDM液冷软管、电磁阀、压力和温度传感器。在国家数字经济、东数西算、双碳、新基建战略的交汇点,公司聚焦组建高素质、经验丰富的液冷工程师团队,为客户提供卓越的工程设计和强大的客户服务。 公司产品涵盖:丹佛斯液冷流体连接器、EPDM软管、电磁阀、压力和温度传感器及Manifold。 - 针对机架式服务器中Manifold/节点、CDU/主回路等应用场景,提供不同口径及锁紧方式的手动和全自动快速连接器。
|
|