|
||||||
|
|
|
2025年10月13-16日Open Compute Project~2025 OCP 峰会在美国加利福尼亚州圣何塞顺利召开。在OCP全球峰会上,多家科技企业展示了旨在提升AI算力、优化数据中心能效和突破内存瓶颈的前沿产品与技术。OCP大会,基本上大型的CSP和相关硬件供应链的企业都会来到这里共探未来,源于如何匹配对AI高速发展去配套供应,在以太网和IB网,scaleup 和scale out如何去下一步技术迭代,这一个大会都展露出来了相关的方向,最重要的就是一个叫ESUN的:以太网纵向扩展网络。由于之前各芯片厂或者网络互联都是不通融的,这个工程可以有助于解决跨加速AI基础设施的纵向扩展连接领域。等于就是把闭环的一个生态,把他通过多方协作,去走向共通,这对于整个AI协同发展都是很有利的。包括怎么去看待下一代类似英伟达Rubin架构的产品机会,甚至是看到Rubin ultra的,都有所讨论。 2025年的OCP全球峰会于10月13日至16日在美国加州圣何塞举行,并首次扩展为四天会议。 峰会的主题确定为“ 引领AI的未来 ”(Leading the Future of AI),凸显了OCP社区多年来在 开放性、效率、可持续性和可扩展性 方面的协作成果,旨在共同塑造面向人工智能时代的数据中心未来。 随AI算力需求暴增,全球云端服务商与供应链齐聚,展开一场基础设施的「肌肉秀」。台厂阵容空前,包括光宝、台达电、建准、双鸿、纬颖、云达等均将大举参展,展示从机柜电力、液冷散热到整机系统的全方位实力。 由Meta主导的OCP高峰会被视为AI伺服器产业风向球,今年主题为「Leading the Future of AI」,聚焦AI资料中心的开放架构、永续设计与高效运算,议程横跨逾200场简报、26个分组会议,透过「AI开放系统策略倡议」推动AI资料中心标准化与模组化。从兆瓦级机柜、高压直流配电,到液体冷却、两相侧箱冷却及固态风扇等新兴技术,完整揭示AI运算时代能源与热管理的创新方向。 以电源为例,光宝科将展示最新兆瓦级资料中心方案,主打高效率电力转换与智慧能耗管理,并提出绿色云端与AI永续发展构想;散热方面,双鸿推出液冷整体解决方案,CDU(冷却分配装置)亦有液对气、液对液2种方案,及自动补液机器人,建准则以模组化液冷系统为核心,呼应AI模型规模化带来的高热密度挑战,展现台厂在节能与系统稳定性上的技术深度。 此外,AI运算规模化同样推动记忆体与网路架构革新,OCP今年特别关注可组合记忆体系统与CXL记忆体池化应用,透过动态压缩与资源共享提升效能;同时推进开放软体与精准时间同步专案,确保AI丛集间超低延迟运算效能,为新世代资料中心架构铺路。 据悉,今年OCP共有27家企业砸重金入列最高等级「钻石级」赞助,包括双鸿、光宝科、台达电、鸿佰、英业达、云达、纬创及纬颖等;另有联发科、神达、和硕、明泰、永擎、华硕、微星、康舒、仁宝、技嘉、建准、启碁等入列其他赞助名单。台厂今年参与OCP规模创歷年之最,横跨伺服器整机、电源、散热与网通等多领域,凸显台湾供应链AI基础设施布局关键地位。
2025年的OCP全球峰会到底展示那些新技术 下面这个表格整理了本次峰会中部分参展企业的最新产品和解决方案,你可以快速了解核心信息。
Astera Labs:智能连接的“神经网络” Astera Labs作为AI基础设施连接领域的领导者,其展示凸显了互联技术在规模化AI中的核心地位。 产品细节: Aries PCIe/CXL 智能重定时器:不仅保障PCIe 5.0/6.0信号完整性,更集成了CXL 2.0/3.0**协议支持,为GPU和内存扩展池化提供底层连接。 Leo CXL 内存控制器:专为内存池化和扩展设计的控制器,允许服务器动态、灵活地访问共享内存资源,突破单机内存容量限制。 Taurus Ethernet 智能网卡:针对AI集群的RoCEv2优化,实现高带宽、低延迟的GPU间通信。 核心价值:Astera Labs的整套方案致力于将AI集群从“服务器级”计算推向“机架级”计算。通过解耦CPU、GPU和内存,并利用开放标准进行高速互联,它使得整个机架可以像一个庞大的计算资源池一样被统一调度和管理。 MiTAC Computing (神雲科技):从硬件到机架的全局方案 神雲科技的展示强调了“机架即计算机”的理念,提供了从计算、互联到散热的完整解决方案。 OCP ORv3 液冷机柜详解: 集成高效电源:支持最高至24kW的机柜功率密度,为高功耗GPU集群供电。 CDU (冷却分配单元):机柜集成了CDU,支持冷板式液冷,可将冷却液直接送至GPU和CPU等高发热元件,相比风冷节能30%-40%。 开放固件:全面采用OpenBMC,提供基于红鱼的开放管理框架,实现机柜内所有设备的统一、自动化运维。 AI/HPC 服务器: G4826Z5 液冷GPU服务器:这是一款高密度AI服务器,支持8个液冷GPU加速卡(如NVIDIA Blackwell系列),并设计了优化的流道和歧管,确保冷却效率。 XCENA & Compal:突破“内存墙”的CXL实践 内存瓶颈是制约AI模型规模和效率的关键。这两家公司的展示揭示了CXL技术的不同应用路径。 XCENA的 MX1 计算内存单元: 架构创新:MX1并非简单的内存扩展卡,而是一个内置了专用处理器的“计算内存”单元。它可以在内存内部直接执行特定的AI推理操作(如嵌入层、推荐系统推理),将计算任务“卸载”到内存侧,从而大幅减少数据在CPU/GPU和内存之间的搬运,降低延迟和功耗。 软件生态:配套的 XFLARE 软件库 提供了标准的API,使开发者能够轻松地将计算任务映射到MX1上。 Compal (仁宝电脑) 的 CXL 与 RDMA 内存池化: 技术融合:仁宝的方案将CXL 和 RDMA over Ethernet技术结合。CXL用于机箱内的内存扩展,而RDMA则用于实现跨服务器的内存池化。这意味着一台服务器可以像使用本地内存一样,极低延迟地访问网络中另一台服务器的空闲内存。 应用场景:非常适合内存需求波动大的业务,如云服务、大数据分析,可以极大提升内存资源的利用率和分配的灵活性。 纬颖 (Wiwynn) & 和硕 (Pegatron):先进散热的实战化 随着GPU功率突破千瓦,液冷从“前沿技术”变为“必备技术”。 纬颖 (Wiwynn) 的直接液冷 (DLC) 解决方案: 针对产品:主要配套其展示的 NVIDIA GB300 NVL72等顶级AI服务器。这些系统功率密度极高,传统风冷已无法满足散热需求。 技术特点:DLC通过安装在GPU/CPU上的冷板,让冷却液直接与芯片表面进行热交换,散热效率远高于风冷。纬颖的方案已经实现了量产化,并与机柜级CDU无缝集成。 和硕 (Pegatron) 的多元平台液冷支持:和硕展示了为 NVIDIA GB300/B300 和 AMD Instinct MI400系列平台设计的液冷解决方案。这表明液冷技术正在成为所有主流AI加速器平台的通用标准。 ZeroPoint Technologies & Cerabyte:底层技术的颠覆性创新 这些公司的技术虽然距离大规模应用稍远,但代表了未来的发展方向。 ZeroPoint Technologies 的 CXL 内存硬件压缩: 原理:通过专有的硬件IP,在CXL内存层级对数据进行实时、无损的压缩和解压缩。 效益:可以有效将内存可用容量提升2倍或更多,同时因为减少了实际的数据读写量,也降低了内存访问的功耗。这对于成本敏感且功耗巨大的AI训练集群来说,能显著降低TCO。 Cerabyte 的陶瓷玻璃介质存储: 技术原理:使用激光在特殊的陶瓷玻璃介质上刻写和读取数据。这种介质具有**极高的化学和物理稳定性**,可抵御极端温度、辐射和电磁脉冲。 核心优势: 近乎永久的数据保存:数据寿命预计可达数千年。 极高的存储密度:单位面积存储数据量远超传统硬盘和磁带。 极低的能耗:只有在读写时消耗能量,闲置时为零能耗。 定位:目标是取代目前的冷存储/磁带库,成为未来海量数据长期归档的终极解决方案,极具可持续性价值。 在2025年OCP全球峰会上,液冷技术是当之无愧的焦点。为了应对AI芯片惊人的功率和密度,厂商们展示了从服务器到机柜的全方位散热解决方案。 下面这个表格汇总了此次展会上三家主要厂商带来的关键液冷创新产品,你可以快速了解其核心特点。
除了表格中的概览,这些创新产品背后还有一些更深入的技术细节和设计理念: 机柜级液冷已成主流 :MiTAC的ORv3机柜展示了从服务器到集群的完整液冷路径。其集成的CoolIT 200kW CDU (冷却液分配单元) 能应对200kW级别的散热挑战,为机柜内多达14台高密度服务器保驾护航。这种模块化设计为数据中心提供了从单机到集群、从风冷到液冷的清晰升级路径。 Wiwynn:面向未来的冷却技术:Wiwynn的冷板设计极具前瞻性。 双面冷板的创新在于它能同时为主要AI芯片和关键的垂直供电芯片散热,解决了系统内其他高热流密度元件的散热瓶颈。 两相冷板则利用了液体在沸腾(相变)时吸收大量热量的原理,散热效率极高。其3D打印的吸液鳍片结构不仅能提升效能,还增加了可靠性,减少了因泄漏导致宕机的风险。 300kW AALC侧车是一个非常实用的解决方案,它让企业可以在不改变现有风冷数据中心架构的前提下,直接引入高功耗的液冷AI机柜,大大降低了部署门槛。 Compal: 兼顾灵活性与能效:Compal展示了两种不同的液冷路径。直接液冷针对需要高性能的ORv3标准机柜环境,而结构更紧凑的浸没式冷却则提供了另一种高效选择。这两种方案都致力于将数据中心的局部PUE (pPUE) 控制在1.1以下,这对于降低运营成本和实现可持续目标至关重要。 从以上展示可以看出,2025年OCP峰会主要呈现出以下几个技术趋势: AI集群化与开放标准 :行业不再仅仅追求单机性能,而是更关注如何通过 UALink、CXL、OpenBMC 等开放标准,将整个机柜整合为统一的、可灵活扩展的计算平台(AI Infrastructure 2.0),以应对大规模的AI工作负载。 液冷散热成为标配 :随着GPU功率密度不断提升, 直接液冷 和 浸没式液冷 等技术从可选方案变为高密度数据中心的必然选择,旨在保证性能的同时,显著提升能效。 内存架构创新:CXL技术 是本届展会的焦点之一,其应用从单纯的内存容量扩展,延伸到 内存池化、计算卸载和硬件压缩 等领域,旨在打破“内存墙”,降低总体拥有成本。 可持续性与开源管理 :除了性能,企业的展示也强调 节能(如液冷) 和 可持续性(如Cerabyte的永久存储) 。同时,OpenBMC、Open Platform Firmware等开源固件技术也受到重视,为数据中心提供更透明、安全的底层管理方案。 开放计算项目(Open Compute Project,简称OCP)由美国社交媒体公司Facebook于2011年联合英特尔(Intel)、Rackspace、高盛(Goldman Sachs)和Arista Networks等公司共同发起成立,是一个非营利的开源硬件社区。其初衷和使命在于将开源、开放协作的理念引入数据中心硬件设计领域,通过分享数据中心的设计规范和硬件蓝图来促进创新,实现大规模可扩展计算,并提供高能效的服务器、存储设备及数据中心基础设施设计,从而降低数据中心的成本和环境影响。简单来说,OCP希望像开源软件那样开放硬件
关于我们 北京汉深流体技术有限公司 是丹佛斯中国数据中心签约代理商。产品包括FD83全流量双联锁液冷快换接头(互锁球阀);液冷通用快速接头UQD & UQDB;OCP ORV3盲插快换接头BMQC;EHW194 EPDM液冷软管、电磁阀、压力和温度传感器。在人工智能AI、国家数字经济、东数西算、双碳、新基建战略的交汇点,公司聚焦组建高素质、经验丰富的液冷工程师团队,为客户提供卓越的工程设计和强大的客户服务,支持全球范围内的大批量交付。 公司产品涵盖:丹佛斯液冷流体连接器、EPDM软管、电磁阀、压力和温度传感器及Manifold。 - 针对机架式服务器中Manifold/节点、CDU/主回路等应用场景,提供不同口径及锁紧方式的手动和全自动快速连接器。
About Us Beijing Hansen Fluid Technology Co., Ltd. is an authorized distributor of Danfoss China, specializing in the data center industry. Our product portfolio includes Danfoss FD83 full-flow double-interlock liquid cooling quick-disconnect couplings (equipped with interlocking ball valves); universal liquid cooling quick-disconnect couplings UQD & UQDB; OCP ORV3 blind-mate quick-disconnect couplings BMQC; EHW194 EPDM liquid cooling hoses; solenoid valves; and pressure/temperature sensors. Amid the convergence of strategic trends such as artificial intelligence (AI), China’s national digital economy, the “Eastern Data and Western Computing” initiative, the “dual carbon” goals, and new infrastructure development, we are committed to building a high-caliber, experienced team of liquid cooling engineers. We deliver exceptional engineering design, robust customer service, and support global large-scale deployment. Products: Danfoss liquid cooling fluid connectors, EPDM hoses, solenoid valves, pressure/temperature sensors, and manifolds. - We offer manual and fully automatic quick-disconnect couplings in various calibers and locking mechanisms, suitable for scenarios such as Manifold/Node and CDU/Main Circuit in rack-mounted servers.
|
|