功耗墙倒逼散热革命,液冷从可选项变为必选项
单机柜功率密度的陡增,正在改写数据中心散热的底层逻辑。过去十年,通用服务器机柜功率通常在5-8千瓦,风冷系统完全能够覆盖。但随着GPU集群规模动辄上万卡,单机柜功率轻松突破30千瓦甚至更高,传统精密空调已经无法在有限空间内带走如此密集的热量。超算中心和智算中心不得不直面一个现实:继续沿用风冷,要么大幅降低部署密度,要么承受芯片降频带来的算力损失,两者在商业上都难以接受。
这一物理极限催生了液冷技术的刚性需求。液体导热系数和比热容远高于空气,直接带走热量的效率比间接冷却高出数十倍。业界最初将液冷看作一个锦上添花的高端选项,如今,它正迅速变成高密度算力部署的标配。无论是新建的超算中心,还是传统数据中心改造项目,制冷方案的前期论证几乎都围绕冷板式、浸没式或喷淋式液冷展开,风冷退居辅助角色。
政策端也在同步加码能效约束。国内多地已对新建大型数据中心的PUE值设定1.25甚至更低的红线,而传统风冷方案很难稳定控制在1.4以下。液冷技术则能将PUE压到1.1附近,天然贴合监管导向。算力需求和节能指标双重压力下,制冷不再只是一项配套工程,它开始实质性地影响算力集群的总体拥有成本和交付节奏。
从商业可行性看,液冷系统初期投入明显高于风冷,但若将土地利用率、运维成本和芯片全速运行带来的算力溢价一并纳入,液冷方案在全生命周期内的综合成本已具备竞争力。这种经济性拐点的出现,使得超算制冷从一个相对小众的垂直领域,跃升为产业链上下游共同押注的确定性增量市场。
当前,超算设备制冷的讨论语境已经不再是“要不要用液冷”,而是“用哪种液冷方案、谁来落地、供应链如何构建”。这也意味着,整个制冷产业链的技术范式正在发生不可逆的转移。
冷板与浸没路线对垒,技术话语权之争隐现
冷板式液冷与浸没式液冷两条主流技术路线的竞合,正在定义超算制冷产业的未来走向。冷板式液冷通过贴在芯片表面的冷板组件将热量带走,服务器内部其余部件仍依赖少量风冷,改造相对轻量,与现有机房的兼容度更高。当下已部署的液冷系统中,冷板方案占据绝对份额,其供应链成熟度和运维经验也更丰富。
浸没式液冷则是将服务器直接浸泡在绝缘冷却液中,彻底抛弃风扇和空调。它的散热效率更高,PUE表现更极致,且能大幅降低机房噪声和振动,对硬件寿命更友好。但浸没式方案牵涉到冷却液材料兼容性、运维便利性、设备维保条款等一系列工程难题,部署成本也显著高于冷板方案,目前多在对极限能效有极端追求的标杆项目中试水。
两大路线的较量背后,不仅是技术性能的比拼,更是产业话语权的暗战。冷板方案的主要供应商多为传统热管理巨头或服务器厂商,他们在接头、管路、分液单元等环节构建了较高的专利壁垒。而浸没式路线的核心壁垒在于冷却液配方和单相/双相热动力学设计,背后涌入了一批化工材料企业和初创公司,试图用颠覆性方案绕过原有生态。
值得注意的是,芯片厂商的态度正在成为影响路线走向的关键变量。英特尔、AMD等已开始在服务器平台设计中预留冷板接口,并发布液冷参考架构;而浸没式方案仍未得到主流芯片厂商正式的场景认证和长周期可靠性背书。这种上下游协调的不均衡,让冷板路线暂时占据更多商用订单,但浸没阵营并未放弃,仍在通过液冷整柜和模块化交付降低客户采纳门槛。
中期格局大概率是冷板成为主力,浸没式占据高密场景的塔尖份额,两者共存而非完全替代。但无论哪条路线胜出,对上游精密加工、CDU泵阀、快接头和冷却液的拉动都是确定的,这也是资本密集押注制冷赛道的基础逻辑。
供应链重构提速,本土企业瞄准细分卡位
超算制冷市场的放量,正带动一批细分环节的本土企业崛起。液冷系统并非一个标准化的标品,它高度依赖场景定制,这为国内具备快速响应能力的供应商提供了突围机会。相比传统空调市场由外资品牌主导的格局,液冷赛道目前仍处于早期卡位阶段,行业标准尚未完全锁定,利润窗口相对友好。
分液单元和冷板组件是最先兑现业绩的环节。由于冷板需要与不同型号的GPU、CPU紧密贴合,设计迭代快、小批量多品种特征明显,这正好契合国内精密制造企业的柔性产能优势。部分上市公司的液冷业务增速已连续多个季度超过50%,且毛利率普遍高于其传统散热产品,成为财报中为数不多的结构性亮点。
冷却液是另一条隐形价值线。浸没式冷却液对绝缘性、抗氧化性和材料安定性要求严苛,曾经高度依赖进口氟化液,成本高、议价权弱。近年来,国内化工企业陆续突破含氟冷却液的量产技术,碳氢类合成液也有产品进入验证阶段。虽然短期在介质寿命和产线一致性上仍有差距,但成本优势明显,推动冷却液从“卡脖子”材料向可替代方向演进。
CDU(冷量分配单元)和液冷管网系统则考验系统集成能力和项目交付经验。本土厂商通常采取“贴身为超算项目提供整体制冷解决方案”的模式,深度介入前期设计、仿真和后期运维,以此弥补单品品牌力的不足。一批从传统暖通或电力配电领域转型而来的企业,正在利用原有机房客户关系实现交叉销售,将制冷打包进数据中心整体基础设施包。
不过,供应链重构也伴随着洗牌风险。液冷技术迭代快,一旦某个技术方案被主流客户弃用,前期投入的产线和模具可能面临减值。因此,多数本土企业选择在几个细分环节中做深做精,而非贸然做全产业链布局,以技术纵深换取议价空间。
资本密集入局,变现预期与盈利分化并存
二级市场对超算制冷概念的追捧,已有别于早期的题材炒作。随着头部互联网厂商和运营商陆续释放数十兆瓦级别的液冷订单,资本市场开始用业绩兑现能力来筛选标的。冷板供应商、冷却液厂商和系统集成商等不同环节的估值逻辑出现明显分化,持续获得规模化订单的企业享受估值溢价,而仅停留在试验单或概念阶段的企业则快速退潮。
产业资本同样在加速涌入。多家液冷初创企业在过去一年内完成亿元级融资,投资方除了传统VC,还包括服务器厂商和能源企业的战略投资部门。后者的入场传递出一个信号:制冷不再是单纯的配套工程,它已经开始影响算力集群的交付能力和运营成本,成为产业链主导者不愿轻易外包的关键环节。
但盈利变现并非如外界想象般平坦。液冷项目多数仍以非标交付为主,设计复杂、回款周期长,尤其在浸没式项目中,很多成本项发生在客户现场部署和调试阶段,很容易侵蚀理论毛利。财报里液冷板块的营收增长与真实经营性现金流之间,往往存在时间差,这对企业的项目管理和垫资能力提出很高要求。
海外市场正在成为部分企业寻求增量的新阵地。因东南亚和中东的新建数据中心面临更严峻的散热环境和电价压力,对液冷的接受度反而高于国内部分保守客户。已有本土冷却液厂商拿到海外超算项目的长协供货合同,开始反向带动国内品牌认知。这种出海节奏若能持续,将有助于平滑国内单一市场的政策波动。
整体而言,市场已经从“要不要买制冷标的”切换到“哪家能更快把订单转化为可持续利润”。那些既具备精密制造基本功,又能提供模块化、可复制方案的厂商,更可能在后续的行业整合中走出来,成为超算制冷赛道真正的长跑者。
商业化落地仍存暗礁,标准化与人才缺口待解
尽管需求端火热,超算设备制冷的商业化落地仍面临几重现实阻力。液冷系统与现有数据中心的供电、承重、管路布局存在耦合难题,改造项目往往需要同步升级配电和楼板荷载,隐性成本常常超出预算。一些用户在初步测算时忽视了这部分连带支出,导致项目在详细设计阶段出现经济性争议,被迫延期或缩容。
更大的障碍来自行业标准化缺失。目前液冷机柜尺寸、接口规格、冷却液成分甚至运维流程都缺乏统一规范,不同供应商方案之间几乎无法互通。这意味着用户一旦选定某家液冷方案,很可能在后续扩容时面临供应商锁定的局面,这在习惯了标准化设备的机房运维团队看来,是一个鲜有妥协余地的痛点。尽管有行业协会在推动相关标准制定,但真正落地仍需时间。
人才短板也日益突出。液冷运维需要同时理解暖通热工、材料化学和IT设备特性的复合型技能,这类人员在市场上极度稀缺。部分已上线的液冷项目,后期因为运维操作不当引发管路腐蚀或接头漏液,反而削弱了用户对液冷可靠性的信心。人才瓶颈不突破,液冷的大规模复制就始终有风险敞口。
安全性争议同样不容回避。浸没式方案一旦发生冷却液大面积泄漏,不仅涉及环保和消防合规问题,还可能对昂贵芯片造成不可逆损伤。冷板方案虽相对成熟,但液路接入服务器内部,微漏风险仍让部分保守客户踌躇。制冷厂商必须提供更扎实的长周期可靠性数据和保险背书,才能跨过从“技术可行”到“运维安心”的信任鸿沟。
这些问题本质上都是产业从0到1走向100的过程中不可绕开的阶段。谁的解决方案能更快降低客户的非显性成本,谁就有机会在超算制冷这场长跑中建立真正的护城河。商业化的最终价值,不在技术参数的纸面优势,而在于能否让用户安全、省心地获得每瓦算力极致效率。