当人工智能遇上基础设施：设计能够跟上步伐的数据中心 - 热点关注

您的位置: 首页»行业资讯»热点关注»当人工智能遇上基础设施：设计能够跟上步伐的数据中心

当人工智能遇上基础设施：设计能够跟上步伐的数据中心

2025/12/29 7:33:13 作者：来源：千家网
分享:QQ空间新浪微博人人网腾讯微博网易微博

AI的摩尔定律是3.4月翻倍，传统数据中心3.4年才能翻一番。只有把“建筑-机电-网络”做成可热插拔的“巨型主板”，才能让算力像CPU一样“边成长边投产”。

AI的摩尔定律是3.4月翻倍，传统数据中心3.4年才能翻一番。只有把“建筑-机电-网络”做成可热插拔的“巨型主板”，才能让算力像CPU一样“边成长边投产”。2025-2026年，浸没液冷、12kV直流母线、CPO、1.6T、预制化智粒将批量成熟——谁先完成“算力-能源-空间”三维耦合，谁就能让GPU永远跑在满频，而把PUE永远锁在1.05。让数据中心从此跟上AI的步伐，而不是拖住AI的后腿。

过去三年，AI训练算力需求每3.4个月翻一番。2026年，单个万卡集群功率将突破50MW，相当于一条地铁线的用电负荷；一次GPT-5预训练需3个月、耗电120GWh，等于10万户家庭全年用量。传统“先盖楼、再买机”的节奏已完全追不上GPU的“指数级生长曲线”。

“算力-能源-空间”三条曲线在2025年首次交叉：要么让基础设施跟着AI一起“超频”，要么把GPU降频回“节能模式”。答案显而易见——数据中心必须被重新设计。

AI负载画像：三高一快

·高功率密度：单柜50kW成主流，100kW机柜已在试点；

·高东西向流量：All-Reduce模型参数200GB，每100ms同步一次，网络不能有收敛比；

·高弹性：训练任务4小时上线、10分钟扩500张GPU，物理层必须“秒级可扩展”；

·散热快：热点3s内从35℃→45℃，传统15℃温差设计直接失效。

·设计哲学：把数据中心看成“巨大主板”

·能源=主板供电：12V直流母线、电容储能、单相浸没液=CPU旁路电容；

·网络=主板走线：112GSerDes、共封装光（CPO）、光纤=PCB铜箔；

·空间=主板槽位：预制化模组、滑动天轨、盲插接头=PCIe插槽。

当“建筑-机电-IT”三者共用同一套“接口规范”，数据中心就能像主板一样“边插边跑”。

算力层：从“房间”到“槽位”

机柜即刀片

超微60U液冷柜内置8个6U“子盒”，每子盒8×H100；柜底集成CDU，快插接头2min完成“换刀”。

服务器即内存条

谷歌“数据机柜（DataRack）”把48块主板竖插到浸没缸，像插DIMM一样插服务器；维护时整机缸拉出，MTTR从90min降到5min。

GPU即电容

英伟达B100采用“双相均热板+冷板”一体封装，冷板接口标准化，与主板电容一样“可热插拔”，实现500μs断电换卡。

能源层：让“电”跟着“算”一起伸缩

12kV直流母线

固态变压器（SST）把35kV直降到1kV，再直降到12V，两级DC变换，效率97.5%，省掉传统UPS6%损耗。

电容储能+锂电混合

超级电容承担10s峰值平抑，锂电承担10min桥接，UPS房间面积缩小70%，同时支持150%峰值功率30s，满足GPU爆发上电。

算-电联动AI Agent

实时读取GPU利用率、现货电价、碳排因子；当电价>0.8元/kWh自动降频10%，当碳强度>800g/kWh自动切换储能，年省电费12%。

网络层：把“大象流”拆成“芯片内流”

112GSerDes+1.6T光模块

2025H2量产，单交换芯片51.2T，可32×1.6T口全速转发；相比400G时代，AI训练集群跳数从6降到2，All-Reduce时间缩短35%。

CPO（共封装光）

把光引擎与交换ASIC封装在同一有机基板，电走线<5mm，功耗降30%，信号密度提升3倍；谷歌2026年计划50%新集群采用CPOTOR。

机柜内光背板

GPU板卡通过光纤盲插到背板，柜内256×400G全互联，布线面积缩小90%，误码率<1E-15，满足100kW机柜无阻塞。

散热层：从“吹冷风”到“泡冷水”

单相浸没

把50℃矿物油灌进缸，服务器竖插，PUE1.05；维护时机械手把主板提出，表面油膜30s滴完，无需烘干。

两相浸没

氟化液沸点50℃，GPU表面产生气泡带走700W热量，冷凝器回流，散热能力2kW/U；国内2025年Q2规模商用，PUE1.03。

冷水“天轨”

把CDU挂在天轨上，像窗帘一样滑动；维护时1人2min可整体更换换热器，无需进入热通道，MTTR再降60%。

空间层：像搭乐高一样“边成长边投产”

百MW单体+GW级园区

世纪互联Hyperscale2.0：单栋120m×36m×18m，荷载16kN/m²，可横向无限拼接；土建90天交付，机电60天交付。

智粒即插

冷水机组、UPS、电池全部封装在40尺集装箱，出厂前带载测试；现场只做水管/母线快速接头，48h并网。

网络预连接

康宁576芯1U配线架+MMC光纤盲插，柜内布线时间从8人时降到0.5人时，为100kW机柜提供1.6T端口256根光纤而不乱。

案例速览：AI数据中心“新物种”

谷歌-内布拉斯加

浸没+TPUv5，单柜60kW，PUE1.05，2025Q4上线，训练PaLM3只需30天建设期。

微软-芬兰

废热60℃给2万户供暖，同时PCM楼板蓄冷，机房峰值冷负荷下降18%，碳负排放。

世纪互联-乌兰察布

12kV直流母线+智粒+GW级园区，2026年目标70%绿电，PUE1.15，土建机电交付周期5个月，比传统缩短50%。

结语：让基础设施与AI同步“超频”

编辑：Harris

招标信息更多>>

绿色节能更多>>

协(学)会信息更多>>


咨询QQ: 杂志订阅编辑网管培训班市场部发行部电话服务: 010-82024981