智启万物,算筑基石——邮储银行全栈自主智算基础设施建设实践
- 2026/5/28 6:56:57 作者:中国邮政储蓄银行运营数据中心总经理巫建刚 来源:中国金融电脑
-
当前,数字经济浪潮席卷全球,金融业已经进入从数字化向智能化转型的关键时期。随着大模型技术的爆发式演进,全球人工智能技术主权竞争进入白热化阶段。构建自主可控、高效安全、绿色低碳的智算数据中心,不仅是应对供应链不确定性、保障金融安全的战略选择,更是打造金融核心竞争力的必由之路。
当前,数字经济浪潮席卷全球,金融业已经进入从数字化向智能化转型的关键时期。随着大模型技术的爆发式演进,全球人工智能技术主权竞争进入白热化阶段。构建自主可控、高效安全、绿色低碳的智算数据中心,不仅是应对供应链不确定性、保障金融安全的战略选择,更是打造金融核心竞争力的必由之路。
“十五五”规划明确提出,全面实施“人工智能+”行动,支持大模型广泛应用,推动数字金融高质量发展。与此同时,中国人民银行等相关监管部门对金融业网络安全、业务连续性及数据安全的要求也在不断提高。在此背景下,邮储银行以“数字邮储”为引领,深入实施“人工智能+”行动,发布“AI2ALL”数字生态战略,将AI能力定位为推动金融服务范式重构的核心驱动力。为此,邮储银行秉持“自主创新、高效协同、绿色集约、智能运营”的数据中心建设理念,从顶层设计到落地实践,探索出一条符合自身特色、可复制可推广的智算数据中心建设运营之路。
1.筑牢“AI2ALL”底座,打造金融智算新基建
邮储银行“AI2ALL”数字生态发展战略的底层核心,在于重塑数据中心算力基础设施。邮储银行秉持“架构先行、体系筑基”的原则,构建起“数据、算力、算法”三位一体的硬核框架。围绕算力资源全栈自主可控的总体要求,加快构建自主可控算力底座,实现算力资源的规模化布局与高效供给,打造“双活互备、多点接入”的高可用智算能力,确保全行AI业务在极端场景下的持续稳健运行。目前,邮储银行算力底座已承载超330个AI业务场景的爆发式需求。这种“向下扎根、向上生长”的建设模式,正在将顶层设计的战略蓝图,转化为驱动“对外全域触达、对内全员提效”的澎湃数字动能。
2.夯实智算基座,实现算力供给模式变革
传统“烟囱式”的算力部署模式已难以匹配新一代AI智能体(Agent)的应用需求。为此,邮储银行打造了统一的异构算力调度平台,将千卡级训推算力集群进行资源池化管理,通过划分专属资源池与共享资源池,满足核心业务算力需求,提升全行资源的集约化水平;同时创新落地“训推共池、分时复用”机制,大幅提升算力利用效率,有效解决训练与推理资源相互独立、忙闲不均的问题,通过灵活调度与共享,使有限算力得到更充分释放,为业务创新提供更充沛、更可持续的算力支撑。
在数智化创新实践中,邮储银行发现,随着代理式(Agentic)AI模式的普及以及信审等场景对多模态交互处理需求的激增,底层算力在序列长度、推理精度等方面面临严峻挑战。为此,邮储银行引入超节点算力服务,构建了金融业首个超节点算力集群。这不仅是硬件的升级,更是对大模型训推逻辑的重构,极大提升了超大尺寸、长序列模型的落地效率。这一基础设施的重塑,不仅优化了大模型的训推性能,也打通了超大尺寸模型从少量部署到规模化应用的路径。目前,邮储银行引入的包括DeepSeek、GLM等在内的前沿模型均已在这一底座上稳定运行,实现了技术底座与业务需求的精准匹配,相关工程实践为金融同业在智算中心建设方面提供了可参考的范例。
3.管控平台赋能,统一算力管理驱动创新
为解决人工智能算力管理基础服务能力不足的问题,邮储银行建设了贯穿AI技术创新全价值链的AI算力管理平台(如图1所示)。该平台向下统筹管理多元异构算力及配套的高性能网络和存储,向上通过可弹性调度的训推服务支撑全行业务AI创新。具体来讲,向下,AI算力管理平台实现异构算力的深度整合与统一纳管,构建了“一云多芯”的智算底座,屏蔽底层硬件差异,实现对不同厂商、不同代际算力资源的透明化整合;支持集群与超节点模式的统一管理与弹性调度,为上层应用输出标准化、归一化的算力能力。向上,AI算力管理平台灵活赋能业务创新,基于无服务器AI(ServerlessAI)架构,将资源供给模式从“静态绑定”革新为“动态按需”,显著优化了资源分配方式,大幅提升了算力利用效能。
依托AI算力管理平台,邮储银行实现了算力资源的“可见、可管、可用”,推动算力供给由传统“资源模式”向“服务化消费模式”转型,不仅为上层业务创新提供了更敏捷、更高效的支撑,更从全局视角全面增强了算力的架构韧性与资源调度的灵活性。
4.场景落地显效,撬动算力驱动新循环
依托坚实可靠的全栈自主可控算力底座,邮储银行构建了完善的模型服务能力,有效支撑了人工智能在营销获客、风险管控、运营效能、智慧办公等核心业务领域的规模化落地。技术底座与业务需求实现深度融合,推动场景建设取得显著成效,并初步形成了“算力驱动模型、模型赋能场景”的良性循环。目前,AI算力管理平台日均提供超过100亿词元(Token)的服务,为全行智能化转型提供了有力支撑,也为后续探索更复杂的智能体应用奠定了坚实基础。
二、运营篇:
集约运营,智能跃升
传统云化数据中心的核心是管理算力、存储、网络等资源,本质上是一个“资源仓库”;而面向以智能体为主的AI数据中心,其核心是服务智能体的运行——理解意图、调度任务、保障体验,更像一个“智能工厂”。这不再是简单的设备升级,而是从“管机器”转向“管任务”,从“看利用率”转向“看服务保障率”。过去,金融机构主要关注服务器用了多少;现在,更关心模型跑得快不快、智能体响应是否流畅。传统的运维脚本工具已难以胜任,未来需要知识驱动的智能体来实现数据中心自动决策和异常修复。整体上,数据中心正加速从传统的“资源供给中心”向“智能服务中心”转型,其运营模式也从单纯的算力资源供给,转向满足大模型和智能体的运行需求,构建一套面向“Token生产线”的全新体系。传统云化数据中心与AI智算数据中心对比见表1。
表1传统云化数据中心与AI智算数据中心对比
1.打造“懂AI”的看板,从三层视角量化业务价值
邮储银行建立了一套覆盖体验、性能、高可用、资源管理四大维度的运营指标体系,贯穿业务效果、模型精度、集群可用度、算力能效等指标,支持从“业务—模型—资源”三层视角实时评估服务质量。该体系不再孤立地关注算力使用情况,而是聚焦每一次推理请求的服务保障率与推理效果,为从被动响应转向主动优化提供量化依据。此外,邮储银行还建设了可视化算力大屏,实现了对三层映射关系的实时呈现,使管理者可实时、精准掌握各业务算力消耗与服务质量等情况,从而指导模型优化、硬件选型和资源分配,让数据中心资源产生可衡量的业务价值。
2.化被动为主动,三位一体实现自主运营
邮储银行正推动运维模式从传统规则化、被动式向知识驱动、主动自愈的新一代智能算力运营升级,以全面满足AI智算数据中心动态复杂的运营需求;深度融合模型仿真、Serverless调度能力与运维智能体,构建“主动式故障诊断、服务等级目标(SLO)保障、资源弹性调度”三位一体运行机制:自动识别业务优先级,基于SLO实现分层资源精准调配,在保障关键任务服务质量的前提下弹性调度资源;持续提升集群能效与服务保障率,形成集约、高效、自主优化的智能算力运营新模式。
数据中心的转型,本质上是从“幕后保管员”走向“前台合伙人”——这不仅是在建设算力,更是在构建一种支持金融智能体自由生长、高效运作的全新服务与运营体系。
面向“十五五”,AI技术将从“辅助工具”向“决策执行者”加速演进,数据中心自身的运营模式也将迎来深刻变革。邮储银行的目标是建设数智化数据中心,并最终构建人机共治的智能体运维新范式。
1.AI赋能数据中心:从辅助到共治
未来的数据中心,将不再是简单的“硬件+软件”堆叠,而是一个由智能体集群驱动的有机生命体。邮储银行将充分利用AI能力,赋能数据中心自身的建设、运维与运营。
在具体路径上,邮储银行将结合智能体技术及类OpenClaw端侧机器人技术,面向不同业务条线打造岗位机器人和基础智能体,逐步由点到面覆盖数据中心运维的全场景——从基础设施监控、告警研判、根因分析,到合规管理、容量规划、成本优化,构建端到端的自动化闭环。
但实现这一目标需要满足三大前提:数据的实时性、自动化工具的完备性、资源及运维语义的统一。为此,邮储银行将系统性梳理现有运维流程,打通断点,统一数据模型与接口标准,消除“数据孤岛”和“工具碎片化”现象,为智能体的规模化部署奠定基础,最终形成人机共治模式。其具体表现为:机器负责高频、重复、确定性的操作,人类聚焦决策、创新、异常处置,双方协同实现效率倍增。
2.AI原生,全域智能互联:面向智能体的弹性架构
随着智能体的大规模应用,业务负载将从“请求—响应”模式转向“多轮交互—跨域调用”模式。智算成为规划、编排的核心,需要联动各类工具和服务,这对基础设施提出了全新要求:支持智能体内部和外部的高效通信、任务编排、状态共享和弹性容错。为此,邮储银行在硬件层优化资源的池化与统一调度,支持智能体任务的灵活拆解与协同;在平台层构建面向智能体的跨域调用链检测能力,实现对智能体执行路径的全链路追踪与性能分析,快速定位瓶颈与异常。同时,依托弹性高可靠部署机制,通过服务网格、边车代理等技术,确保智能体在部分节点发生故障时仍能无缝迁移、持续服务。
3.FinOps机制:从Token到业务效果的价值度量
算力即成本。在大规模模型推理场景下,Token消耗量(输入+输出)成为主要的成本驱动因素,传统的资源利用率指标无法反映真实的业务价值。
为此,邮储银行将建立云财务运营(FinOps)机制,面向“Token工厂”实现精细化的成本与效能度量。其核心思路是以“Token/Watt”(每瓦特电能产生的Token数)和“业务效果/Token”(每Token带来的业务转化)为核心单位,通过FinOps机制,让每一度电、每一个Token都能产生可衡量的业务价值,最终实现技术、财务、业务三者的协同优化。
展望未来,邮储银行将持续以“自主创新、高效协同、绿色集约、智能运营”为指引,从建设、运营到价值度量,全方位构建面向AI时代的智算基础设施。唯有将算力转化为业务创新的核心引擎,才能在数智化浪潮中行稳致远,持续为客户、为员工、为社会创造更大的价值。
编辑:Harris
当前,数字经济浪潮席卷全球,金融业已经进入从数字化向智能化转型的关键时期。随着大模型技术的爆发式演进,全球人工智能技术主权竞争进入白热化阶段。构建自主可控、高效安全、绿色低碳的智算数据中心,不仅是应对供应链不确定性、保障金融安全的战略选择,更是打造金融核心竞争力的必由之路。
