咨询QQ:
      杂志订阅

      编辑

      网管

      培训班

      市场部

      发行部

电话服务:
 010-82024981
设为首页 | 收藏本页
农业银行智算中心建设与运营实践
  • 农业银行加速构建安全高效的新一代智算底座,通过"东数西算"优化布局、多元异构算力部署及AI赋能运维转型,打造绿色智能的金融智算标杆,为全行数智化转型提供坚实支撑。

    随着人工智能技术的快速发展,银行业智能应用场景持续深化拓展,急需构建高可靠、高性能的新一代智算底座。农业银行数据中心积极落实新质生产力发展要求,加速构建安全、高效、智能、绿色的智算中心,以算力基础设施升级助力全行数智化转型,为金融业智算中心建设提供参考与借鉴。
      
      在国家“东数西算”工程、“人工智能+”行动等政策的推动下,农业银行数据中心前瞻布局人工智能新基建,深入推进“一体协同、多元异构”的融合算力架构,为智慧银行建设提供安全可靠的算力底座。
      
      1.优化算力基础设施布局
      
      根据国家“东数西算”战略部署,农业银行数据中心深入研判业务发展需求、技术演进趋势及灾备体系布局,率先启动内蒙古数据中心建设工程,构建形成多地多中心、集团一体化的新基建布局,实现基础设施高可用和机房充足供给,为全行数智化转型提供坚实的基础设施保障;同时,通过优化算力资源跨区域调度机制,将大数据、人工智能等高能耗应用向西部低成本地区迁移,有效支撑东部地区数据处理需求,实现算力资源与能源供给的最优配置。
      
      2.部署多元异构智能算力
      
      面对大模型时代金融场景的复杂算力需求,农业银行数据中心构建了“异构兼容、多元并存、平滑演进”的智算底座,实现从底层芯片、硬件设备、操作系统到上层管理平台的全栈自主可控。智算底座通过分层架构设计,打造了灵活适配不同场景的算力供给能力:通用计算层以CPU为核心,承担业务逻辑处理及数据处理等任务;智能加速层采用GPU与NPU的异构组合实现能效比最优,其中,GPU通过混合精度计算支持大模型优化的高并发需求,NPU则针对金融领域特定算法进行推理加速;统一抽象层通过容器化与虚拟化技术,屏蔽底层硬件差异,为上层应用提供标准化算力接口,支持“一次开发、多端部署”的敏捷开发模式。
      
      3.构建高效智算体系架构
      
      面向新型算力服务的架构创新需求,农业银行数据中心深度整合AI芯片、集群计算框架、算法模型矩阵,构建“云+AI”深度融合的智算架构,实现算力网络智能化升级。该架构自底向上分为四层:基础设施层采用xPU集群支撑并行计算,依托RoCE技术构建低延迟高吞吐网络,借助统一存储系统实现集中式与分布式存储资源的一体化管理,构建了算网存一体化的AI基础设施,保障算力、网络、数据的高效协同;资源服务层通过敏捷的算力资源调度、统一的数据资源供给、快速迭代的模型矩阵,为AI开发提供全要素支撑;智算平台层整合算法、框架、工具、组件,依托平台与租户协同模式,提供开箱即用的AI模型服务,支持智能体等新技术应用,提升应用的快速部署与规模化推广能力;应用服务层聚焦场景化落地,系统化打造信贷、风控、渠道、运营、投顾、营销、运维、办公八大领域智慧应用,实现“人工智能+”的全面赋能与深度应用。
      
      二、云化能力支撑:
      
      强化智算资源敏捷供给
      
      面对智算需求激增与精益化管理的双重挑战,农业银行数据中心以算网协同、云化管理、生态协同为三大核心支柱,构建全栈式智能算力底座,通过高速互联网络、资源弹性调度与技术生态共建,实现智算资源的敏捷供给与集约化利用。
      
      1.算网协同,实现高速可靠互联
      
      高速可靠的算力网络是智算集群化与大规模并行运算的核心支撑。农业银行数据中心采用跨节点高速互联、动态负载均衡、分层存储优化等关键技术,保障数据在计算节点间实现低时延、高吞吐的无损网络传输;构建跨地域高速互联网络,通过云网一体化架构,统一调度计算、网络及存储资源,实现千卡集群的高速互联,支撑多类型、多尺寸、多模态模型的稳定运行。
      
      2.云化管理,高效保障业务需求
      
      AI算力需求的指数级增长,对智算资源的敏捷供给与集约化管理提出更高要求。农业银行数据中心基于智算云平台构建统一AI算力池,整合xPU异构硬件资源,打破硬件资源孤岛,实现集中化管理;通过内核级虚拟化技术革新算力分配模式,实现算力与显存资源的细粒度划分,支持“一卡多用”与业务敏捷部署;依托智能调度系统实现负载均衡、资源超配与混部、弹性伸缩及跨节点聚合,通过多任务峰谷互补与动态资源供给,提升智能算力的灵活性、利用率及集约化水平,全面构建资源高效利用、业务敏捷响应的智能算力供给架构。
      
      3.生态协同,驱动技术升级创新
      
      面对人工智能技术快速迭代的特性,农业银行数据中心秉持“以用促建、共建共享”理念,构建良性循环的智算生态协同机制,推动技术迭代与场景应用深度融合。一是联合芯片厂商、云计算企业及科研机构共建实验室,攻关大规模推理模型性能优化技术,推进大模型与智算硬件的协同优化,通过算子优化和编译加速提升兼容性,进一步压降智算应用的训推成本;二是积极参与金融行业算力、AI安全及绿色计算等标准的制定,在行业生态共建中及时把握监管要求与技术趋势,明确技术演进方向,为智算中心发展提供规范指引;三是深度融入开源生态,积极贡献金融场景工具与插件,同时吸收社区先进成果反哺内部技术迭代,减少重复研发,加速技术转化。
      
      三、智算运维转型:
      
      AI赋能运维模式升级
      
      面对算力资源规模扩张与异构环境运维的挑战,农业银行数据中心积极通过AI赋能,构建智能化运维体系,突破传统运维在复杂环境中的能力瓶颈,持续提升智算底座的安全韧性,实现算力全生命周期精准管控。
      
      1.打造“通算+智算”融合的运维体系
      
      农业银行数据中心基于现有的通用算力运维体系,通过架构解耦与能力复用,升级构建了“通算+智算”的融合运维框架。该框架以“监—管—控—配—析”五位一体联动闭环为核心,从应用系统与基础设施两个维度,打造横向跨层、纵向穿透的全栈可观测能力,实现算力资源“一张图”全景可视;同时整合多维度诊断工具链,打造“一套工具”精准定位故障根源。在运维纵深层面,该框架实现对“通算+智算”的全链路智能感知与“事前—事中—事后”的全周期运营管理,并持续通过常态化实战演练,锤炼技术运营和应急响应能力。
      
      2.AI赋能生产运维模式创新
      
      农业银行数据中心以数据要素为核心、AI技术为引擎,创新构建多位一体的智能运维体系。一是运用智能体构建一体化智能巡检平台,实现系统健康状况的自动化、精准化评估,筑牢安全生产事前防线;二是构建AI算法驱动的无阈值智能监控系统,基于企业级知识库打造“AI运维助手”,实现风险精准发现与处置方案智能推荐,形成“感知—分析—决策”的响应闭环,有效筑牢安全生产事中防线;三是融合大模型与强化学习技术,构建变更风险智能评估与全流程防控机制,实现变更风险隐患的精准识别,推动风险管控模式从被动响应向主动防御跃迁。
      
      3.网络安全智慧运营提质增效
      
      农业银行数据中心秉持“以AI对抗AI”的建设思路,构建“智能防御+攻防协同”双轮驱动的运营体系,实现“监测—分析—响应—优化”全流程智慧化升级。在资产漏洞监测方面,利用大模型泛化能力,动态测绘全网资产并智能评估漏洞优先级,强化风险识别能力。在安全态势分析方面,融合多模态分析技术,构建攻击链路知识图谱,实现攻击行为精准识别与快速溯源;打造智能实时邮件检测系统,结合自然语言处理与视觉识别技术,有效拦截恶意邮件。在安全防护响应方面,打造智能告警处置引擎,通过动态决策机制实现典型攻击场景的自动化响应。在攻防实战优化方面,开发AI渗透测试平台,通过实战化渗透提前加固薄弱环节,加速防御机制进化,形成攻防协同的新型安全范式。
      
      面对算力需求爆发式增长与智算成本高昂的突出矛盾,农业银行数据中心秉持绿色集约原则,系统化提升智算资源利用效率,加速机房基础设施节能降碳转型,助力智算中心降本增效。
      
      1.三维协同提升智算资源利用效率
      
      面向算力供需的主要矛盾,农业银行数据中心从“策略优化、架构创新、监测赋能”三大维度协同发力,实现资源利用效率的显著提升。在策略优化方面,制定分层模型使用策略,根据业务场景需求,动态选择适配的模型参数量级,实现大/小模型与轻量级/复杂场景的精准适配,避免算力资源错配。在架构创新方面,采用PD分离部署模式,突破传统架构资源耦合瓶颈,将提示词处理与文本生成解耦运行,显著提升系统响应速度与资源利用效率。在监测赋能方面,构建全链路FinOps成本治理体系,通过覆盖“作业级—应用级—租户级”的多层级监控看板,实现算力消耗可视化管控,智能识别僵尸任务、低效模型等,触发自动回收或降频策略,推动资源成本的实时主动优化。
      
      2.节能降碳技术助力基础设施绿色转型
      
      围绕国家“双碳”目标,农业银行数据中心秉持全生命周期绿色运营理念,加速推进机房基础设施绿色智能转型,进一步擦亮绿色底色。一是在规划阶段,因地制宜采用间接蒸发冷却、氟泵双循环、光伏发电等技术,实现开源节流。二是在运营阶段,构建多维节能架构,应用AI节能技术对冷源系统、气流组织进行智能调优,通过持续节能调适提升能效水平;打造智能照明系统,通过动态电源调节、负荷优化等,实现精益化节能管控,有效支撑绿色低碳运营。基于上述创新实践,农业银行多个数据中心园区获评“国家绿色数据中心”和“国家A级机房”,成为行业能效管理标杆。
      
      面向蓬勃兴起的AI技术革命浪潮,农业银行数据中心将深入贯彻“人工智能+”发展战略,持续构建安全可靠、集约高效、绿色智能的新型智算底座,通过生产智能运维与安全智慧运营的协同创新,增强底座韧性,筑牢转型根基,为智慧银行建设提供有力支撑。
      
      编辑:Harris
      
      

    农业银行加速构建安全高效的新一代智算底座,通过"东数西算"优化布局、多元异构算力部署及AI赋能运维转型,打造绿色智能的金融智算标杆,为全行数智化转型提供坚实支撑。