《科创板日报》8 月 19 日讯(记者 黄心怡)从预订机票、下单外卖的私人助手,到自动编写、调试代码的 AI 程序员,AI 智能体的浪潮正汹涌而来。
《科创板日报》了解到,华为、蚂蚁集团、字节跳动等不少企业正在探索将大模型和智能体应用于数据中心运维领域。比如,华为发布了全网络智能体 Netmaster,基于大模型底座,能够实现 90% 已知告警的 3 分钟自闭环。
随着 AI 技术逐步包括金融在内的千行百业中,多数据中心架构正在成为趋势,这使得网络规模将大幅提升,对运维带来挑战。有互联网金融领域的算法专家期待,未来三到五年,智能体能够逐步取代传统的应急响应流程,让运维人员不再需要 24 小时待命。
▍大模型和智能体运维成探索方向
传统运维主要依靠人力完成监控、故障排查等工作,近些年走向平台化自动化运维,如今随着 AI 技术的发展,发展至模型运维。
华为已发布了基于大模型底座的全网络智能体 Netmaster,并对华为星河 AI 网络进行了到端的架构升级。华为数据通信产品线政企领域总裁程剑介绍:" 我们在所有网络设备上,从园区、数据中心到广域网,从交换机到 Wi-Fi 再到防火墙,均内置了自研的 AI 算力芯片,实现了实时业务感知和异常快速闭环。"
不少金融机构正在积极引入 AI 技术,来探索网络的智能化运维。西北某城商行信息科技部总经理助理透露," 目前采用二层网络与 SDN 双模并存的架构,未来将向标准化、模块化、层次化方向演进。"
他介绍了三大规划方向:一是核心业务与 IT 应用建设,二是推进自主创新落地,三是实现统一管理与分析编排,依托 SDN 技术提升网络自动化与风险管控能力。
在具体实施上,该城商行计划分三步走:首先优化现有 SDN 架构,实现全栈 SDN 化;其次推进应用迁移,逐步实现业务与网络的深度协同;最后引入 AI 技术,构建面向应用运维的智能化体系,提升网络运维效率与业务连续性。
他还分享了城商行在自动化与智能化方面的运维实践:"我们通过‘人防 + 机防’策略,引入自动化巡检平台和 AI 分析能力,快速排查定位问题。未来还将探索 AI 在日志和流量分析中的应用,进一步提升运维效率。"
▍多数据中心架构成趋势 网络规模将大幅提升
随着金融行业对 AI 技术的广泛和深化应用,数据中心呈多地、多中心发展。程剑认为,这将带来了运维上的重大挑战。
一是网络规模大幅度提升。"过去 5 年某大行数据中心的交换机数量是从 3 千台走向三万台,未来行业内的建设规模可能会增长到 10 万甚至更多,需要基于 AI 手段提高智能运维能力。"
二是在多数据中心、多云的架构下,一旦发生网络故障,如何更好、更快速切换至新的数据中心,满足金融业务 RTO(系统恢复时间)小于 30 分钟的要求,也是一大核心挑战。" 单数据中心容易做,跨数据中心就难了,这也是华为数通关键的发力点,从单数据中心韧性走向多数据中心。" 程剑表示。
第三则是安全性。" 如今头部大行拥有成千上万的分支网点,甚至还有海外的网点。这些网点非常分散,是安全攻击的薄弱点。金融机具比如金融 ATM 机,如果在网络层面没有识别能力,也会存在安全隐患。"