AI 工业化时代,作为国产数据库的标杆玩家,源自蚂蚁集团的 OceanBase 站在了新的起点。
5 月 17 日,在 OceanBase 第三届开发者大会上,OceanBase 对外详细诠释了其最新升级的 "DATA x AI" 战略,并发布面向 AI 的应用产品 PowerRAG。
作为 OceanBase AI 战略落地的 " 一号位 ",OceanBase CTO 杨传辉表示,OceanBase 正致力于构建 Data × AI 能力,面向 AI 时代推动一体化数据库向一体化数据底座的战略演进。
在 OceanBase 看来,AI 时代,传统数据库已很难满足全行业的需求。
一方面,AI 大模型的爆发,会让数据以及数据的处理需求,爆发式增长,比如 AI 大模型核心是对海量数据进行训练与推理,且会生成海量数据。IDC 报告指出,受生成式 AI 等技术驱动,预计 2028 年全球新生成数据量规模将达到 393.9ZB。数据量级的指数级增长,对数据库的架构、性能、成本等均提出新的需求。另一方面,AI 时代,数据的类型更多从结构化向非结构化转变,源自真实世界的图像、视频等非结构化数据更多,传统的关系型数据库已很难满足。
在内部信中,杨冰表示,OceanBase 面向未来思考,AI 正在重塑一切,谁能更好地解决 DATA 和 AI 的融合,实现 "DATA × AI",谁就能成为 AI 时代的数据底座。
在打造 AI 时代的数据库上,OceanBase 有先天优势。作为一家生于 AI 云时代的数据库厂商,OceanBase 一直将 " 分布式 " 作为自身的信仰,杨传辉很早就提出 " 单机分布式一体化是数据库的未来 " 的观点。当年,传统数据库很难服务于蚂蚁爆发式增长的数据处理需求,OceanBase 应运而生,从无到有,坚持 100% 根自研,攻克了分布式数据库稳定性、高并发、可扩展、实时分析和多云等难题,为市场打造了一款高质量的一体化分布式数据库产品。
不过,在杨传辉看来," 大模型落地产生价值的核心,在于数据与模型的一体化融合,这也是 OceanBase 提出的构建 Data × AI 能力的关键。" 因此,OceanBase 跳脱出传统本地化数据库的逻辑,基于一体化数据库的现有优势,加速向一个一体化数据底座演进,可通过一套引擎同时支持 TP/AP/AI 混合负载,支持向量数据库,实现 SQL 与 AI 的混合检索。
在发布会上,OceanBase 发布了首个面向 AI 的应用产品 PowerRAG,打通 AI 应用开发数据层、平台层、接口层与应用层的全流程,可帮用户实现文档知识库、智能对话、图像比对、数据分析等多种 AI 应用场景的快速开发。
而在支持 AI 应用落地的核心基础设施——向量性能、混合检索等层面,OceanBase 也在持续探索,进一步加强 SQL+AI 能力,在发布会上,OceanBase 还现场 " 跑分 ",基于基准测试工具 VectorDBBench,采用 Performamce768D1M 测试数据集跑分测试,结果显示,其性能超越业界三款领先的开源向量数据库。
OceanBase 的 "DATA × AI" 已被多个客户应用在真实生产场景中,比如联通软研院打造了服务于运营商的 AI 助手,in 银泰商业打造了零售业智能问数平台。
前些年,在国产替代 " 信创 " 浪潮和企业数字化进程中,源自蚂蚁,经过双 11 等海量真实场景锤炼的 OceanBase,基于原生分布式架构以及开源模式,成功崛起成为国产数据库的标杆平台。如今,在 AI 工业化大生产阶段,作为云原生数据库的 OceanBase,不论是应对更大规模的数据处理,还是应对 AI 新场景下的全新 AI 数据处理需求,都将发挥出自身优势,在数据产业扮演更重要的角色。