APP下载

关于ZAKER

Skills 合作

财联社-深度 35分钟前

国家层面首次系统性部署高质量数据集成物理 AI 时代“新石油”

《科创板日报》6 月 8 日讯（编辑宋子乔）今日，国家数据局发布《关于推进行业高质量数据集建设行动的实施方案》，这是国家层面首次对数据赋能人工智能发展作出的系统性部署。

《实施方案》指出，行业高质量数据集是经过采集、加工等数据处理，可直接用于开发和训练人工智能模型，能有效提升模型性能的行业数据的集合，包含行业通识和行业专识数据集。

《实施方案》的总体目标是，到 2028 年底，建成一批覆盖重点领域、经过应用验证的行业高质量数据集，打造一批数据驱动人工智能创新发展的典型应用场景，培育一批具备领先优势的创新型数据企业和专业人才，形成一批行业高质量数据集建设工具和标准。

具体措施包括：围绕行业高质量数据集供给、流通、应用等关键环节，部署六大专项行动，提出面向人工智能应用需求，持续推进文本、图像、音视频等多模态高质量数据集建设；聚焦智能体、具身智能和世界模型等重点方向，要求加快推进数据集建设；引导具备条件的地区因地制宜开展数据标注创新试验区建设。

数据是 AI 训练的核心原料，训练一个领先的大模型，需要数百万甚至数千万条标注数据。从 GPT-4 的 13 万亿 tokens（词元）高质量数据（中文汉字通常每个对应 1-2 个 tokens），到 Qwen2.5-Max 的 20 万亿 tokens 训练规模，国际巨头正以数据优势构筑技术壁垒。

高质量数据集的严重匮乏，已成为制约物理 AI 及其衍生的智能体、具身智能和世界模型等前沿领域发展的核心瓶颈。

在 2026 年世界智能产业博览会上，国家数据局局长刘烈宏明确指出："高质量数据集是具身智能‘感知 - 决策 - 执行’的重要基础。" 据《科创板日报》此前报道，具身智能领域多个投资者表示，当下具身发展的核心瓶颈就是数据。高质量数据的规模化生产能力，就是这个赛道的 " 石油 "，" 具身数据有着特殊的技术要求，现有民用数据无法复用。例如抓取水杯，机器人无法自主判断握持力度，极易滑落。高精度、第一视角、多维度的具身数据极度稀缺。"

上述判断与 "AI 教母 " 李飞飞的观点高度契合。从当年的 ImageNet 到如今的 WorldLabs，李飞飞始终强调数据集的大小决定了智能的程度，她曾在访谈中明确表示，现在，数据可能又成为发展世界模型一个特别特别难的问题，" 数据与算法平等重要。"

在 2026 年 2 月思科 AI 峰会上，李飞飞直言，物理世界 AI 发展滞后于语言模型，核心瓶颈在于数据信噪比——文本数据语义清晰、易获取，而物理世界的像素、体素数据充满噪声，且 3D、4D 维度的高质量数据极度稀缺。在接受 a16z 的访谈中，她进一步指出，AI 进步的核心限制从来不是算力或算法，而是高质量、多模态、符合物理一致性的数据，这一结论从 ImageNet 时代延续至今，在世界模型研发阶段更为凸显。

今年以来，高质量数据集领域新动向颇多。

4 月 15 日，国家数据局发布《关于推进行业高质量数据集建设行动的实施方案（征求意见稿）》，向社会公开征求意见。工业和信息化部、国家数据局近期联合印发《关于联合实施 2026 年 " 模数共振 " 行动的通知》，推动人工智能模型与数据资源协同互促、同频共振，并提出到 2026 年底，基本形成 " 数据 - 模型 - 场景应用 " 良性互促的循环，推动人工智能高水平赋能新型工业化。

行业平台层面，4 月 29 日，国家数据集管理服务平台发布并启动试运行，提供覆盖数据集全生命周期的公共服务能力。截至 5 月 31 日，已认证机构 516 家，发布数据集 1350 个，覆盖农业、工业制造、交通、文旅等重点领域。

截至今年一季度，全国已建成高质量数据集超过 11.6 万个，总体量超过 960PB。截至今年 3 月，我国日均词元调用量已超过 140 万亿。

查看原文

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

ZAKER旗下免费视频剪辑工具

企业资讯

查看更多内容

Blockchain News

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

国家层面首次系统性部署 高质量数据集成物理 AI 时代“新石油”

宙世代

一起剪

相关阅读

港交所迎上市热潮，两周内近50家公司递表

升级硬件成本骤然提升！且看券商CIO的压力清单

2连板中百集团：主营业务仍聚焦于有税商品经营，尚未开设免税店

达实智能6天4板，赛马概念涨幅居前

索辰科技：物理AI业务尚处布局初期

法巴：美联储将从12月开始连续三次加息

沪指跌1.7%失守4000点，全市场超4500股收绿，物理AI概念逆势爆发

恒生科技指数跌2.7%，分析师称市场预期透支引发阶段性回调

凯盛科技：TGV技术仍处于前期研发阶段 暂未实现任何营业收入

资金利率全面上行，10年国债收益率走弱近1BP

电子工业关键材料！电子布涨幅达100% 年内已5轮提价

成本持续下降，钠电产业的“磷酸铁锂”时刻到来

4.5万亿元！ASML市值冲上欧洲之巅 一台EUV光刻机近26亿元

A股收评：创业板指下跌3.69%，空间计算概念表现强势

非农数据击碎华尔街降息幻想，美股、黄金大跌

最新评论

财联社

热门推荐

企业资讯

国家层面首次系统性部署高质量数据集成物理 AI 时代“新石油”

凯盛科技：TGV技术仍处于前期研发阶段暂未实现任何营业收入

4.5万亿元！ASML市值冲上欧洲之巅一台EUV光刻机近26亿元