
作者丨吴思梦
编辑丨岑 峰
7 月 6 日– 11 日,第 43 届国际机器学习大会(ICML 2026)将首次落地韩国首尔 COEX 会展中心举行,会议主题为"Machine Learning for the Real World",强调机器学习在真实场景中的落地。

根据计算机科学会议统计看板 CS Conf Stats 的最新数据显示,今年共接收论文 6352 篇(常规主赛道论文),102% 的增幅,接受率 26.6%,与去年的 26.9% 基本持平。
23918 篇投稿,6352 篇接收,26.6% 接受率,Spotlight 占比 2.2%,Oral 演讲占总投稿数的 0.7%—— ICML 创办 43 年来,还没有哪一年的投稿量像今年这样翻倍式增长。而在投稿量翻倍的前提下维持接受率,也传递出会议正在主动扩容的讯号。
除此之外,今年两项全新的制度调整,为学术社区带来了透明度的实质性变化:其一是参会展示改为可选,接收论文作者可以选择仅以论文集形式收录,在会议记录中享有同等地位且均可参评奖项。其二是原始投稿版本将被公开,包括匿名评审意见、作者 Rebuttal 及审稿人、作者讨论内容。
01
三大趋势重塑行业走向,具身模型成热门
把近三年 ICML 的热点关键词串联起来,机器学习的转向脉络会格外清晰:2024-2025 年的热点 "Transformer 变体、PEFT 微调、扩散模型优化 " 已日渐饱和,纯粹的增量改进在 ICML 极难生存。2025 年底以来谈论最多的的红利方向,诸如 Alignment、Agent、可解释性、测试时训练(TTT)正在成为今年论文的主体。而当前正在抢占的战略高地,是具身智能的世界模型、科学计算的深水区,以及可信 AI 的政策框架。
如果说论文数量反映的是 " 关注度 ",那论文方向的变化反映的是 " 行业焦虑 "。从今年 ICML 论文反映的技术版图里,有三个不可忽视的信号:
▎ LLM 推理:从 " 更大模型 " 到 " 更好思考 "
通过对 OpenReview 中录用论文的 Keywords 进行全量文本检索,我们发现 LLM 相关论文占今年接收论文的近 20%,如果算上对齐、安全、Agent 等间接相关方向,比例超过 30%。但真正值得关注的是研究性质的变化。
LLM 相关论文占今年接收论文的近 20%,算上对齐、安全、Agent 等间接相关方向,比例超过 30%。但数字不是重点——重点是研究性质的根本变化:不再堆参数,更多的是堆 " 思考 "。
多篇论文追问同一个问题:在推理阶段投入更多计算资源,能否超越单纯增大参数量?有研究者将 MCTS(蒙特卡洛树搜索)引入 LLM 推理,提出预算感知的搜索策略;也有人从信息论视角分析隐式思维与显式思维链的边界,追问一个更根本的问题,即模型在 " 不说话 " 的时候,到底能不能推理?
强化学习(RL)以 886 篇论文成为今年 ICML 第一大方向,PPO 系列独占 201 篇。DeepSeek-R1 背后的 GRPO 技术被多篇论文进一步变体化,研究者正拆解它为什么有效、能否跨场景复现。中国的工作正在被系统性地引用和分析,这个信号比论文数量更重要。
▎ AI 安全正在理论化
114 篇 AI 安全论文,使安全成为 ICML 2026 第三大热门方向。CML 2026 的 6 位 Invited Talk 演讲者中,有 3 位—— Verena Rieser(Google DeepMind)、Arvind Narayanan(普林斯顿)和 Pascale Fung(港科大)——的核心研究方向都直接涉及 AI 安全、对齐或社会影响。

Pascale Fung 、Susan Athey 、Sham Kakade 、Aviv Regev、Verena Rieser 、Arvind Narayanan
今年的安全研究呈现出 " 攻防升级、方法论深化 " 的特征。越狱攻击方面,从激活引导到自适应攻击,研究者正在系统化地揭示 LLM 的脆弱性边界,安全研究正在从经验主义走向理论化。
对齐方法上,DPO 变体继续涌现,但同时有工作追问一个被长期忽视的问题:让模型更 " 对齐 " 人类偏好,会不会损害它的推理能力和置信度校准?这不再只是一个锦上添花的优化问题,还是直接影响模型可靠性的基础命题。
▎模型压缩与扩散加速并行
116 篇模型压缩论文,仅次于图像生成,位列第二。背后是一个产业级的焦虑:大模型太贵,开发者苦 token 久矣。
KV 缓存优化是今年最热的子话题,从关键 token 选择到缓存复用策略,研究者正试图解决 LLM 推理中最核心的内存瓶颈。MoE 架构创新同样活跃:可微最优传输驱动的 Dense → MoE 转换、正交增长策略等方案,目标一致,试图在不损失质量的前提下降低推理成本。
这个方向的升温传递出一个清晰的产业判断:模型的能力竞赛远未结束,但 " 能不能用得起 " 已经从工程问题变成了核心研究问题。
另一个有趣的方向是扩散 LLM 的加速。扩散模型相关论文 446 篇,扩散模型用于文本生成本身就比自回归更慢,但它在可控生成和多模态融合上有独特优势。ICML 2026 上出现的自适应缓存、并行解码、熵感知分束等方法,正在缩小扩散 LLM 与自回归 LLM 之间的效率差距。
除了上述三大趋势,今年的论文版图上还有两个方向增速惊人。
AI for Science 方向约 860 篇论文,占总量 13.5%。从基因组序列基础模型 dnaHNet,到形式化数学自动证明 APE-Bench,AI 正在从 " 辅助科研工具 " 变成 " 科研的主体参与者 "。具身智能方向约 420 篇,增长势头最猛。斯坦福团队提出的 VLAW 方法,让视觉 - 语言 - 动作策略与世界模型迭代协同改进,在真实世界操作任务中实现 39.2% 的性能提升——从虚拟环境走向物理世界,是今年最值得产业界关注的信号之一。
02
中国研究者的 ICML 时刻
张潼——现任 UIUC 计算机系教授,曾任腾讯 AI Lab 主任、百度研究院副院长,担任本届 ICML 大会主席(General Chair),也是 ICML 历史上首位华人主席。清华、北大、中科院、浙大、上交在接收论文作者列表中的出现频率逐渐增加,据官网公开报道,北京大学、上海交通大学各有 9 篇高水平论文成功入选,浙江大学 3 篇。

中国研究者开始在具体方向上不只是做增量改进。一个具体的标志是 DeepSeek。过去一年里,DeepSeek-R1 让整个社区重新审视 " 低成本高性能 " 的技术路线。原来不一定要堆几万张卡,也能做出有竞争力的推理模型。今年 ICML 接收论文中,至少有数十篇在正文中直接引用 DeepSeek 的工作。中国研究者正在从 " 跟随者 " 变成 " 被引用者 ",这个转变虽然刚发生,但方向是清晰的。
多模态方向同样值得关注。Qwen-VL(阿里)、InternVL(OpenGVLab/ 复旦)、DeepSeek-VL 等系列工作,使中国机构在视觉 - 语言模型方向上形成了从架构、训练到评测的完整贡献链。企业侧,据公开信息,腾讯、阿里、字节、百度、华为均有论文被接收,且涉及核心算法创新而非仅仅是工程实现。华为昇思和百度飞桨在系统层面的贡献,也开始获得国际同行的实质性引用。
差距当然还在。美国在基础理论上的积累、欧洲在概率方法与理论方向上的深度,仍然明显领先。但中国研究者的参与方式正在发生变化,在一些前沿方向上开始定义问题。这个变化虽然温和,但是结构性的。
03
为什么今年的 ICML 格外值得关注
今年的 ICML 有一种 " 分水岭 " 的气质。
投稿量翻倍这个事实本身就说明,AI 研究的生产力正在发生质变。无论是 LLM 辅助写作带来的效率提升,还是 AI 从业者群体本身的膨胀,23918 篇投稿是一个不可逆的临界点。
技术方向上,我们正在见证从 " 预训练驱动 " 到 " 后训练驱动 " 的范式转移。LLM 推理、测试时计算、AI 安全、对齐方法的集中爆发,本质上都在回答同一个问题:当模型已经足够大,下一步做什么?ICML 2026 给出的答案是:让模型学会思考,让模型学会安全,让模型变得高效。
另一个值得留意的信号是今年 ICML 上出现了多篇 Position 论文——这类论文不报告实验结果,而是提出 " 我们认为领域应该这样做 " 的观点性主张,涉及 Agent 实验规范、可解释性标准、辅助 AI 的个性化范式等。
最后,雷峰网 · AI 科技评论将派团队前往首尔,全程报道 ICML 2026!带着中国视角,实地去判断哪些方向真正值得产业关注,而哪些只是纸上谈兵。
一个人读论文太孤单,一群人刷顶会才好玩。
ICML 2026 召开在即,我们正在召集一波含金量极高的 AI 研究者。群内主打实时论文跟踪与硬核技术探讨,拒绝灌水。
? 进群传送门: 扫码进群或添加微信 Vin_Vivid,备注:论文群 + 关注的 AI 方向。
搞科研 / 搞技术,信息差很重要。
来,一起快人一步!
上车,带你看遍全球 AI 顶会精华
可独家畅览:
专家演讲 PPT
大会报告全文
热门论文解读
学术新星访谈
扫描上方二维码
或点击「阅读原文」关注专区。