36 氪获悉,中信证券研报称,AI 从 " 简单对话 " 向 " 智能体(Agent)" 演进,驱动上下文长度激增。据 Epoch AI 数据,最长上下文窗口约每年增长 30x,KV Cache 显存容量和上下文长度呈线性增长关系,远超硬件配置增速。目前大模型厂商、硬件厂商主要通过量化、分层存储、模型架构优化的方式解决存力瓶颈,但仍不改显存需求爆发。中信证券认为,显存优化有望降低单 Token 生成成本,进而刺激用户开启更高并发与更长上下文,总存力需求将不减反增,存力升级为当前 Agent 推理核心需求,坚定看好存储成长趋势。
36氪
昨天
中信证券:存力升级为当前智能体推理核心需求,坚定看好存储成长趋势
最新评论
没有更多评论了