APP下载

关于ZAKER

Skills 合作

财联社 37分钟前

DeepSeek-V4，来了

今日，Deepseek 宣布，其全新系列模型 DeepSeek-V4 的预览版本正式上线并同步开源。

《科创板日报》获悉，昇腾超节点系列产品全面支持，本次通过双方芯模技术紧密协同，实现昇腾超节点全系列产品支持 DeepSeekV4 系列模型。

DeepSeek-V4 模型按大小分为 Deepseek-V4-Pro（专家模式）和 Deepseek-V4-Flash（快速模式）两个版本，均拥有百万字超长上下文，且同时支持非思考模式与思考模式。

据介绍，DeepSeek-V4-Pro 的知识储备和推理能力优秀。其在世界知识测评中，大幅领先其他开源模型，仅稍逊于顶尖闭源模型 Gemini-Pro-3.1；在数学、STEM、竞赛型代码的测评中，DeepSeek-V4-Pro 超越当前所有已公开评测的开源模型，取得了比肩世界顶级闭源模型的优异成绩。

相比 DeepSeek-V4-Pro，DeepSeek-V4-Flash 在世界知识储备方面稍逊一筹，但展现出了接近的推理能力。而由于模型参数和激活更小，相较之下 V4-Flash 能够提供更加快捷、经济的 API 服务。

据官方介绍，DeepSeek-V4 预览版具备两大亮点——

Agent 能力大幅提高：相比前代模型，DeepSeek-V4-Pro 的 Agent 能力显著增强。在 Agentic Coding 评测中，V4-Pro 已达到当前开源模型最佳水平，并在其他 Agent 相关评测中同样表现优异。下图为 V4-Pro 在某 Agent 框架下生成的 PPT 内页示例：

目前 DeepSeek-V4 已成为公司内部员工使用的 Agentic Coding 模型，据评测反馈使用体验优于 Sonnet 4.5，在代码任务、文档生成任务等方面表现均有提升，交付质量接近 Opus 4.6 非思考模式，但仍与 Opus 4.6 思考模式存在一定差距。

结构创新和超高上下文效率：

DeepSeek-V4 开创了一种全新的注意力机制，在 token 维度进行压缩，结合 DSA 稀疏注意力（DeepSeek Sparse Attention），实现了全球领先的长上下文能力，并且相比于传统方法大幅降低了对计算和显存的需求。从现在开始，1M（一百万）上下文将是 DeepSeek 所有官方服务的标配。

DeepSeek-V4 和 DeepSeek-V3.2 的计算量和显存容量随上下文长度的变化

目前，DeepSeek API 已同步上线 V4-Pro 与 V4-Flash，支持 OpenAI Chat Completions 接口与 Anthropic 接口。两版本价格如下：

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

ZAKER旗下免费视频剪辑工具

企业资讯

查看更多内容

Blockchain News

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

DeepSeek-V4，来了

宙世代

一起剪

相关阅读

网约车“老三”也要上市了，一年营收171亿，超八成订单却握在高德们手中

一级市场流行“拼单”

A股午评：创业板指跌超2%，锂电产业链逆势走强

英特尔：告别 “至暗” 时刻，老霸主打响 “反击战”

《商业航天标准体系(1.0版)》发布，航空航天ETF华夏（159227）成交额稳居同标的第一，天和防务涨超9%

光刻机之王挥动了翅膀，全球AI基建酝酿风暴

受婴配粉风波影响，雀巢在华销售下滑

由于对AI的担忧，这些软件和数据公司受到了过度惩罚

GE Aerospace股价在财报发布后下跌，花旗称应逢低买入

首晒行使表决权情况，公募担当“积极股东”角色

日经225指数开盘上涨0.44% 韩国KOSPI指数涨0.40%

回调获资金布局！有色金属ETF天弘（159157）昨日逆势获净申购近9000万份，标的指数收跌3.75%

AH溢价“倒挂”四问，硬科技凭什么更贵

云铝股份等股一季度业绩大增；大金重工签下40亿大单

爱尔眼科：拟发行H股股票并在香港联交所主板挂牌上市

最新评论

财联社

热门推荐

企业资讯