

摘录:
DeepSeek 与国产算力协力,实现 token 成本的大幅缩小后,又会反向利好 AI 诓骗市集,催生更大的市集空间。
作家|Dale、姜凡
剪辑|董雨晴

两天两次降价,成果成了 DeepSeek 最深护城河
2026 年 4 月的终末一个周末,中国 AI 产业被一连串音书透顶焚烧,而音书背后的主角唯唯独个,DeepSeek。
4 月 24 日,DeepSeek 认真发布 V4 系列预览版,同步开源 Pro 与 Flash 两款模子,均支捏百万 token 超长凹凸文。紧接着的 25 日与 26 日,DeepSeek 连气儿两晚起初降价——先是 V4-Pro 限时 2.5 折,再是全系 API 输入缓存掷中价钱历久降至首发价的相称之一。两天两次调价之后,V4-Flash 每百万 tokens 输入缓存掷中价钱仅为 0.02 元,V4-Pro 为 0.025 元,创下群众大模子价钱新低。

这么一场悉心规划的闪电战,背后是 DeepSeek 长达一年的艰辛求索。
但要是依旧将观点放在"价钱战"的浅层叙事,就低估了 DeepSeek 此番起初的深意。V4 的降价如故无对于烧钱换市集,其更大的意旨是底层架组成果创新带来的成本变化。正如高盛 Ronald Keung 团队在最新研报中所指出的," V4 的核情意旨在于以更低成本支捏更复杂的智能体诓骗落地,从而掀开 AI 诓骗范围化的新空间"。
在 DeepSeek-V4 的工夫申诉里,成果是极致的。
V4-Pro 在 100 万 token 凹凸文场景下,单 token 推理所需浮点运算量仅为 V3.2 的 27%,KV 缓存占用仅为 10%;V4-Flash 更为激进—— FLOPs 降至 10%,KV 缓存压缩至 7%。这意味着什么?平素地说,畴前跑一条百万字凹凸文需要三台机器的算力,面前一台机器就能镇静轻率,况且内存支拨仅是畴前的相称之一。
成果飞跃背后,有 V4 在架构层面的三项关节创新:夹杂把稳力机制(CSA/HCA)、流形不休超相连(mHC),以及 Muon 优化器。其中最中枢的冲破在于夹杂把稳力—— CSA(压缩稀疏把稳力)沿序列维度压缩 KV 缓存后践诺稀疏把稳力计较,每 m 个 token 的 KV 缓存被压缩为一笔纪录;HCA(重度压缩把稳力)则施加更激进的压缩战术,将 m' 个 token 的 KV 缓存合并为单笔纪录,但仍保留开阔把稳力。这套组合拳在险些不影响模子性能的前提下,将长凹凸文场景的计较与存储成本砍掉了一个数目级。
更精妙的盘算体面前细节处:对 KV 条款继承夹杂存储措施,旋转位置编码维度保捏 BF16 精度,其余维度使用 FP8 精度,澳门十大赌城官方网站这一项便将 KV 缓存容量压缩近半。闪电索引器里面的把稳力计较以 FP4 精度践诺,进一步加快长凹凸文下的把稳力运算。
工夫压缩成果,成果竣事成本。这才是 DeepSeek 勇于连气儿降价的委果底牌。
意会了这一逻辑,便能识破这次降价的产业含义:比拟于其他 AI 大模子降价拚命上桌,这一次 DeepSeek 径直用工夫上风主动构建了成本壁垒。V4-Flash 以 0.02 元 / 百万 tokens 的价钱横扫市集背后,每一分钱的降价齐有底层架构优化算作撑捏,而不是成本烧钱补贴的逻辑。竞争敌手要跟进,领先得在工夫上追平这份成果——而这彰着不是一旦一夕之功。

从模子等芯片,到芯片靠模子
与两次降价险些同步发生的,是国产芯片阵营的集体"起立"。
V4 发布当日,华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股份、昆仑芯、平头哥真武、天数智芯 8 家国产 AI 芯片品牌,以及英伟达,均布告完成对 DeepSeek-V4 的适配。尤其值得把稳的是,这是大模子产业初度实现" Day 0 "级别的全栈适配:模子发布即适配上线,芯片厂商不再需要数月的"追赶式"调试周期。
这里有一个细节必须拆解明晰。DeepSeek 官方在工夫申诉中暗示,"咱们在英伟达 GPU 和华为昇腾 NPU 两个平台上考证了细粒度 EP(群众并行)决策,在通用推理任务中实现 1.50 至 1.73 倍加快;在蔓延明锐场景下最高达到 1.96 倍"。这是 DeepSeek 历史上初度将国产芯片与英伟达 GPU 比肩写入硬件考证清单,开云体育app竖立平等地位。
华为昇腾的反映也相称迅猛。昇腾官方在 B 站直播中称,在推理部署层面,昇腾 950PR 平台针对 V4 实现了多项深度适配。量化方面,原生的硬件加快精度明确支捏 MXFP8 与 MXFP4 等低精度数据措施,兼顾模子精度与内存占用优化。算子层面,华为官方布告昇腾 950 通过会通 kernel 与多流并行工夫,大幅缩小了夹杂把稳力机制的计较和访存支拨,显耀晋升了推感性能。而 MoE 模块中路由群众与分享群众的计较交流等深度优化,则进一步确保了万亿参数模子在国产硬件上的高效稳妥运行。

图|昇腾直播间截图
寒武纪则在基于自研 NeuWare 软件生态与 vLLM 框架上,完成了对 V4 的" Day 0 "适配并同步开源自研算子库。这已是寒武纪连气儿第二次在 DeepSeek 新模子发布首日便推出适配决策,其工夫迭代速率相同辞让小觑。

更有劝服力的信号来自财务上的捏续好转,国产开源大模子的极速发展,正在把中国算力产业拉入良性发展的通谈里。
4 月 26 日晚,摩尔线程发布 2026 年一季报:一季度营业收入 7.38 亿元,同比增长 155.35%;归母净利润 2935.92 万元,同比扭亏为盈。这家被称为"中国英伟达"的国产 GPU 厂商,此前因研发参加高达营收 86.68% 而备受市集质疑,如今终于交出了一份逆转的答卷。与此同期,摩尔线程还与某客户坚硬了金额达 6.6 亿元的夸娥智算集群销售契约。
寒武纪此前发布的年度功绩快报亦走漏已率先实现盈利,沐曦股份则呈现出赔本捏续收窄的态势。三家国产 AI 芯片代表企业同步进入功绩改善通谈,如故是相称有劲的回复。

国产算力生态临界点的到来
当 DeepSeek 的工夫成果创新与国产芯片的产能开释在统一时候窗口交织,一条齐备的产业闭环驱动浮出水面。
中银外洋在 4 月 26 日发布的研报中判断:" DeepSeek V4 的发布记号着国产大模子已基本跑通全栈国产化,表面上已变成从底层硬件、基础软件、平台劳动到表层诓骗、安举座系的齐备工夫链条,国产算力板块或迎来我方的质变临界点。"
反过来看,DeepSeek 与国产算力实现协力,在大幅缩小 token 成本后,又会反向利好 AI 诓骗市集,催生更大的市集空间。
据华泰证券表述,"市集容易将 V4 意会为‘降本压低算力、存储需求’,但更进击的角落变化在于长凹凸文成本下过期,复杂 Agent、多文档分析、长周期任务、在线学习等场景可用性晋升,推理调用量与存储探听频次有望膨大。"换句话说,降价不会缩减蛋糕,还会作念大蛋糕——越低廉用得越凶,总调用量反而会暴增。
相同在 4 月 24 日,新版块 OpenClaw 发布,径直接入了最新的 DeepSeek V4 双版块,并将 V4 Flash 成立为了默许大模子。

据 OpenRouter 平台数据,DeepSeek V4 flash 本日调用量较前一天高潮了 62%。
值得一提的是,DeepSeek 已明确将华为昇腾 950 超节点量产纳入其交易旅途,并预报下半年实现大范围供货后 API 订价将迎来显耀下落。这意味着现时的降价可能仅仅一个预报,委果的主菜还在背面。
成本市集已作出厉害反映。4 月 27 日早盘,A 股算力芯片倡导络续强势,CPU 宗旨领涨,海光信息、摩尔线程等跟涨;港股半导体板块领涨,澜起科技涨超 6%,中芯外洋涨近 5%。产业链凹凸游——从芯片盘算到劳动器整机,从算力租借到 AI 诓骗——齐在再行订价这一历史性的产业变局。
这个 4 月,DeepSeek 以一组硬核成果数据为矛、以两次精确降价为饱读开云app,打出明牌—— AI 的长凹凸文期间如故到来,而它的"高速公路"将由国产算力铺就。对那些刚刚登陆科创板的国产芯片企业而言,这个春天如实比往年齐暖。
加拿大PC中国官网入口
