

整理 | Tina
行为员们,先别忙着蹙悚 AI 会抢走你的饭碗。当今更该蹙悚的,可能是你们的 CTO 和 CFO 了:因为让 AI 写代码,实在太烧钱了。
Copilot 和 Claude Code,险些在团结时期,给行业踩了一脚刹车。
今天(4 月 28 日),GitHub 告示从 2026 年 6 月 1 日起,GitHub Copilot 将告别"无尽痛饮"模式,将 Copilot 从"按申请计费"转为"按使用量计费"。

险些团结时期,Anthropic 闭幕了 Claude Code 中 Opus 模子的探询,每月 20 好意思元的 Pro 用户想持续用?请零星付费。


这就引出了一个绕不开的问题:用 AI 写代码花的钱,哪天会比径直雇一个行为员还贵?如今这个转动点,仍是不远了。
从"自助餐"到"按粒收费"
先望望 GitHub Copilot 加价的进度。
GitHub Copilot 正本的模式是按"申请次数"计费,你问一句"怎么写快排"和让 AI 替你跑一个小时的自主编码会话,耗尽的额度是相同的。因此,需要多量"想考"的复杂辅导常常会使 GitHub 的成本卓越其赢得的订阅费收入。GitHub 居品团队首席居品官 Mario Rodriguez 在今天的博客中坦言:" GitHub 仍是招揽了太多推理成本,现时模式不能合手续。"
这种压力,其实仍是驱动体当今更早的动作里。GitHub 上周仍是开释出一个信号:为了止住合手续扩大的亏本,公司暂停了 Copilot、Pro、Pro+ 以及 Student 套餐的新用户注册。
在这样的布景下,计费逻辑驱动绝对重写。从 6 月 1 日起,新模式下一切以 token 为单元。GitHub 推出了我方的捏造计费单元, " GitHub AI Credits ",每个 Credit 价值 0.01 好意思元。Copilot 用户在使用经由中会耗尽输入 token、输出 token 以及缓存 token,这些皆会字据所使用的模子分别计价,最终统一折算为 AI Credits。
订阅价钱名义上没变:Copilot Pro 仍是每月 10 好意思元,每月 1000 Credits。Pro+ 是 39 好意思元,每月 3900 Credits。用完之后,要么缔造逾额预算持续付费,要么等下个月额度重置。
着实空泛的是,token 账单很难提前算清。一次申请会"想"多久、调用若干器具、读若干陡立文、生成若干内容,用户事先并不知说念。GitHub 也意志到这少量,只可先给少量"蒙眬的可见性"。Rodriguez 潜入,公司将在 5 月初推出"用度预览"功能,让用户和惩处员在 6 月 1 日厚爱切换前,能够看到预估成本。
关于按年订阅的用户,不错接受提前取消并按比例退款,或者在订阅到期后左迁为 Copilot Free ——这些年费套餐将不再支持续订。况兼那些坚合手用完年费订阅的用户 ,将会显明感受到高端模子价钱的高涨。 举例,Anthropic 的 Opus 4.7,在原有按申请计费模式下的倍率为 7.5 倍,将来将训诫至 27 倍;OpenAI 的 GPT-5.4,也将从 1 倍高涨到 6 倍。


是以 GitHub 的调遣,相配于承认了:之前是在亏本闪开拓者"薅羊毛",当今要把高阶模子着实的推理成本转嫁且归。
Anthropic 也相同。 本月初,数百万 OpenClaw 用户发现这款爆火的 AI 代理器具 被 Anthropic 严重闭幕了。当今 Claude Code 也一并改了法例:每月 20 好意思元的 Pro 用户想持续用 Opus 模子?得零星付费。(天然自后有 Claude 工程师说这是之前的文献,但空洞各方看法,很可能是因为之前的 ab 测试激起了用户情谊,Anthropic 被动收回收费计谋,况兼 20 好意思元套餐极易触发时长闭幕。)负责东说念主 Boris Cherny 曾经直言:"订阅模式本就不是为这种使用强度贪图的。"翻译成东说念主话:OpenClaw 这些器具 7×24 小时跑 Agent,咱们扛不住了。
轮到用户填这个"无底洞"了
往时几年,AI 公司一直用接近"自助餐"的花式推广:廉价,以至免费,让更多东说念主先用起来,把限制作念大。
在这个阶段,主流作念法是按东说念主头收费,本色上是一种"平均成本"的模式。也即是说,不管一个东说念主每天跑几个 agent,如故一周只问两次问题,平台皆按团结档订阅费来收。高频用户多出来的成本,会被低频用户摊掉,也会被平台我方招揽。订阅制本色上是在用"平均成本"诡秘这种极不平衡的使用。
可一朝 agent 普及,澳门十大赌城官方网站这个模子就会赶紧失效。是以 Copilot 和 Claude Code 当今作念的,其实是把往时被平均掉、被平台招揽掉的成本,从头按 token 拆回到每一次确切使用上。
某种进度上,这并不簇新。 它像是 2010 年代科技焕发的重演:当年风险投资鼓舞网约车、电商、外卖、即时配送,用补贴换增长。一朝公司站稳脚跟,就驱动提价、拓展收入、为投资东说念主罢了薪金——天然,也有不少没撑住径直崩盘的。
但 AI 烧钱的速率,比近几十年任何一个行业皆快。 AI 公司在全球砸下数据中心,插足数万亿好意思元,愉快更强的模子、更低的成本、以及"东说念主东说念主可用的 AI "。可实践是,哪怕仅仅止住亏本皆很难,更别说实现投资东说念主期待的薪金了。
有外媒在分析这一轮 AI 本钱激越时,征引了 Gartner 的一组数据。分析师 Will Sommer 估算,2024 到 2029 年,全球 AI 数据中心的本钱插足将达到 6.3 万亿好意思元——差未几是好意思国一年 GDP 的四分之一。为了幸免钞票减值,厂商需要简短 25% 的投资薪金率(像亚马逊、微软那种水平)。若是薪金低于 7%,即是"对总计投资者的可怜"。
要达到那根最低 7% 的红线,大型 AI 公司到 2029 年需要累计赚出接近 7 万亿好意思元的 AI 收入,相配于平均每年 2 万亿好意思元。若是想实现"历史性薪金",这个数字要提高到 8.2 万亿好意思元。
那这些钱要从哪来?只可靠卖 token。
Token 是 AI 合股和处理数据的最小单元,不错是笔墨、图片或声息。往交游说,一个 token 简短对应英文中的 3 到 4 个字符,一篇 1500 字的著述简短 2050 个 token。问题是,要赚到每年 2 万亿好意思元,需要处理的 token 数目大到造作。手脚对比,谷歌曾潜入它每月处理约 1.3 千万亿(quadrillion,也即是 1 背面 15 个零)个 token。把总计厂商加一齐,每年大意处理 100 到 200 千万亿个 token。
但 Gartner 算了一下:要实现年入 2 万亿好意思元,算上每个 token 简短 10% 的利润率,token 的耗尽量需要在将来几年增长 5 万到 10 万倍——也即是从当今的每年百万亿级,开云体育app跳到每年 1 背面 21 个零 阿谁级别(sextillion,浅薄说,比当今多五位数)。
问题是,当今的公司根柢莫得才略处理这样多 token。它们正在拚命成立数据中心,但算力依然病笃。即便有才略处理,它们也濒临另一个问题:这些 token 很可能是亏钱的。
Sommer 估算,若是只臆测基础设施和电力成本,"每个 token 的利润看起来还算合理"。但跟着模子越来越复杂、token 耗尽越来越大,这个利润空间正在赶紧收窄,以至灭绝。而一朝把波折成本算进去——举例扩建算力以及束缚检会下一代模子的"天文级"支出——这些利润险些被统统吞吃。
"当你把下一代模子所需的基础设施成本也算进去,这个模式就越来越站不住脚。" Sommer 有计划,市集整合险些不能幸免,每个区域最终可能只剩不卓越两家大模子厂商。
是以,清脆的免费额度时期,也该收尾了。对那些免用度户许多的 AI 实验室来说,问题从来不是"要不要变现",而是"什么时候驱动、下手多重"。它们但愿 token 用量持续增长,但成本要么我方扛,要么转嫁给用户。这亦然为什么如今 GitHub Copilot 和 Anthropic 必须烧毁订阅制的原因。
铺张不能幸免,成本靠近临界点
AI 公司不得不把成本转嫁给用户,但问题是,许多 token 本来即是被"白烧"掉的:一部分来自技巧机制,一部分来自职工内卷。
在 AI 发展的早期,大部分算力成本皆花在模子检会上,而推理相对低廉。但跟着模子才略训诫、系统功能束缚叠加,推理阶段的资源耗尽仍是显赫上升。尤其是 AI agent ——那些但愿能够替用户完成复杂、多方法任务、而不需要合手续东说念主工侵扰的器具——比拟几年前的基础聊天模子,会耗尽成倍增长的 token。
你输入一句话,Agent 就在后台责任中耗尽多量 token:推演不同旅途、启动子 agent 去完成子任务,或者对每一步着力进行考证。这些你根柢看不见,但每一笔皆算在账单上。更空泛的是,Agent 一定会产生"无效 token ":走错路归还来、反复查验却不改东西、以至停驻来"给我方写首诗"。通盘行业皆在起劲减少这种铺张,但短时期内没戏。
那这些 token 到底烧在哪了?
领先是最基础的输入 token 和输出 token。输出常常比输入贵 2 到 6 倍——因为生成是串行的,输入不错并行。这个价差不是松懈定的,是物理层面的各异,即生成比读取更难。
着实烧钱的是推理 token。当你使用带"深度想考"的模子时,它不会径直给谜底,而是先"想考",生成千千万万 token。一个浅薄数常识题,最终谜底可能唯有 200 个 token,以至只输出一个" 42 ",但模子里面可能生成了上千以至几千个推理 token。你的账单是"推理 token + 输出 token "的总额。推理 token 仍是成为一个新的市集分层,高等推理,即是更高价钱。
还有一类正在拖垮许多 Agent 系统的,是器具调用 token 和系统 token。给模子接入器具时,你必须把器具的 JSON schema 一齐发往时。10 个器具,加上齐全形容,每次调用就多出 3000~4000 个 token,况兼不管是否真用到,成本皆会发生。更致命的是 Agent 的轮回调用:想考→调器具→读着力→再想考 …… 可能跑 6 到 15 轮。一个 50 token 的用户问题,最终可能耗尽卓越 10 万 token。不建模的话,最终账单会切身"教师你"。
除此除外,还有视觉 token(一张截图比发一整页笔墨还贵)、音频视频 token(一小时会议灌音 18 万 token)、结构性 token(这是"看不见的脚手架":序列驱动 / 收尾标记、分歧 system/user/assistant 的变装 token、batch 处理时的 padding token、以及各式模式触发 token)。
技巧上的铺张仍是够头疼了,更厄运的是,一些企业还在主动放大这种铺张。
tokenmaxxing 这个看法最早在硅谷流行起来,但传播速率很快。职工拚命耗尽更多 token,以此解说我方"深度拥抱 AI "。Visa 跋扈地告示,它的 token 使用量从 2 月的 1 万亿翻到了 3 月的 2 万亿。摩根大通和迪士尼里面以至设有状貌盘,挑升跟踪职工用了若干 AI 代币。谁耗尽得多,谁就显得更"前沿"。
本年 4 月,Meta 里面出现了一个叫 Claudeonomics 的名次榜,跟踪全公司 8.5 万东说念主的 AI token 耗尽,只展示前 250 名。为了冲榜,有东说念主让 Agent 跑几个小时,有东说念主一次性跑几十个用例,还有东说念主径直写无尽轮回剧本——让 AI 束缚调用我方,一晚上刷出几十亿 token。30 天内,全公司烧掉了 60 万亿 token,按公开订价估算相配于 9 亿好意思元。排名最高的个东说念主,一个月账单接近 200 万好意思元。
这些数字放在一齐,会逼出一个更径直的问题:东说念主和 AI,到底哪个更贵?
往时全球默许 AI 低廉,是因为确切成本被补贴和平均掉了。Copilot 每月十几好意思元、Claude Code 每月几十好意思元,看起来天然比一个工程师低廉。当今 token 驱动逐笔计价,这个账就变了。假定一个工程师年空洞成本是 25 万好意思元,折到每月简短 2 万好意思元。若是一个 AI 器具每月花 1000 好意思元,但能褂讪替代 5% 以上的工程产出,那即是合算的;若是一个团队每月 token 账单烧到几万、几十万好意思元,却只换来一些类似尝试和无效产出,那 AI 反而比东说念主贵。
是以着实的问题不是" AI 要不要用",而是" AI 账单什么时候会卓越一个行为员的工资"。
在本年 2 月的一期播客里,硅谷着名天神投资东说念主、All-In Podcast 连续主合手东说念主 Jason Calacanis(曾早期投资 Uber、Robinhood 等公司)建议这个问题:token 成本什么时候会卓越职工工资?他说,"这个临界点,不是将来,是立时就会发生。"
那些重度使用 AI、万古期跑 agent 的开拓者,其实早已到了这个点。
同场的 Chamath Palihapitiya 也提到,他的公司仍是驱动给开拓者设定 token 预算。按他的说法,单个 agent 通过 Claude API 跑起来,一天就可能花掉 300 好意思元,一年即是 10 万好意思元。团队必须至少训诫 2 倍坐褥力,智力诡秘"工资 + AI 账单"的总成本。
不然,AI 不是降本器具,而是新的成本黑洞。
参考招引:
https://github.blog/news-insights/company-news/github-copilot-is-moving-to-usage-based-billing/
https://docs.github.com/en/copilot/reference/copilot-billing/models-and-pricing#model-multipliers-for-annual-copilot-pro-and-copilot-pro-subscribers
https://x.com/i/trending/2048906922825519314
https://www.theverge.com/ai-artificial-intelligence/917380/ai-monetization-anthropic-openai-token-economics-revenue
https://www.youtube.com/watch?v=JK6QnFKv080
https://www.youtube.com/watch?v=CnaegIpkenA开云官方体育app
博亚体育中国官网入口
