AI 虽然可以自动运作许多工作,的确是一项划时代变革,但是现在企业面对 AI 已经不是用不用的问题,而是太贵,企业想要拥抱 AI,却受限於预算。Alphabet 执行长称,现在才 5 月,一些全球最大的公司就已经花光全年的 AI 预算,现在企业开始呼吁员工,使用 AI 要把钱花在刀口上。
AI 不只会回答问题,还会根据问题需要来执行任务,譬如 AI 客服会帮客户预约、写程式、管理文件,但每一项任务都涉及复杂的运算,每一笔运算都要钱。AI 公司用来向客户计费的基本单位称为代币 (token),一个任务消耗的代币数量,可能是发送一条简单聊天讯息的几十倍。
尤其是在开发者圈子里,使用 AI 进行程式设计等工作的成本呈指数级增长。有些公司急於使用 AI,以至於过度使用,陷入一种被称为「tokenmaxxing」的狂热使用模式,因为过度使用,有些企业甚至发现代币的成本,在使用一两个月后就超过员工的成本。
员工自己要动点脑
外媒分析,一些公司将 AI 做为生产力实验项目纳入预算,但他们发现,他们低估 AI 做为营运基础设施的成本。如 Uber 就在在短短四个月内,就花光 2026 年全年的程式开发工具 Claude Code 和「思考预算」(Thinking Budget)。
工程师可以直接在命令列中使用 Claude 来分析专案、阅读多个档案并自动生成或修改程式,而 Thinking Budget 是指 AI 在回答问题前,分配给它进行「深度推理」的运算资源或 Token。但是想得越久、消耗的 Token 越多,使用者的费用或点数消耗得越快。因此系统或开发者必须控制「思考预算」来平衡品质与成本。
微软取消体验与设备部门所有 Claude Code 的授权许可,统一改用微软自家的 GitHub Copilot,除了安全,也是顾虑成本。今年稍早鼓励员工尽可能使用代币来衡量生产力的 Meta,也开始重新考虑这个问题,首席技术长称,任何人都不应该为了使用而使用 AI 工具。
市场寻找专业小型模型
为了降低成本,一些公司正在转向免费、开源的 AI 模型,任何人都可以下载这些模型,虽然不如 ChatGPT 或 Anthropic 的 Claude 强大,但足以完成许多任务。
另一些人则转向规模较小、更专业的模型,这些模型是为房地产或金融等特定行业设计。市场上已经出现来自各大实验室的小型化、高速化、低成本的 AI 产品。专家估计,巨型通用模型的价格是每百万个代币 15 美元,迷你模型可以把价格降到 5 美分左右。Alphabet 也推出 Gemini 3.5 Flash,价格只有同代旗舰版本的三分之一。
AI 成本管理竞赛开始
总之,AI 正变得越来越像一种商品,具体的模型不再那麽重要,重要的是找到价格合适的合适模型,因此 AI 成本管理逐渐成为一门独立的专项,能够将模型能力与任务复杂度相匹配的公司,将比那些为所有任务部署最强大模型的公司拥有结构性的成本优势。
但这不代表句通用模型没有市场了,最顶尖的用户总是愿意为最好的东西付费。专家预期,随着 AI 从基础建设迈向「落地应用」的下半场,AI 已经是一个愈做愈大的市场大饼。