美国 AI 公司 Lindy 全量切换 DeepSeek：推理成本曾超员工薪资

旧金山 AI 公司 Lindy 创始人 Flo Crivello 在 X 上宣布，已将公司全部业务流量从 Claude 迁移至 DeepSeek v4，每月节省数百万美元成本。这是 DeepSeek 生态近期一系列变化的缩影：除了模型本身，企业级推理加速工具 DSpark 与离线路由工具 Wayfinder Router 也在 6 月底陆续开源，指向同一个方向——把 AI 用得更快、更便宜。

账单高过工资

Lindy 是一家几十人规模的 AI 原生应用公司。Crivello 在 4 月就公开表示，公司每月付给 AI 厂商的费用已经超过 payroll（员工工资总额）。团队在六到九个月里评估了多款模型，中间还看过 Kimi K2.5 和 GLM-5.1，最终选定 DeepSeek v4。

迁移工作量超出预期。Crivello 形容是「100x more work than we thought」，需要在线评估、离线评估、逐步灰度上线，并反复调整提示词。结果上看，在邮件分类、按语气预写回复等 Lindy 核心场景，DeepSeek 表现优于 Claude；但 Crivello 也承认，在复杂的自动化流程上，Claude Sonnet 仍然更强。

切换完成后，成本曲线呈「断崖式下跌」——Crivello 原话是「You should see our AI cost curve right now. It's a cliff.」。Lindy 的解释是：对邮件分类、日程管理、高频自动化等企业日常任务而言，大模型的参数冗余意味着更高的延迟与成本，DeepSeek 在这些场景做了速度与实用性的针对性优化。

速度提升六成

6 月 27 日，DeepSeek 开源了 DSpark 投机解码框架。该框架不发布新模型，而是在 V4 现有权重上附加一个草稿模块，通过半自回归生成实现无损加速。官方数据显示，在生产环境下，V4-Flash 每用户生成速度提升 60% 到 85%，V4-Pro 提升 57% 到 78%；离线测试中，接受长度比 Eagle3 高 26% 到 31%。

同期更新的还有 Wayfinder Router，一个完全离线的模型路由工具。它通过分析提示词的结构特征（长度、标题、代码块等），在微秒级决定走本地模型还是云端 API，路由过程无需调用其他模型。

两个工具的指向一致：一个让模型「跑更快」，一个让企业「花更少」。它们都不追求参数上限，而是把「够用且便宜」做到极致。

分层用模成新趋势

Lindy 的个案放到更大背景下看，并非孤例。5 月份 Vercel 的 AI Gateway 数据显示：DeepSeek 的 token 流量占比从不到 1% 跳到 17%，但收入占比几乎没动——它承接的几乎全是低价高频的「体力活」。

这折射出企业用模策略的转变：高难度推理、复杂自动化、合规敏感场景继续交给 Claude；高频低复杂度、对延迟敏感、成本压力大的任务，交给 DeepSeek 等性价比更高的模型。两种模型各司其职，而非相互替代。

过去，企业选用 DeepSeek 多带有「降级备选」的无奈；当开源模型的速度追上闭源、价格仅为几分之一时，「性价比」本身已成为核心竞争力。Lindy 那条断崖下跌的成本曲线，既记录了一家供应商的更换，也是一家美国公司用脚投票的真实选择。