美国 AI 公司 Lindy 全量切换 DeepSeek:推理成本曾超员工薪资
美国 AI 创业公司 Lindy 宣布将全部业务从 Claude 迁至 DeepSeek v4;DeepSeek 同期开…
- 重要性
- 63
- 新颖性
- 55
- 影响面
- 60
- 可信度
- 72
- 实质性
- 75
旧金山 AI 公司 Lindy 创始人 Flo Crivello 在 X 上宣布,已将公司全部业务流量从 Claude 迁移至 DeepSeek v4,每月节省数百万美元成本。这是 DeepSeek 生态近期一系列变化的缩影:除了模型本身,企业级推理加速工具 DSpark 与离线路由工具 Wayfinder Router 也在 6 月底陆续开源,指向同一个方向——把 AI 用得更快、更便宜。
账单高过工资
Lindy 是一家几十人规模的 AI 原生应用公司。Crivello 在 4 月就公开表示,公司每月付给 AI 厂商的费用已经超过 payroll(员工工资总额)。团队在六到九个月里评估了多款模型,中间还看过 Kimi K2.5 和 GLM-5.1,最终选定 DeepSeek v4。
迁移工作量超出预期。Crivello 形容是「100x more work than we thought」,需要在线评估、离线评估、逐步灰度上线,并反复调整提示词。结果上看,在邮件分类、按语气预写回复等 Lindy 核心场景,DeepSeek 表现优于 Claude;但 Crivello 也承认,在复杂的自动化流程上,Claude Sonnet 仍然更强。
切换完成后,成本曲线呈「断崖式下跌」——Crivello 原话是「You should see our AI cost curve right now. It's a cliff.」。Lindy 的解释是:对邮件分类、日程管理、高频自动化等企业日常任务而言,大模型的参数冗余意味着更高的延迟与成本,DeepSeek 在这些场景做了速度与实用性的针对性优化。
速度提升六成
6 月 27 日,DeepSeek 开源了 DSpark 投机解码框架。该框架不发布新模型,而是在 V4 现有权重上附加一个草稿模块,通过半自回归生成实现无损加速。官方数据显示,在生产环境下,V4-Flash 每用户生成速度提升 60% 到 85%,V4-Pro 提升 57% 到 78%;离线测试中,接受长度比 Eagle3 高 26% 到 31%。
同期更新的还有 Wayfinder Router,一个完全离线的模型路由工具。它通过分析提示词的结构特征(长度、标题、代码块等),在微秒级决定走本地模型还是云端 API,路由过程无需调用其他模型。
两个工具的指向一致:一个让模型「跑更快」,一个让企业「花更少」。它们都不追求参数上限,而是把「够用且便宜」做到极致。
分层用模成新趋势
Lindy 的个案放到更大背景下看,并非孤例。5 月份 Vercel 的 AI Gateway 数据显示:DeepSeek 的 token 流量占比从不到 1% 跳到 17%,但收入占比几乎没动——它承接的几乎全是低价高频的「体力活」。
这折射出企业用模策略的转变:高难度推理、复杂自动化、合规敏感场景继续交给 Claude;高频低复杂度、对延迟敏感、成本压力大的任务,交给 DeepSeek 等性价比更高的模型。两种模型各司其职,而非相互替代。
过去,企业选用 DeepSeek 多带有「降级备选」的无奈;当开源模型的速度追上闭源、价格仅为几分之一时,「性价比」本身已成为核心竞争力。Lindy 那条断崖下跌的成本曲线,既记录了一家供应商的更换,也是一家美国公司用脚投票的真实选择。
