清华系具身智能公司「厘清智能」完成数亿元种子轮融资
成立仅两月的厘清智能完成数亿元种子轮融资,顺为、红杉中国、高瓴等参投,押注其全栈自研的 Physical AI 系统方案…
36 氪独家获悉,成立仅两个月的 Physical AI 初创公司厘清智能已完成数亿元种子轮融资。投资方包括顺为资本、红杉中国、高瓴创投、峰瑞资本、星连资本、水木清华校友种子基金、SEE FUND 等机构基金,以及智元机器人、灵心巧手、世纪金源等产业资本。厘清智能由清华大学人工智能学院助理教授李一鸣于 2026 年 4 月创建,团队约 50 余人,多为清华在校学生,平均年龄 23 岁。
融资背景:稀缺的全栈团队与路线
一级市场对厘清智能的快速押注,建立在两重稀缺性之上。
- 人才稀缺:创始人李一鸣在纽约大学读博期间与谢赛宁(AMI Labs 联合创始人兼首席科学家)合作发表具身视觉推理成果,并曾与英伟达联合发表多篇 CVPR 与 NeurIPS 亮点论文,获 2024 年度英伟达全球奖学金(全球仅 10 位)。李一鸣表示,Physical AI 需要的是软硬一体的人才,目前国内此类人才非常稀缺。
- 路线稀缺:厘清智能选择了从数据采集、模型训练到物理引擎全栈自研的「重」路线。李一鸣认为,只有打通所有环节,信息流才能在不同模块间畅通无阻,实现协同优化。这在国内相当少见,前期投入和跨软硬的技术难度已劝退大批公司。
技术方案:数据与物理双轮驱动的 Physical AI Infra
厘清智能提出了一套数据和物理双轮驱动的 Physical AI 基础设施,包含两个核心自研组件:
- 数据管线:将行业平均的几十万小时采集量级提升到百万到千万小时,并通过自研全掌触觉手套等设备,把单套成本从美元量级压到人民币量级。
- 可微物理引擎:实现 Real-to-Sim-Real 闭环,基于真实世界数据构建仿真环境,用于机器人强化学习,再回到真实世界执行任务。该引擎可建模流体、软体、弹塑性形变物体等复杂材质。
据李一鸣介绍,厘清智能自研的世界模型操作系统可支持切割、旋拧、插拔、搅拌、按压、捏取、穿引等精细操作技能训练,并能跨灵巧手、机械臂等不同本体部署,适配生产制造、零售服务、酒店运营、餐饮备料、医疗辅助等场景。其方案可以用约 1% 的真机数据量训练策略模型,达到与传统路线相同的成功率。
对世界模型的判断:不是独立组件,而是渗透全流程
李一鸣将当前的世界模型赛道形容为「2026 年最具迷惑性的概念之一」,认为视频模型、3D 模型、VLA 路线只要与仿真、物理沾边,都被划入世界模型阵营,估值泡沫较大。
他给出了厘清智能的判断:
- 训练目标:预训练阶段将世界模型作为自监督目标,同时建模 state(状态)和 action(行动);后训练阶段将其封装为可交互的强化学习环境。
- 训练方法:需要 SFT(监督微调)加 RL(强化学习)联合进行,并依赖自研的物理引擎满足物理约束。
- 什么是「原生世界模型」:全栈打通感知、推理、决策、动作输出,且面向机器与世界交互任务设计的才是原生世界模型。VLA 因表征空间是离散的、JEPA 只能预测状态无法输出动作、视频生成模型难以保证几何与物理一致性,都被李一鸣归为「非原生」。
- 关键瓶颈:物理世界的高效 tokenization,即如何将视觉、触觉、力觉等多模态观测压缩为模型可消化的 Token 序列。据李一鸣透露,团队自研的视觉 tokenizer 效果已优于 Meta 的 DINOv3。
商业化规划:从 ToB 切入,2028 年看规模化
厘清智能的场景切入策略是先 ToB、后 ToC,优先布局工业、物流以及生活消费类场景。李一鸣表示,这些场景工种替代性强、客户降本提效需求明确。
硬件形态方面,团队目前以轮臂(带轮子的机械臂)为主,理由是人形机器人在负载能力和人体精准建模上仍有较大技术难度。
时间表上:
- 2026 年底前:发布可跨 B 端场景的世界模型。
- 2028 年:实现解决方案的规模化落地。李一鸣预测,届时数据采集规模和电机密度都将实现跃升,方案才能进入大规模部署阶段。
其终极目标是将整套系统封装为通用 Physical AI Infra,类比「iOS 之于移动应用」,让不同物理操作任务可基于该平台规模化开发与部署。
