清华系具身智能公司「厘清智能」完成数亿元种子轮融资

36 氪独家获悉，成立仅两个月的 Physical AI 初创公司厘清智能已完成数亿元种子轮融资。投资方包括顺为资本、红杉中国、高瓴创投、峰瑞资本、星连资本、水木清华校友种子基金、SEE FUND 等机构基金，以及智元机器人、灵心巧手、世纪金源等产业资本。厘清智能由清华大学人工智能学院助理教授李一鸣于 2026 年 4 月创建，团队约 50 余人，多为清华在校学生，平均年龄 23 岁。

融资背景：稀缺的全栈团队与路线

一级市场对厘清智能的快速押注，建立在两重稀缺性之上。

人才稀缺：创始人李一鸣在纽约大学读博期间与谢赛宁（AMI Labs 联合创始人兼首席科学家）合作发表具身视觉推理成果，并曾与英伟达联合发表多篇 CVPR 与 NeurIPS 亮点论文，获 2024 年度英伟达全球奖学金（全球仅 10 位）。李一鸣表示，Physical AI 需要的是软硬一体的人才，目前国内此类人才非常稀缺。
路线稀缺：厘清智能选择了从数据采集、模型训练到物理引擎全栈自研的「重」路线。李一鸣认为，只有打通所有环节，信息流才能在不同模块间畅通无阻，实现协同优化。这在国内相当少见，前期投入和跨软硬的技术难度已劝退大批公司。

技术方案：数据与物理双轮驱动的 Physical AI Infra

厘清智能提出了一套数据和物理双轮驱动的 Physical AI 基础设施，包含两个核心自研组件：

数据管线：将行业平均的几十万小时采集量级提升到百万到千万小时，并通过自研全掌触觉手套等设备，把单套成本从美元量级压到人民币量级。
可微物理引擎：实现 Real-to-Sim-Real 闭环，基于真实世界数据构建仿真环境，用于机器人强化学习，再回到真实世界执行任务。该引擎可建模流体、软体、弹塑性形变物体等复杂材质。

据李一鸣介绍，厘清智能自研的世界模型操作系统可支持切割、旋拧、插拔、搅拌、按压、捏取、穿引等精细操作技能训练，并能跨灵巧手、机械臂等不同本体部署，适配生产制造、零售服务、酒店运营、餐饮备料、医疗辅助等场景。其方案可以用约 1% 的真机数据量训练策略模型，达到与传统路线相同的成功率。

对世界模型的判断：不是独立组件，而是渗透全流程

李一鸣将当前的世界模型赛道形容为「2026 年最具迷惑性的概念之一」，认为视频模型、3D 模型、VLA 路线只要与仿真、物理沾边，都被划入世界模型阵营，估值泡沫较大。

他给出了厘清智能的判断：

训练目标：预训练阶段将世界模型作为自监督目标，同时建模 state（状态）和 action（行动）；后训练阶段将其封装为可交互的强化学习环境。
训练方法：需要 SFT（监督微调）加 RL（强化学习）联合进行，并依赖自研的物理引擎满足物理约束。
什么是「原生世界模型」：全栈打通感知、推理、决策、动作输出，且面向机器与世界交互任务设计的才是原生世界模型。VLA 因表征空间是离散的、JEPA 只能预测状态无法输出动作、视频生成模型难以保证几何与物理一致性，都被李一鸣归为「非原生」。
关键瓶颈：物理世界的高效 tokenization，即如何将视觉、触觉、力觉等多模态观测压缩为模型可消化的 Token 序列。据李一鸣透露，团队自研的视觉 tokenizer 效果已优于 Meta 的 DINOv3。

商业化规划：从 ToB 切入，2028 年看规模化

厘清智能的场景切入策略是先 ToB、后 ToC，优先布局工业、物流以及生活消费类场景。李一鸣表示，这些场景工种替代性强、客户降本提效需求明确。

硬件形态方面，团队目前以轮臂（带轮子的机械臂）为主，理由是人形机器人在负载能力和人体精准建模上仍有较大技术难度。

时间表上：

2026 年底前：发布可跨 B 端场景的世界模型。
2028 年：实现解决方案的规模化落地。李一鸣预测，届时数据采集规模和电机密度都将实现跃升，方案才能进入大规模部署阶段。

其终极目标是将整套系统封装为通用 Physical AI Infra，类比「iOS 之于移动应用」，让不同物理操作任务可基于该平台规模化开发与部署。