MyShape Protocol 发布 PES Benchmark v0.2:声称可用动作特征区分人类与 AI 生成运动
Show HN 项目 MyShape 上线 PES Benchmark v0.2,主张通过姿态序列的 128 维运动向量…
Hacker News 上一个名为 MyShape Protocol 的 Show HN 项目发布了 PES Benchmark v0.2,宣称可通过人体动作的细微特征来区分「真人」与「AI 生成运动」。项目给出的效应量指标 Cohen's d 高达 10.4,意味着若属实,其区分能力远超常见生物特征识别基准。
项目定位:身份连续性协议
MyShape 自我定位为「数字身份的连续性层(Continuity Layer)」,核心概念是「Proof of Continuity」—— 不仅验证「你是谁」,还要持续验证「你还是你」。其设计动机是:随着 AI 可生成人脸、克隆声线、伪造指纹,传统的静态身份验证不再可靠。
项目处理流程为:摄像头 → MediaPipe Pose(33 点)→ SST 拓扑(18 点)→ 4D PES 引擎(128 维运动向量)→ ZK-SNARK 证明(约 250 字节)→ 链上验证。官方强调全部处理在端侧完成,原始数据不上传,验证在不暴露身份的前提下证明「操作者为真人」。
PES 基准的核心指标
PES(Presence Entropy Score)是一个 0–100 的分数,从四个维度量化动作中的生物熵:
- 微时序方差(micro-timing variance)
- 噪声残差(noise residual)
- 频率熵(frequency entropy)
- 生物扰动(biological perturbation)
项目声称人类运动得分通常在 70 分以上,而 AI 生成动作得分低于 20 分。其背后的 Motion-Signature 是从实时三维姿态序列中提取的 128 维向量,涵盖运动学量、加速度、加加速度及其频谱四个独立特征组。项目援引三项「硬数学限制」来佐证 AI 难以仿真:奈奎斯特极限、深度模糊性、熵差定理。
项目报告 Cohen's d=10.4,表示真人与 AI 生成动作分布在统计上几乎完全可分。不过,目前公开材料中尚未提供基准的数据集构成、测试样本量、对比模型、原始分数分布等关键方法学细节,该效应量有待第三方复现验证。
技术栈与协议架构
项目采用 Next.js 16 + React 19 + Tailwind 4 前端,三维渲染使用 Three.js 与 @react-three/fiber,动作提取依赖 MediaPipe Pose;后端使用 Supabase(PostgreSQL + Realtime),邮件由 Resend 6.x 处理,密码学部分使用 @noble/hashes 与 @noble/curves。
身份生命周期包括 SUBSCRIBED → PENDING_VERIFICATION → ACTIVE(或 GENESIS_NODE,名额 100 个)→ AGENT_ACTIVE(用于 AI 智能体身份登记)。API 覆盖 OTP 鉴权、SIWE 钱包绑定、运动验证、节点统计、AI 智能体身份声明以及跨平台内容发布等功能。
SEO 与 AI 爬虫策略
值得注意的是项目在「被 AI 索引」层面做了较多配置:
- 全站部署 Schema.org 语义层,覆盖 Organization、WebSite、DefinedTermSet、Article、FAQPage、HowTo、SoftwareApplication、Speakable 等类型
- robots.txt 显式放行 GPTBot、Claude-Web、PerplexityBot 等共 10 余种 AI 爬虫
- 提供 llms.txt 与 llms-full.txt 供 LLM 结构化读取
这一策略说明项目方将「被大模型检索到」视为增长路径的一部分,是当前 AI-native 项目中常见的做法。
局限与待观察之处
作为 Show HN 项目,MyShape 仍处于早期阶段,公开信息中缺少以下关键内容:
- PES Benchmark v0.2 的数据集来源、规模、覆盖场景
- 参与对比的 AI 生成模型列表及参数
- 可复现的测试脚本或独立验证报告
- 与现有深度伪造/活体检测基准(如 FaceForensics++、VoxCeleb 等)的横向比较
Cohen's d=10.4 是一个相当强的声明,若后续公开方法学并接受第三方测试,将对 AI 生成内容检测领域具有参考意义;在现阶段,该项目更适合被视为一个将姿态估计、零知识证明与身份层结合的概念验证产品。
