桃子桃子 AI 快讯
返回首页
开源

爱好者发起 HEMA 击剑动作开源数据集,瞄准 AI 视觉极端场景

一位 HEMA 击剑爱好者计划录制 100 段多视角同步视频,标注细长刀刃与关节遮挡等数据,征求研究者对 schema…

2026.06.29 · 周一3 分钟阅读评分 31
评分细项加权总分 31
重要性
25
新颖性
40
影响面
15
可信度
45
实质性
45

一位欧洲历史武术(HEMA)练习者在 r/MachineLearning 发布帖子,宣布正在筹建一个面向计算机视觉研究的开源数据集,聚焦击剑动作这一对视觉算法极为「不友好」的真实场景。他自称并非计算机视觉或机器人学背景,但长期关注 embodied AI 中 Sim2Real 落差与细长物体(thin-object)跟踪等瓶颈问题。

为什么选择击剑作为测试场景

击剑动作对 CV 系统构成了多重极端挑战:

  • 双方处于最大爆发力的运动状态,身体重心以高度非线性的方式快速转移,适合用于双足平衡与轨迹预测测试;
  • 练习者全身被厚重的黑色护甲包裹,关节几乎不可见,对姿态估计与关键点检测构成严重遮挡;
  • 钢制刀刃时速可达 80 英里,会出现低于亚像素分辨率的快速位移,并伴随大面积运动模糊。

作者认为,这一场景几乎集合了 Sim2Real 迁移中最难处理的物理边缘情况(physics edge cases),并希望未来可应用于击剑赛事的 CV 评分系统。

数据集规模与采集方案

目前规划的数据集规模为「迷你级」:

  • 100 段经过精细裁剪的击剑片段;
  • 采用多机位同步拍摄,帧率在 120fps 与 240fps 之间;
  • 已建立 Hugging Face 占位页与 dataset card,正等待研究者反馈后,再开始与俱乐部同伴进行实际拍摄。

标注 schema 设计

作者借助 AI 辅助设计了 JSON 标注结构,核心字段包括:

  • 元信息:武器类型(长剑 / Longsword)、技术来源文献(如 Joachim Meyer 1570 年著作)、采集帧率;
  • 时间戳:片段起止帧、刀刃接触帧、还原结束帧;
  • 生物力学标签:起止式(guard)、步法类型、击打轨迹、刃位对齐;
  • CV 危险度标注:遮挡等级、是否预期出现运动模糊;
  • 逐帧标注:关键点 2D 像素坐标(双侧手腕、头部、剑柄与剑尖等)、分割多边形、是否检测到被遮挡像素。

社区反馈请求

作者向研究者提出两个具体问题:

  • 该元数据结构是否足以用于轨迹预测与姿态估计实验?
  • 哪些额外关键点(如十字护手坐标、步法速度指标)是现有模型所匮乏的、值得在手工标注阶段补充?

数据集占位页与反馈入口已托管在 Hugging Face 平台。由于该数据集尚处于 schema 验证阶段,尚未开始实际拍摄,也无任何模型评测结果,研究价值有待后续验证。

信源