AI 界面设计的 39 条原则:一份可落地的实践框架
UX Collective 发布的人类与 AI 交互设计框架,整合微软 PAIR、OpenAI 模型规范等权威研究,归纳…
AI 系统的输出天然具有不确定性:同一输入可能产生不同结果,模型的表现也并非仅由能力决定,而是受到界面与引导方式的强烈影响。这意味着,当用户面对 AI 时,何时让系统主动建议、何时展示不确定性、生成答案应附带何种证据、某一操作应获得多大自主权——这些问题无法再依赖传统 UI 模式回答。UX Collective 发布的《39 principles for designing human-AI interaction》一文,试图把这些研究层面议题转化为产品层面可用的设计原则。
为何需要新的交互设计原则
传统界面建立在可预测行为之上:控件有确定功能,流程有已知状态,错误可以被预见并恢复。AI 系统的概率性特征打破了这一前提,催生了传统 UI 模式无法解决的新交互问题,包括建议 / 询问 / 行动的时机、不确定性的可视化方式、生成答案的证据呈现,以及操作的自主权限。这些问题直接决定了用户能否正确判断输出、从错误中恢复,以及在关键决策中保持主体责任。
文章据此提出一个核心设计问题:如何帮助用户「恰当信赖(appropriate reliance)」AI?整个框架围绕这一中心展开。
理论依据与权威来源
该框架并非作者原创理论,而是对多份既有研究的系统整合,主要依据包括:
- OpenAI 模型规范(Model Spec)与 Anthropic Claude 宪法:规范模型行为而非界面设计,但在「诚实地呈现系统本质、拒绝隐藏议程、保留人类监督」等维度上为前沿指引。
- 混合主动交互(Mixed-initiative interaction):Eric Horvitz 的研究把交互视为人机共同决策的过程,为系统「行动 / 建议 / 延迟 / 询问」的取舍提供基础。
- Google PAIR 指南与 IBM 六项生成式 AI 原则:从用户需求与成功定义出发,涵盖期望设定、来源展示、可变性设计、协同创作、不完美设计等应用层面议题。
- 微软 18 条人机交互指南:按「使用前 / 使用中 / 出错时 / 长期」四个阶段组织,其中「出错时」阶段最被重视——失败在 AI 中不是边缘情况,而是默认情况。
九大主题构成的整体框架
文章把 39 条原则归入九个主题:
- 概率基础(Probabilistic Foundation):为推断、生成与可变性而设计
- 期望设定(Expectation Setting):尽早澄清能力、限制与 AI 参与程度
- 校准信任(Calibrated Trust):让用户信赖与系统可靠性对齐
- 透明度(Transparency):让推理与证据在需要时可被审视
- 控制与能动性(Control & Agency):让接受、拒绝、编辑、撤销、覆盖都易于执行
- 优雅失败(Graceful Failure):让不确定、错误与升级变得可恢复
- 协同创作(Co-Creation):把输出视为草稿而非判决
- 负责任的自主性(Responsible Autonomy):按风险、可逆性与权限约束行动
- 持续信赖(Sustained Reliance):长期治理质量、漂移、所有权与变更
以「概率基础」为例看具体原则
文章对每个主题给出多条可操作原则。以概率基础为例,原文详细展开了三条:
- 只在 AI 具有比较优势的场景使用。 AI 擅长处理输入混乱、意图模糊、需要生成内容或综合大量信息的任务;不擅长需要精确性、可重复性或简单确定性控制的场景。文章以 Linear 为例:它在需求归纳、重复任务识别、问答工作区历史等模糊、上下文密集的环节使用 AI,而在状态、分配、优先级、权限等需要精确的环节保留确定性 UI。
- 为生成式可变性而设计,而非对抗它。 同一提示可能产生多个可接受的答案,这种变化本身往往是价值的一部分。界面应通过多稿、重新生成、保留替代方案、版本历史、并排比较、可编辑结果等模式,帮助用户与变化协作。当任务具有探索性——写作、命名、视觉设计、规划、构思、研究框架——呈现多个选项往往比呈现单一精致答案更有用。Midjourney 每次返回四张图像的网格,正是把方差转化为选择而非错误。
- 根据任务选择交互模式。 并非每个 AI 功能都该是聊天机器人。交互模式应与输入类型、用户目标和输出后果相匹配:小且低风险任务可作为内联建议或智能默认;探索性任务适合多轮对话以逐步明确意图;多步骤或后果重大的任务则需要计划、检查点、审查环节,以及清晰的停止、撤销、回滚方式。
价值与适用场景
整套框架的价值在于把分散于人机交互、可解释 AI、责任 AI 等领域的研究,浓缩为产品设计师可以直接对照检查的清单。对于正在设计 AI 功能的团队而言,它既是原则索引,也是评审工具——可在设计评审中逐项核对「系统角色是否清晰」「不确定性是否被呈现」「控制是否充分」「失败是否可恢复」等关键问题。完整的 39 条原则覆盖九大主题,构成一套相对完整的人类与 AI 交互设计参考体系。
