桃子桃子 AI 快讯
返回首页
工具

Karpathy 再抛新构想:把笔记当源代码,让大模型当编译器

前 OpenAI 联合创始人 Karpathy 发布 LLM-Wiki 框架,将个人笔记视为不可变源代码,由大模型一次性…

2026.07.01 · 周三3 分钟阅读

前 OpenAI 联合创始人、Tesla 前 AI 总监、现 Anthropic 工程师 Andrej Karpathy 近日在个人 Gist 中提出「LLM-Wiki」构想,主张将个人知识管理体系重新想象为一次编译过程:原始笔记作为不可变的源代码,大模型充当编译器,把零散素材一次性整合为结构化、互相链接的 Wiki 页面。此后每次查询无需重新检索原文,而是直接与编译后的知识库交互。该文档发布后,在 Obsidian、Claude、Cursor 社区迅速传播,已有用户将 Wiki 扩展到上百页、数十万字的规模。

传统 RAG 方案的三大短板

当前主流的笔记问答方案仍以 RAG(检索增强生成)为主:提问时,系统从笔记库中检索相关片段并拼凑答案。Karpathy 认为这一模式存在明显局限:

  • 只能处理局部信息,无法理解数百篇笔记背后的整体逻辑与底层共识;
  • 当新旧观点发生冲突时,容易输出自相矛盾的结论;
  • 手动维护的交叉链接会随时间逐渐腐化,检索效率持续下降。

他用一句话概括自己的判断:「搜索和检索是人类无能的表现,我们真正需要的是共识、结构与真相。」

三层架构与三个核心操作

LLM-Wiki 框架将知识管理拆分为三层:

  • Raw 层(原始素材):不可变的第一手记录区,存放灵感、摘录、会议纪要等,保留人类输入的原始性与不完美。
  • Schema 层(知识宪法):用户为 AI 制定的条目规范,例如规定每个人物词条必须包含「动机、局限性、关键成就」三个字段。
  • Wiki 层(编译成品):由 AI 维护的结构化百科页面,条目之间互相链接、逻辑自洽。

围绕这三层,日常使用被简化为三个动作:

  • Ingest(摄入):丢入新材料,AI 自动更新相关条目、修订综述、标记新旧冲突,一篇来源可能牵动十几个页面。
  • Query(查询):直接对编译后的 Wiki 提问,答案附带引用回链,优质回答可直接回档为新页面。
  • Lint(体检):定期让 AI 做类似代码审查的自检,定位矛盾、过时论断与孤立条目。

迟到八十年的 Memex 终于落地

Karpathy 在文档结尾将这一构想追溯到 Vannevar Bush 1945 年在《As We May Think》中描述的 Memex——一台能存储全部资料并通过「联想路径」互相链接的书桌。Memex 八十年未能大规模落地的核心障碍是维护成本:每一条交叉引用都需人工建立,长期维护难以为继。

大模型恰好补上了这一环。Karpathy 写道:「维护一座知识库最累的部分,从来不是阅读,是记账。」LLM 不会因枯燥而遗漏某条交叉引用的更新,也不会因疲劳而漏掉矛盾检查,维护成本被压至近乎为零。

这也是 Karpathy 关于人机协作的第三块拼图:继 2025 年 2 月的 Vibe Coding 与 2026 年 1 月的 Agentic Engineering 之后,他将 AI 协作的范围从代码进一步拓展到知识本身。人类从收藏、整理、链接等「杂活」中被解放出来,被留下的只剩两件事:决定读什么,以及想清楚这一切到底意味着什么。

信源