Karpathy 再抛新构想：把笔记当源代码，让大模型当编译器

前 OpenAI 联合创始人、Tesla 前 AI 总监、现 Anthropic 工程师 Andrej Karpathy 近日在个人 Gist 中提出「LLM-Wiki」构想，主张将个人知识管理体系重新想象为一次编译过程：原始笔记作为不可变的源代码，大模型充当编译器，把零散素材一次性整合为结构化、互相链接的 Wiki 页面。此后每次查询无需重新检索原文，而是直接与编译后的知识库交互。该文档发布后，在 Obsidian、Claude、Cursor 社区迅速传播，已有用户将 Wiki 扩展到上百页、数十万字的规模。

传统 RAG 方案的三大短板

当前主流的笔记问答方案仍以 RAG（检索增强生成）为主：提问时，系统从笔记库中检索相关片段并拼凑答案。Karpathy 认为这一模式存在明显局限：

只能处理局部信息，无法理解数百篇笔记背后的整体逻辑与底层共识；
当新旧观点发生冲突时，容易输出自相矛盾的结论；
手动维护的交叉链接会随时间逐渐腐化，检索效率持续下降。

他用一句话概括自己的判断：「搜索和检索是人类无能的表现，我们真正需要的是共识、结构与真相。」

三层架构与三个核心操作

LLM-Wiki 框架将知识管理拆分为三层：

Raw 层（原始素材）：不可变的第一手记录区，存放灵感、摘录、会议纪要等，保留人类输入的原始性与不完美。
Schema 层（知识宪法）：用户为 AI 制定的条目规范，例如规定每个人物词条必须包含「动机、局限性、关键成就」三个字段。
Wiki 层（编译成品）：由 AI 维护的结构化百科页面，条目之间互相链接、逻辑自洽。

围绕这三层，日常使用被简化为三个动作：

Ingest（摄入）：丢入新材料，AI 自动更新相关条目、修订综述、标记新旧冲突，一篇来源可能牵动十几个页面。
Query（查询）：直接对编译后的 Wiki 提问，答案附带引用回链，优质回答可直接回档为新页面。
Lint（体检）：定期让 AI 做类似代码审查的自检，定位矛盾、过时论断与孤立条目。

迟到八十年的 Memex 终于落地

Karpathy 在文档结尾将这一构想追溯到 Vannevar Bush 1945 年在《As We May Think》中描述的 Memex——一台能存储全部资料并通过「联想路径」互相链接的书桌。Memex 八十年未能大规模落地的核心障碍是维护成本：每一条交叉引用都需人工建立，长期维护难以为继。

大模型恰好补上了这一环。Karpathy 写道：「维护一座知识库最累的部分，从来不是阅读，是记账。」LLM 不会因枯燥而遗漏某条交叉引用的更新，也不会因疲劳而漏掉矛盾检查，维护成本被压至近乎为零。

这也是 Karpathy 关于人机协作的第三块拼图：继 2025 年 2 月的 Vibe Coding 与 2026 年 1 月的 Agentic Engineering 之后，他将 AI 协作的范围从代码进一步拓展到知识本身。人类从收藏、整理、链接等「杂活」中被解放出来，被留下的只剩两件事：决定读什么，以及想清楚这一切到底意味着什么。