Karpathy's LLM Wiki 方法论深度报告
作者:Andrej Karpathy(OpenAI 创始成员、Tesla AI 总监、斯坦福 CS231n 课程创始人)
来源:https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f
生成时间:2026-04-15
一、背景:为什么 RAG 不够用了
当前大多数人使用 LLM + 文档的方式是 RAG(Retrieval-Augmented Generation):
上传一批文件 → 问问题 → LLM 检索相关片段 → 生成答案
RAG 的本质是每次查询都从原始文档重新拼装知识,没有积累。同一个问题问5遍,L LM要重新找5遍相关内容。"好答案"无法沉淀,下次问类似问题又要重来。
LLM Wiki 的核心洞察:让 LLM 在原始文档和用户之间,构建一个持久化、不断增厚的 wiki,新文档进来后直接更新 wiki 里的相关页面,知识编译一次,之后直接用。二、LLM Wiki 核心理念
"Humans abandon wikis because the maintenance burden grows faster than the value. LLMs don't get bored, don't forget to update a cross-reference, and can touch 15 files in one pass."
>
人类放弃 wiki 是因为维护成本增长快过价值。LLM 不会厌倦,不会忘记更新交叉引用,一次能改15个文件。
与 RAG 的关键对比
| 维度 | RAG | LLM Wiki |
|---|---|---|
| 知识存放位置 | 原始文档 | Wiki(编译后的知识页) |
| 合成时机 | 每次查询时 | 文档摄入时(一次性) |
| 积累性 | 无,每次重头来 | 有,越用越厚 |
| 跨文档综合 | 每次重新拼装 | 交叉引用已建立 |
| 矛盾检测 | 无 | 有(新文档可标注矛盾) |
| 适用规模 | 小规模、一次性问答 | 大规模、长期积累 |
三、三层架构
Raw Sources(原始文档层)
- 文章、PDF、网页、图片、数据文件
- 不可变——LLM 只读不写,永远是 source of truth
- 类似于版本控制中的 commit,任何时候都可回溯
Wiki(知识层)
- LLM 生成的 Markdown 文件集合
- 包含:摘要页、实体页、概念页、对比页、全局概述
- 全权由 LLM 创建和维护
- 用户只读,LLM 写
- 页间互相引用,形成知识图谱
Schema(规范层)
- 配置文件(如
CLAUDE.md/AGENTS.md) - 定义 wiki 的结构、命名规范、摄入流程
- 用户和 LLM 共同演进
- 相当于 wiki 的"编码规范"
四、三个核心操作
Ingest(摄入)
新文档 → LLM 读取 → 与用户讨论要点 → 写摘要页到 wiki → 更新索引 → 更新相关实体/概念页 → 记日志
- 单次摄入可能涉及 10-15 个 wiki 页面的更新
- 推荐逐篇摄入,保持人工参与
- 也可批量摄入(较少监督)
Query(查询)
提问 → LLM 读索引定位相关页 → 读取页面 → 综合答案 + 引用
- 输出形式多样:Markdown 页面、对比表、幻灯片(Marp)、图表(matplotlib)
- 关键:好答案可以写回 wiki 作为新页面,探索结果也能积累
Lint(健康检查)
定期让 LLM 检查 wiki 健康度:
- 页面间矛盾说法
- 被新文档 supersede 的旧观点
- 孤立页面(无 inbound links)
- 重要概念未被独立建页
- 缺失交叉引用
- 可通过网络搜索填补的数据空白
五、两个特殊文件
index.md(内容目录)
- wiki 内所有页面的清单:链接 + 一句话摘要 + 元数据(日期、来源数)
- 按分类组织(实体/概念/来源等)
- LLM 回答问题前先读索引找相关页面
- 在中等规模(~100来源,数百页)下效果出奇地好,无需向量检索基础设施
log.md(时间线日志)
- append-only 操作记录(摄入/查询/lint 通过)
- 统一前缀格式:
## [2026-04-02] ingest | Article Title grep "^## \[" log.md | tail -5快速查看最近动态- 提供 wiki 演化的完整时间线
六、推荐工具链
| 工具 | 用途 |
|---|---|
| Obsidian | Wiki IDE,可视化 graph view,天然支持 Markdown |
| Obsidian Web Clipper | 浏览器插件,一键将网页转 Markdown |
| qmd | 本地 Markdown 搜索引擎,BM25/向量混合搜索 + LLM 重排,有 CLI 和 MCP server |
| Marp | Markdown 幻灯片格式,Obsidian 有插件支持 |
| Dataview | Obsidian 插件,查 page frontmatter(标签、日期、来源数)生成动态表 |
| Git | Wiki 就是 Markdown 文件的 git 仓库,版本历史、分支、协作都免费获得 |
七、典型应用场景
1. 深度研究(Research)
连续几周或几个月深入一个主题——读论文、文章、报告,逐步构建一个包含不断演化的论文的综合性 wiki。
2. 读书笔记
每读一章就 filing 一份笔记,构建角色页、主题页、情节线页以及它们之间的联系页。读完全书,你就有了一本丰富的配套 wiki。类似 Tolkien Gateway(托尔金百科),但个人积累。
3. 个人成长
追踪自己的目标、健康、心理、自我提升——filing 日志条目、文章、播客笔记,长期构建一个结构化的自我认知图谱。
4. 商业/团队知识库
内部 wiki 由 LLM 维护,来源包括 Slack 讨论、会议记录、项目文档、客户访谈。LLM 做那些没人想做的维护工作,团队 wiki 始终保持最新。
5. 竞争分析 /尽职调查 /旅行规划 /课程笔记
任何需要长期积累知识、有条理组织的场景。
八、开源实现案例
案例1:Astro-Han/karpathy-llm-wiki ⭐
- 定位:Karpathy LLM Wiki 的 Agent Skills 实现
- 支持工具:Claude Code、Cursor、Codex 等 Agent Skills 兼容工具
- 三个操作:Ingest(收集来源+编译 wiki)、Query(搜索+引用回答)、Lint(检查完整性)
- vs RAG:RAG 知识在 Raw 里,每次重新发现;LLM Wiki 知识编译进 wiki,长期积累
- 地址:https://github.com/Astro-Han/karpathy-llm-wiki
案例2:atomicmemory/llm-wiki-compiler
- 定位:知识编译器,Raw sources 进,interlinked wiki 出
- 灵感:完全来自 Karpathy LLM Wiki 模式
- 地址:https://github.com/atomicmemory/llm-wiki-compiler
案例3:sdyckjq-lab/llm-wiki-skill(中文)
- 定位:基于 Karpathy llm-wiki 方法论的个人知识库构建 Skill
- 特点:支持多平台,中文友好
- 地址:https://github.com/sdyckjq-lab/llm-wiki-skill
案例4:mduongvandinh/llm-wiki(越南语)
- 定位:完全自动化的个人知识库系统
- 特点:由 LLM 驱动,自动化程度高
案例5:AgriciDaniel/claude-obsidian
- 定位:Claude + Obsidian 知识伴侣
- 特点:基于 Karpathy LLM Wiki 模式的持久性、复合性 wiki 金库
九、为什么现在这个方法论突然重要了
2024-2025 年 Agent 大爆发,LLM 从"回答问题"变成"执行任务、长期维护"。Karpathy 的 LLM Wiki 恰好对应了这个趋势:
1. Agent 需要持久记忆:Agent session 结束后,什么都不记得。Wiki 提供持久层。
2. 长程任务需要知识积累:研究/分析类任务,不能每次都从零开始。
3. 交叉引用是真正的价值:孤立的事实不值钱,事实之间的关系才值钱。
4. 工具已经成熟:Obsidian + Web Clipper + Git + 可选 qmd,整套工具链 2025 年已经非常好用。
十、在我们的场景中如何落地
结合 vad-agents 项目已有的 Skill 生态,可以设计以下工作流:
用户摄入新来源(文章/文档/视频笔记)
↓
Agent 调用 karpathy-llm-wiki skill 的 Ingest 操作
↓
→ 存储到 raw/ 目录
→ 分析来源,提炼要点
→ 更新 wiki/ 中的相关页面(摘要、概念、实体页)
→ 更新 index.md 索引
→ 追加 log.md 日志
↓
用户查询 → Agent Query 操作
↓
→ 读 index.md 定位相关页面
→ 综合答案,附上引用
→ 好答案可写回 wiki 作为新页面
↓
定期 Lint:检查矛盾、孤立页面、缺失链接
已有的 Skill 创作经验(skill-creator)可以快速复用到 llm-wiki skill 开发上。
附:原版 Karpathy 语录
"I have the LLM agent open on one side and Obsidian open on the other. The LLM makes edits based on our conversation, and I browse the results in real time — following links, checking the graph view, reading the updated pages. Obsidian is the IDE; the LLM is the programmer; the wiki is the codebase."
"This idea is related in spirit to Vannevar Bush's Memex (1945) — a personal, curated knowledge store with associative trails between documents. The part Bush couldn't solve was who does the maintenance. The LLM handles that."