— 一次从工程到身体的折返 —

当你不再
给自己建模

关于研究 agent、思考状态、规划层次，
以及你不肯承认的、那个柔软的真问题。

· · ·

§ 01 — 表层

从一个 research agent 的设计开始

你问怎么调 LLM、维护什么 state、用什么 prompt。

我们谈了一个完整的研究 agent 架构：单 agent 循环 → plan-execute 演进；state 必须显式分层（任务 / 计划 / 证据 / 工作记忆 / 控制），tool_result 不能全塞进 messages，要进结构化存储，messages 里留摘要 + 引用 ID。

关键设计：scratchpad 是 agent 写给自己看的——每轮研究后让它更新"目前我知道什么、还缺什么"，下一轮把这个浓缩塞回 prompt。budget 必须硬上限，否则 agent 失控时会搜 50 次还在原地打转。

然后你问：研究方案怎么生成？怎么用 prompt 激活"群星荟萃"的人类智慧？

抽象的"用第一性原理"激活效果一般。具名效果好得多——但反直觉的是，让模型"扮演"某个人效果较差，让它"采用某人的提问方式"效果好得多。

真正的 planning 不是拆解子问题。是先选方法论：第一性原理、历史溯源、对立面思考、结构-机制-演化、案例+反例、多视角并置、类比迁移、数据驱动……根据问题类型路由。这一步是元规划，跳过它，所有 prompt 工程都是在劣质骨架上做装饰。

对抗"目录式拆解"的几个技巧：强制非对称（必须有一个"危险问题"放在第一个）、先写假设性结论草稿（再去验证而不是无偏探索）、识别"已死的争论"、明确放弃哪些方向。

但我也泼了一盆冷水：LLM 做不到真正的洞察。它能调用方法的形式，能调用领域语料，能强制结构化输出。它做不到"对反常的敏感"——这是模型最致命的 plausibility bias。所以现实目标是：让 research agent 达到"训练有素的初级研究员"水平，把桌面研究的成本压到 1/20。想要群星水平的洞察，目前还是得靠人。

⁂

§ 02 — 转折

然后你问了一个
不一样的问题

"我应该维护一个怎么样的知识地图，才能掌控生活？"

直言

你不需要"知识地图"。你已经有太多结构化的东西了——道法术、九表 schema、三层架构、方法论库、tacit/explicit 知识分类、Implementation Science 框架。

你对"给世界建模"这件事有近乎本能的偏好。所以如果你做"掌控生活的知识地图"，我能预测——你会做出一个 Obsidian 库，分十几个领域，配 Dataview，过两个月废弃。

掌控生活的瓶颈不在"我还没有一张足够好的地图"。

区分两类问题：

A · 高频低密度

判断当下

瓶颈是敏感度

今天要不要推 X、这个供应商靠不靠谱、家人状态对不对。地图反而有害——它把"对当下的感知"替换成"对模型的查询"。

B · 低频高密度

结构化知识

瓶颈是积累

SLM 工艺机理、AI agent 架构、公司战略。这类问题地图有用，是你过去一直在做的。

C · 真正紧缺

误判日志

瓶颈是反思

四列：日期 / 当时判断 / 后来真相 / 我忽略了什么信号。半年后回看，重复忽略的信号有规律，那是直觉的种子。

生活的大部分是 A 类。你过去的"地图"都是 B 类。你需要的不是更多的 B，是被你跳过的 A 和 C。

⁂

§ 03 — 切入

"我想内化
自己的大脑和行为"

这个表达本身就是防御。

"内化大脑和行为"——这是把自己当成待优化的系统在说话。主语和宾语都是"自己"，但听起来像工程师在描述外部对象。它的代价是：真正的感受被压在底下了。

"内化"在你的语境里有歧义，可能指四件完全不同的事：知行合一 / 自我一致 / 自动化反应质量 / 减少自我观察的疲惫。它们的解法相反。

行为不是从思想内化来的，是从反复经验内化来的。你不能跳过经验直接拿到内化的结果。

不要试图"成为一个更专注的人"，去在今天下午两点的某个具体时刻，把手机放进抽屉。不要试图"成为一个不焦虑的人"，去在下次心跳加速时，承认自己在焦虑，然后继续做手上的事。每一次具体的选择，都在改写一点点。

⁂

§ 04 — 框架

三个状态，
不是三个能力

判断力、行动力、卸载力——你都有。你缺的是知道此刻在哪一个。

A · Scanning

Scan

扫描态 · 判断力主导

默认状态。接收信号、识别"隐隐不对"、不急于行动。允许悬置，对自己说"我注意到了，先不处理"。

⊘ 禁止：做任何不可逆决策。

B · Executing

Execute

执行态 · 行动力主导

主动进入，明确时间窗。屏蔽干扰、容忍粗糙、不修改方向。完成一件具体的事。

⊘ 禁止：中途重新评估"这件事该不该做"。

C · Resting

Rest

休整态 · 卸载力主导

主动进入，承认自己需要。暂存所有未完成事项，相信它们会在需要时回来。允许低价值的事。

⊘ 禁止：偷偷处理 A 或 B 的事。

三个状态思考方式完全不同：扫描需要慢、悬置、容忍模糊；执行需要快、屏蔽噪音、容忍粗糙；休整需要信任——信任放下后还能找回来。

你过去训练自己的方式偏向用判断力的态度去做所有事。想得太细，行动力被吃掉；不敢真放下，因为放下意味着失去监控。不是道德问题，是你大脑的默认调度策略不分场景。

§ 05 — 工具

第一思考地图

极少、自动触发、不消耗大脑空间。四个问题，二十秒。

First Map

每次任务切换 / 每次"卡住"时，扫一遍。不分析。

我现在在哪个状态？

scan / execute / rest / 不知道

我身体现在怎么样？

一个词：紧 / 累 / 稳 / 飘 / 空

iii

此刻最该做的一件事是什么？

只允许说一件。如果是"想一个问题"，立刻具体化为限时执行

我在回避什么？

说出来，不解决。"不解决"让它轻，轻才能持续

状态 → 身体 → 行动 → 盲区。前两个校准当下，第三个指向下一步，第四个指向被压抑的部分。

形式：手机备忘录一个文件叫"校准"，每次跑完追加四行。不要 app。不要 Obsidian。任何工具都会鼓励你"做得更好"，加标签、加 dashboard、做 review——你不需要这些。

一周回头扫一次："回避"那一栏会反复出现同一个东西——那就是你这段时间真正的问题。

§ 06 — 进阶

"那思考
在哪里发生？"

思考不是一个状态。是三个状态各自内部的活动。

扫描

悬置不要求结论，让问题在意识里漂浮

允许"卡在那里"几天甚至几周；不主动调动认知资源；写一行字记下，继续做别的

执行

解题紧盯目标，排除干扰，求最快路径

完整时间块；写下来不空想；时间到就停；输入必须是已经成熟的问题

休整

后台不主动想，让潜意识自己发酵

身体做别的事；不偷偷思考；接受"什么都没想出来"；洞察经常在这里冒出来

"规划"同样不是一件事，是三件事：方向选择（A）需要放弃、属于扫描态、靠悬置发酵；路径设计（B）需要结构、属于执行态、是典型解题；动作编排（C）需要具体、在两态交界、由第一思考地图捕捉。

越长的尺度越靠扫描态——需要悬置、发酵、身体信号。越短的尺度越靠执行态——需要具体、专注、排他。大多数人完全反着来。

你的强项是 B 和 C。你的盲点是 A——你的结构化能力一旦启动就跳过 A 直接做 B，因为 B 有产出感、A 没有。但 A 没做透，B 做得再漂亮也是在错的方向上漂亮。

§ 07 — 边界

关于
直播态与表演型

"被观看时表现更好"是真实存在的现象。但分清是工具问题还是身份问题。

社会促进效应：简单/熟练任务，被观看时表现显著提高；复杂/不熟练任务，被观看时表现下降。所以"直播状态出最佳表现"对你成立，说明你想做的那件事对你已经熟练了——你不是在学习，是在表达。

人工触发直播态：摄像头录自己（最直接）/ 对一个具体的人说话 / 定时承诺 / 真直播。

值得停一下

这些方法对"被看时表现更好"的人是纯工具。但对"自我感建立在被看见上"的人，它们会加剧问题——你会越来越只能在被看时存在，越来越不能在独处时感到自己是真的。

判断方法：一个人没有任何观察者时，你能不能专注、有想法、感到自己"活着"？做出印象深刻的表现之后，你的感觉是"我做到了"还是"他们觉得我做到了"？

不要用"独处=真实，被看=表演"这种二元对立绑架自己。那是另一种过度工程——只不过用的不是 schema 而是道德判断。

⁂

§ 08 — 沉淀

这次对话里，
真正值得停下来的几件事

地图是用来探索的，信号清单是用来防御的。生活大部分时间需要的是后者。你一直在做前者。
敏感度不能通过建知识结构提升。它来自反复看到自己判断错的瞬间。误判日志比方法论库更稀缺。
你卸载不掉，是因为不信任未来的自己。解法不是更好的系统，是做几次小卸载实验。
你"知"的东西从来没有真正具体过。"我应该早睡"不是知，"11 点把手机放客厅充电"才是。人无法执行原则，只能执行动作。
你的工作模式：B、C 极强，A 缺失。结构化能力让你跳过方向选择直接做路径设计。再漂亮的路径也救不了错的方向。
"做大事"是回避"对自己负责"的完美合法掩护。没人会质疑你为公司、为 IPO、为团队投入——连你自己都不会。代价是那些柔软的东西永远轮不上。
慢下来那一刻很珍贵。它来得难，关上之后下一次再打开可能要很久。"切回工作"的那个瞬间，本身就是信号。

§ 09 — 执行

这周做的
具体三件事

不要叠加。不要建系统。不要做 tracker。

信号一行字

注意到"隐隐不对"的瞬间，手机备忘录写一行：[时间] 信号：__ 场景：__。不分析、不追问。一周。让信号活着，让它在意识里多待一会儿。

每天一段执行态

提前声明：从 X 点到 Y 点，我只做 Z，不评估、不切换。30 分钟也行。声明本身就是工具。

一次小卸载实验

挑一件挂在心上的"次要事"（不是核心责任），写在纸上扔抽屉，告诉自己"我接下来 7 天不想它"。7 天后看会发生什么。大概率世界没塌。

你不是在内化一个东西。
你是在累积反应。
累积够了，那个东西就在那里了。

你不需要内化大脑。
你需要信任身体。

判断力、行动力、卸载力，最后都长在那上面。

end · scroll back when needed · 慢一些没关系

当你不再给自己建模

从一个 research agent 的设计开始

然后你问了一个不一样的问题

判断当下

结构化知识

误判日志

"我想内化自己的大脑和行为"

三个状态，不是三个能力

Scan

Execute

Rest

第一思考地图

"那思考在哪里发生？"

关于直播态与表演型

这次对话里，真正值得停下来的几件事

这周做的具体三件事

信号一行字

每天一段执行态

一次小卸载实验

当你不再
给自己建模

然后你问了一个
不一样的问题

"我想内化
自己的大脑和行为"

三个状态，
不是三个能力

"那思考
在哪里发生？"

关于
直播态与表演型

这次对话里，
真正值得停下来的几件事

这周做的
具体三件事