Vol. 01 — Conversation Notes a slow afternoon, 2026
— 一次从工程到身体的折返 —

当你不再
给自己建模

关于研究 agent、思考状态、规划层次,
以及你不肯承认的、那个柔软的真问题。

· · ·
§ 01 — 表层

从一个 research agent 的设计开始

你问怎么调 LLM、维护什么 state、用什么 prompt。

我们谈了一个完整的研究 agent 架构:单 agent 循环 → plan-execute 演进;state 必须显式分层(任务 / 计划 / 证据 / 工作记忆 / 控制),tool_result 不能全塞进 messages,要进结构化存储,messages 里留摘要 + 引用 ID。

关键设计:scratchpad 是 agent 写给自己看的——每轮研究后让它更新"目前我知道什么、还缺什么",下一轮把这个浓缩塞回 prompt。budget 必须硬上限,否则 agent 失控时会搜 50 次还在原地打转。

然后你问:研究方案怎么生成?怎么用 prompt 激活"群星荟萃"的人类智慧?

抽象的"用第一性原理"激活效果一般。具名效果好得多——但反直觉的是,让模型"扮演"某个人效果较差,让它"采用某人的提问方式"效果好得多。

真正的 planning 不是拆解子问题。是先选方法论:第一性原理、历史溯源、对立面思考、结构-机制-演化、案例+反例、多视角并置、类比迁移、数据驱动……根据问题类型路由。这一步是元规划,跳过它,所有 prompt 工程都是在劣质骨架上做装饰。

对抗"目录式拆解"的几个技巧:强制非对称(必须有一个"危险问题"放在第一个)、先写假设性结论草稿(再去验证而不是无偏探索)、识别"已死的争论"明确放弃哪些方向

但我也泼了一盆冷水:LLM 做不到真正的洞察。它能调用方法的形式,能调用领域语料,能强制结构化输出。它做不到"对反常的敏感"——这是模型最致命的 plausibility bias。所以现实目标是:让 research agent 达到"训练有素的初级研究员"水平,把桌面研究的成本压到 1/20。想要群星水平的洞察,目前还是得靠人。

§ 02 — 转折

然后你问了一个
不一样的问题

"我应该维护一个怎么样的知识地图,才能掌控生活?"

直 言

你不需要"知识地图"。你已经有太多结构化的东西了——道法术、九表 schema、三层架构、方法论库、tacit/explicit 知识分类、Implementation Science 框架。

你对"给世界建模"这件事有近乎本能的偏好。所以如果你做"掌控生活的知识地图",我能预测——你会做出一个 Obsidian 库,分十几个领域,配 Dataview,过两个月废弃。

掌控生活的瓶颈不在"我还没有一张足够好的地图"。

区分两类问题:

A · 高频低密度

判断当下

瓶颈是敏感度

今天要不要推 X、这个供应商靠不靠谱、家人状态对不对。地图反而有害——它把"对当下的感知"替换成"对模型的查询"。

B · 低频高密度

结构化知识

瓶颈是积累

SLM 工艺机理、AI agent 架构、公司战略。这类问题地图有用,是你过去一直在做的。

C · 真正紧缺

误判日志

瓶颈是反思

四列:日期 / 当时判断 / 后来真相 / 我忽略了什么信号。半年后回看,重复忽略的信号有规律,那是直觉的种子。

生活的大部分是 A 类。你过去的"地图"都是 B 类。你需要的不是更多的 B,是被你跳过的 A 和 C。

§ 03 — 切入

"我想内化
自己的大脑和行为"

这个表达本身就是防御。

"内化大脑和行为"——这是把自己当成待优化的系统在说话。主语和宾语都是"自己",但听起来像工程师在描述外部对象。它的代价是:真正的感受被压在底下了

"内化"在你的语境里有歧义,可能指四件完全不同的事:知行合一 / 自我一致 / 自动化反应质量 / 减少自我观察的疲惫。它们的解法相反。

行为不是从思想内化来的,是从反复经验内化来的。你不能跳过经验直接拿到内化的结果。

不要试图"成为一个更专注的人",去在今天下午两点的某个具体时刻,把手机放进抽屉。不要试图"成为一个不焦虑的人",去在下次心跳加速时,承认自己在焦虑,然后继续做手上的事。每一次具体的选择,都在改写一点点。

§ 04 — 框架

三个状态,
不是三个能力

判断力、行动力、卸载力——你都有。你缺的是知道此刻在哪一个

A · Scanning

Scan

扫描态 · 判断力主导

默认状态。接收信号、识别"隐隐不对"、不急于行动。允许悬置,对自己说"我注意到了,先不处理"。

⊘ 禁止:做任何不可逆决策。
B · Executing

Execute

执行态 · 行动力主导

主动进入,明确时间窗。屏蔽干扰、容忍粗糙、不修改方向。完成一件具体的事。

⊘ 禁止:中途重新评估"这件事该不该做"。
C · Resting

Rest

休整态 · 卸载力主导

主动进入,承认自己需要。暂存所有未完成事项,相信它们会在需要时回来。允许低价值的事。

⊘ 禁止:偷偷处理 A 或 B 的事。

三个状态思考方式完全不同:扫描需要慢、悬置、容忍模糊执行需要快、屏蔽噪音、容忍粗糙休整需要信任——信任放下后还能找回来。

你过去训练自己的方式偏向用判断力的态度去做所有事。想得太细,行动力被吃掉;不敢真放下,因为放下意味着失去监控。不是道德问题,是你大脑的默认调度策略不分场景。

§ 05 — 工具

第一思考地图

极少、自动触发、不消耗大脑空间。四个问题,二十秒。

First Map
每次任务切换 / 每次"卡住"时,扫一遍。不分析。
i
我现在在哪个状态?
scan / execute / rest / 不知道
ii
我身体现在怎么样?
一个词:紧 / 累 / 稳 / 飘 / 空
iii
此刻最该做的一件事是什么?
只允许说一件。如果是"想一个问题",立刻具体化为限时执行
iv
我在回避什么?
说出来,不解决。"不解决"让它轻,轻才能持续

状态 → 身体 → 行动 → 盲区。前两个校准当下,第三个指向下一步,第四个指向被压抑的部分。

形式:手机备忘录一个文件叫"校准",每次跑完追加四行。不要 app。不要 Obsidian。任何工具都会鼓励你"做得更好",加标签、加 dashboard、做 review——你不需要这些。

一周回头扫一次:"回避"那一栏会反复出现同一个东西——那就是你这段时间真正的问题。

§ 06 — 进阶

"那思考
在哪里发生?"

思考不是一个状态。是三个状态各自内部的活动。

状态
对应思考形态
特征
扫描
悬置不要求结论,让问题在意识里漂浮
允许"卡在那里"几天甚至几周;不主动调动认知资源;写一行字记下,继续做别的
执行
解题紧盯目标,排除干扰,求最快路径
完整时间块;写下来不空想;时间到就停;输入必须是已经成熟的问题
休整
后台不主动想,让潜意识自己发酵
身体做别的事;不偷偷思考;接受"什么都没想出来";洞察经常在这里冒出来

"规划"同样不是一件事,是三件事:方向选择(A)需要放弃、属于扫描态、靠悬置发酵;路径设计(B)需要结构、属于执行态、是典型解题;动作编排(C)需要具体、在两态交界、由第一思考地图捕捉。

越长的尺度越靠扫描态——需要悬置、发酵、身体信号。越短的尺度越靠执行态——需要具体、专注、排他。大多数人完全反着来。

你的强项是 B 和 C。你的盲点是 A——你的结构化能力一旦启动就跳过 A 直接做 B,因为 B 有产出感、A 没有。但 A 没做透,B 做得再漂亮也是在错的方向上漂亮。

§ 07 — 边界

关于
直播态与表演型

"被观看时表现更好"是真实存在的现象。但分清是工具问题还是身份问题。

社会促进效应:简单/熟练任务,被观看时表现显著提高;复杂/不熟练任务,被观看时表现下降。所以"直播状态出最佳表现"对你成立,说明你想做的那件事对你已经熟练了——你不是在学习,是在表达。

人工触发直播态:摄像头录自己(最直接)/ 对一个具体的人说话 / 定时承诺 / 真直播。

值得停一下

这些方法对"被看时表现更好"的人是纯工具。但对"自我感建立在被看见上"的人,它们会加剧问题——你会越来越只能在被看时存在,越来越不能在独处时感到自己是真的。

判断方法:一个人没有任何观察者时,你能不能专注、有想法、感到自己"活着"?做出印象深刻的表现之后,你的感觉是"我做到了"还是"他们觉得我做到了"?

不要用"独处=真实,被看=表演"这种二元对立绑架自己。那是另一种过度工程——只不过用的不是 schema 而是道德判断。

§ 08 — 沉淀

这次对话里,
真正值得停下来的几件事

  1. 地图是用来探索的,信号清单是用来防御的。生活大部分时间需要的是后者。你一直在做前者。
  2. 敏感度不能通过建知识结构提升。它来自反复看到自己判断错的瞬间。误判日志比方法论库更稀缺。
  3. 你卸载不掉,是因为不信任未来的自己。解法不是更好的系统,是做几次小卸载实验。
  4. 你"知"的东西从来没有真正具体过。"我应该早睡"不是知,"11 点把手机放客厅充电"才是。人无法执行原则,只能执行动作。
  5. 你的工作模式:B、C 极强,A 缺失。结构化能力让你跳过方向选择直接做路径设计。再漂亮的路径也救不了错的方向。
  6. "做大事"是回避"对自己负责"的完美合法掩护。没人会质疑你为公司、为 IPO、为团队投入——连你自己都不会。代价是那些柔软的东西永远轮不上。
  7. 慢下来那一刻很珍贵。它来得难,关上之后下一次再打开可能要很久。"切回工作"的那个瞬间,本身就是信号。
§ 09 — 执行

这周做的
具体三件事

不要叠加。不要建系统。不要做 tracker。

信号一行字

注意到"隐隐不对"的瞬间,手机备忘录写一行:[时间] 信号:__ 场景:__。不分析、不追问。一周。让信号活着,让它在意识里多待一会儿。

每天一段执行态

提前声明:从 X 点到 Y 点,我只做 Z,不评估、不切换。30 分钟也行。声明本身就是工具。

一次小卸载实验

挑一件挂在心上的"次要事"(不是核心责任),写在纸上扔抽屉,告诉自己"我接下来 7 天不想它"。7 天后看会发生什么。大概率世界没塌。

你不是在内化一个东西。
你是在累积反应
累积够了,那个东西就在那里了。
你不需要内化大脑。
你需要信任身体
判断力、行动力、卸载力,最后都长在那上面。
end · scroll back when needed · 慢一些没关系