当你不再
给自己建模
关于研究 agent、思考状态、规划层次,
以及你不肯承认的、那个柔软的真问题。
从一个 research agent 的设计开始
你问怎么调 LLM、维护什么 state、用什么 prompt。
我们谈了一个完整的研究 agent 架构:单 agent 循环 → plan-execute 演进;state 必须显式分层(任务 / 计划 / 证据 / 工作记忆 / 控制),tool_result 不能全塞进 messages,要进结构化存储,messages 里留摘要 + 引用 ID。
关键设计:scratchpad 是 agent 写给自己看的——每轮研究后让它更新"目前我知道什么、还缺什么",下一轮把这个浓缩塞回 prompt。budget 必须硬上限,否则 agent 失控时会搜 50 次还在原地打转。
然后你问:研究方案怎么生成?怎么用 prompt 激活"群星荟萃"的人类智慧?
抽象的"用第一性原理"激活效果一般。具名效果好得多——但反直觉的是,让模型"扮演"某个人效果较差,让它"采用某人的提问方式"效果好得多。
真正的 planning 不是拆解子问题。是先选方法论:第一性原理、历史溯源、对立面思考、结构-机制-演化、案例+反例、多视角并置、类比迁移、数据驱动……根据问题类型路由。这一步是元规划,跳过它,所有 prompt 工程都是在劣质骨架上做装饰。
对抗"目录式拆解"的几个技巧:强制非对称(必须有一个"危险问题"放在第一个)、先写假设性结论草稿(再去验证而不是无偏探索)、识别"已死的争论"、明确放弃哪些方向。
但我也泼了一盆冷水:LLM 做不到真正的洞察。它能调用方法的形式,能调用领域语料,能强制结构化输出。它做不到"对反常的敏感"——这是模型最致命的 plausibility bias。所以现实目标是:让 research agent 达到"训练有素的初级研究员"水平,把桌面研究的成本压到 1/20。想要群星水平的洞察,目前还是得靠人。
然后你问了一个
不一样的问题
"我应该维护一个怎么样的知识地图,才能掌控生活?"
你不需要"知识地图"。你已经有太多结构化的东西了——道法术、九表 schema、三层架构、方法论库、tacit/explicit 知识分类、Implementation Science 框架。
你对"给世界建模"这件事有近乎本能的偏好。所以如果你做"掌控生活的知识地图",我能预测——你会做出一个 Obsidian 库,分十几个领域,配 Dataview,过两个月废弃。
掌控生活的瓶颈不在"我还没有一张足够好的地图"。
区分两类问题:
判断当下
今天要不要推 X、这个供应商靠不靠谱、家人状态对不对。地图反而有害——它把"对当下的感知"替换成"对模型的查询"。
结构化知识
SLM 工艺机理、AI agent 架构、公司战略。这类问题地图有用,是你过去一直在做的。
误判日志
四列:日期 / 当时判断 / 后来真相 / 我忽略了什么信号。半年后回看,重复忽略的信号有规律,那是直觉的种子。
生活的大部分是 A 类。你过去的"地图"都是 B 类。你需要的不是更多的 B,是被你跳过的 A 和 C。
"我想内化
自己的大脑和行为"
这个表达本身就是防御。
"内化大脑和行为"——这是把自己当成待优化的系统在说话。主语和宾语都是"自己",但听起来像工程师在描述外部对象。它的代价是:真正的感受被压在底下了。
"内化"在你的语境里有歧义,可能指四件完全不同的事:知行合一 / 自我一致 / 自动化反应质量 / 减少自我观察的疲惫。它们的解法相反。
行为不是从思想内化来的,是从反复经验内化来的。你不能跳过经验直接拿到内化的结果。
不要试图"成为一个更专注的人",去在今天下午两点的某个具体时刻,把手机放进抽屉。不要试图"成为一个不焦虑的人",去在下次心跳加速时,承认自己在焦虑,然后继续做手上的事。每一次具体的选择,都在改写一点点。
三个状态,
不是三个能力
判断力、行动力、卸载力——你都有。你缺的是知道此刻在哪一个。
Scan
默认状态。接收信号、识别"隐隐不对"、不急于行动。允许悬置,对自己说"我注意到了,先不处理"。
Execute
主动进入,明确时间窗。屏蔽干扰、容忍粗糙、不修改方向。完成一件具体的事。
Rest
主动进入,承认自己需要。暂存所有未完成事项,相信它们会在需要时回来。允许低价值的事。
三个状态思考方式完全不同:扫描需要慢、悬置、容忍模糊;执行需要快、屏蔽噪音、容忍粗糙;休整需要信任——信任放下后还能找回来。
你过去训练自己的方式偏向用判断力的态度去做所有事。想得太细,行动力被吃掉;不敢真放下,因为放下意味着失去监控。不是道德问题,是你大脑的默认调度策略不分场景。
第一思考地图
极少、自动触发、不消耗大脑空间。四个问题,二十秒。
状态 → 身体 → 行动 → 盲区。前两个校准当下,第三个指向下一步,第四个指向被压抑的部分。
形式:手机备忘录一个文件叫"校准",每次跑完追加四行。不要 app。不要 Obsidian。任何工具都会鼓励你"做得更好",加标签、加 dashboard、做 review——你不需要这些。
一周回头扫一次:"回避"那一栏会反复出现同一个东西——那就是你这段时间真正的问题。
"那思考
在哪里发生?"
思考不是一个状态。是三个状态各自内部的活动。
"规划"同样不是一件事,是三件事:方向选择(A)需要放弃、属于扫描态、靠悬置发酵;路径设计(B)需要结构、属于执行态、是典型解题;动作编排(C)需要具体、在两态交界、由第一思考地图捕捉。
越长的尺度越靠扫描态——需要悬置、发酵、身体信号。越短的尺度越靠执行态——需要具体、专注、排他。大多数人完全反着来。
你的强项是 B 和 C。你的盲点是 A——你的结构化能力一旦启动就跳过 A 直接做 B,因为 B 有产出感、A 没有。但 A 没做透,B 做得再漂亮也是在错的方向上漂亮。
关于
直播态与表演型
"被观看时表现更好"是真实存在的现象。但分清是工具问题还是身份问题。
社会促进效应:简单/熟练任务,被观看时表现显著提高;复杂/不熟练任务,被观看时表现下降。所以"直播状态出最佳表现"对你成立,说明你想做的那件事对你已经熟练了——你不是在学习,是在表达。
人工触发直播态:摄像头录自己(最直接)/ 对一个具体的人说话 / 定时承诺 / 真直播。
这些方法对"被看时表现更好"的人是纯工具。但对"自我感建立在被看见上"的人,它们会加剧问题——你会越来越只能在被看时存在,越来越不能在独处时感到自己是真的。
判断方法:一个人没有任何观察者时,你能不能专注、有想法、感到自己"活着"?做出印象深刻的表现之后,你的感觉是"我做到了"还是"他们觉得我做到了"?
不要用"独处=真实,被看=表演"这种二元对立绑架自己。那是另一种过度工程——只不过用的不是 schema 而是道德判断。
这次对话里,
真正值得停下来的几件事
- 地图是用来探索的,信号清单是用来防御的。生活大部分时间需要的是后者。你一直在做前者。
- 敏感度不能通过建知识结构提升。它来自反复看到自己判断错的瞬间。误判日志比方法论库更稀缺。
- 你卸载不掉,是因为不信任未来的自己。解法不是更好的系统,是做几次小卸载实验。
- 你"知"的东西从来没有真正具体过。"我应该早睡"不是知,"11 点把手机放客厅充电"才是。人无法执行原则,只能执行动作。
- 你的工作模式:B、C 极强,A 缺失。结构化能力让你跳过方向选择直接做路径设计。再漂亮的路径也救不了错的方向。
- "做大事"是回避"对自己负责"的完美合法掩护。没人会质疑你为公司、为 IPO、为团队投入——连你自己都不会。代价是那些柔软的东西永远轮不上。
- 慢下来那一刻很珍贵。它来得难,关上之后下一次再打开可能要很久。"切回工作"的那个瞬间,本身就是信号。
这周做的
具体三件事
不要叠加。不要建系统。不要做 tracker。
信号一行字
注意到"隐隐不对"的瞬间,手机备忘录写一行:[时间] 信号:__ 场景:__。不分析、不追问。一周。让信号活着,让它在意识里多待一会儿。
每天一段执行态
提前声明:从 X 点到 Y 点,我只做 Z,不评估、不切换。30 分钟也行。声明本身就是工具。
一次小卸载实验
挑一件挂在心上的"次要事"(不是核心责任),写在纸上扔抽屉,告诉自己"我接下来 7 天不想它"。7 天后看会发生什么。大概率世界没塌。
你是在累积反应。
累积够了,那个东西就在那里了。
你需要信任身体。