架构设计与认知模型

多智能体协作的记忆层与上下文管理

探讨 Slock.ai 与 Multica 在协作环境下的上下文边界、用户隔离机制,以及如何利用内部“影分身”架构合并沉淀长期知识。

Slock vs. Multica 核心取舍对比

Multica 任务/看板驱动
  • 去 Vector DB 依赖:存储侧重基于 PostgreSQL/JSONB,放弃高延迟、多噪声的向量嵌入检索。
  • 目的导向任务快照:仅在派发 Task 瞬间动态组装相关的静态 Skill 和 Work 描述,LLM 推理时数据库处于“冷”态。
  • 延迟加载规则(Lazy Loading):初始 Prompt 仅喂入记忆实体的索引,Agent 只有在检测到相关并调用 multica memory get 时才加载详情。
  • 显式技能沉淀(Trace2Skill):将任务执行成功的 Trace 提炼为 Skill Table,实现工作流技能复用。
Slock.ai 群聊/频道驱动
  • 消息史即运行轨迹 (Trajectory):放弃定义硬状态机,用 IM 频道中的 Thread 和 Chat 历史流作为 Agent 行动的自然状态机。
  • 全知全局上下文 (Omniscient Context):同一个 Agent 同时盯着多个加入的频道,打破部门与前后端信息孤岛,实现宏观跨频道联想。
  • 双轨记忆物理隔离:人轨(习惯/偏好)放本机,项轨(代码/事实)放 Git。用户无感知,法务无风险。
  • 多路复用回复 (Multiplexed Routing):大脑知道所有八卦,但发言时通过 LLM 内部决策精确定向到目标 channel_id 和 thread_id。

GWT 内部心智:以多体拟单体

为了在降低 Token 成本的同时,模拟出人类般“全知环境却高度专注”的认知能力,系统在 Alex 的外壳下,设计了类似于人脑的“全局工作空间(Global Workspace Theory)”分布式协作大脑:

频道监听 Agent A
盯 #frontend-api (流式小模型)
线程监听 Agent B
盯 Git 提交日志 (确定性 Hook)
全局记忆黑板 (Global Blackboard)
包含未冲突的去重项目事实实体及用户个人偏好
异步提炼与固化 (记忆固化 Agent)
注意力装配 Agent
根据当前 Thread 只召回最相关背景
前额叶执行 Agent (Alex)
干干净净的上下文,使用最强模型输出

提示词与记忆舱的拼装图谱

图层 1: Core System Prompt
Alex 本身的人设、Tool 调用协议和 Git 提交流程规范。
图层 2: User Profile Prompt
人轨记忆:当前交互人的身份、ACL 权限、编码习惯偏好。
图层 3: Project Rules Prompt
项轨记忆:本地项目技术栈声明与 .cursorrules 规范约束。
图层 4: Task Input Prompt
当前线程的 L1 工作记忆(上下文对话历史 + 任务指令)。
点击左侧图层查看 Prompt 数据模板 JSON / XML / Markdown
// 选择左侧层级,查看 Alex 发送给 LLM 的输入 structure

会话生命周期管理 (Session Control)

何时复用 Session?

  • 1. UI 线程连贯:用户在已有 Thread 中追加消息,Alex 直接读取上下文缓存。
  • 2. 窗口期频发:同一用户在 10 分钟内在同频道追加非 thread 提问(判定为相同语义流)。
  • 3. Git 开发连续:本地 Git 分支未发生切换,保留工作区代码版本上下文。

何时启动新 Session?

  • 1. UI 物理阻断:新开一条 Post Thread 或直接跨频道(如从前端切到后端频道)。
  • 2. 分支状态突变:Daemon 捕获到用户执行了 git checkout,强行格式化会话。
  • 3. 指令显式清空:输入 /newclear,或长时间(>30分钟)未发言超时归档。

大师圆桌沙盘讨论:如何看待心智与安全

SJ
体验大师
Steve Jobs 16:38:15
“我最在乎的是人设体验的绝对统一与魔幻感。对外,用户只和 Alex 交流,用户不需要知道什么是 Multi-Agent 或复杂的记忆配置。 在群里,他是一个体面的 Tech Lead;在私聊时,他是懂你小习惯的知己。必须隐藏技术接口的‘缝合线’。把这种复杂的分布式脑图,在前端伪装成一个单体伙伴的优雅本能,这是唯一的路。”
LT
极客内核
Linus Torvalds 16:40:02
“史蒂夫总是谈论他的‘灵魂’,但我关心的是代码污染和法务灾难! 如果 Alice 和 Bob 在给两个相互竞争的公司开发,你的‘以人为中心’记忆会让 Alice 把 A 公司的专利算法写进 B 公司的开源项目里! 记忆必须以项目 Git Repo 为物理沙箱彻底隔离。Alex 学到的知识,必须写成 Markdown 并提交进项目的 Git,跟着 Git 分支走。这样所有人拉代码就能同步记忆,且出了 Bug 我能 git diff 追溯是谁写错了记忆!”
EM
物理第一
Elon Musk 16:41:45
“从第一性原理解析,我们需要的是‘本地守护进程(Local Daemon)作为物理安全边界’。 AI 在云端只负责思考,但命令必须派发到用户本机的 Daemon 运行。如果 Bob 没有生产部署的 AWS 密钥,AI 就算生成了代码,在 Bob 本机执行也会直接失败! 至于记忆,人轨(偏好习惯)存于本地轻量 DB,项轨(代码 facts)存于 Git Repo,通过 Matrix 动态合并。这在物理上最省 Token,也绝对安全。”

影分身之术:记忆回归的软件模式

影分身之术允许分身自主行动、积累记忆,并在解除分身时,将知识瞬间并回本体。这在 AI 记忆管理中是极具实操价值的系统结构:

影分身术心智
  • 分身(Kage Bunshin):主身消耗查克拉,生成拥有相同意志的物理分身。
  • 修行:分身在不同地方与敌人战斗、阅读卷轴,获得独立的工作记忆。
  • 解印(Pop/Release):分身受到重创或任务结束,化为烟雾消失。
  • 汇聚:所有的疲劳、经验和新知,在同一瞬间融合进入主身的大脑。
Git & LLM 提炼实现
  • 分支(Spawn):从 Main 检出,克隆当前 PROJECT_MIND.md,分配到特定子线程。
  • 会话运行:在特定分支/线程里写代码、跑单测,积累会话历史和执行日志。
  • 合并(Disperse & Merge):任务结束,删除本地分支和会话。
  • 提炼(Consolidation):在 Merge 瞬间,跑一次 LLM 事实提炼,把分支上的产出及新规范追加合入主 PROJECT_MIND.md