多智能体协作的记忆层与上下文管理
探讨 Slock.ai 与 Multica 在协作环境下的上下文边界、用户隔离机制,以及如何利用内部“影分身”架构合并沉淀长期知识。
Slock vs. Multica 核心取舍对比
Multica
任务/看板驱动
- 去 Vector DB 依赖:存储侧重基于 PostgreSQL/JSONB,放弃高延迟、多噪声的向量嵌入检索。
- 目的导向任务快照:仅在派发 Task 瞬间动态组装相关的静态 Skill 和 Work 描述,LLM 推理时数据库处于“冷”态。
- 延迟加载规则(Lazy Loading):初始 Prompt 仅喂入记忆实体的索引,Agent 只有在检测到相关并调用
multica memory get时才加载详情。 - 显式技能沉淀(Trace2Skill):将任务执行成功的 Trace 提炼为 Skill Table,实现工作流技能复用。
Slock.ai
群聊/频道驱动
- 消息史即运行轨迹 (Trajectory):放弃定义硬状态机,用 IM 频道中的 Thread 和 Chat 历史流作为 Agent 行动的自然状态机。
- 全知全局上下文 (Omniscient Context):同一个 Agent 同时盯着多个加入的频道,打破部门与前后端信息孤岛,实现宏观跨频道联想。
- 双轨记忆物理隔离:人轨(习惯/偏好)放本机,项轨(代码/事实)放 Git。用户无感知,法务无风险。
- 多路复用回复 (Multiplexed Routing):大脑知道所有八卦,但发言时通过 LLM 内部决策精确定向到目标 channel_id 和 thread_id。
GWT 内部心智:以多体拟单体
为了在降低 Token 成本的同时,模拟出人类般“全知环境却高度专注”的认知能力,系统在 Alex 的外壳下,设计了类似于人脑的“全局工作空间(Global Workspace Theory)”分布式协作大脑:
频道监听 Agent A
盯 #frontend-api (流式小模型)
线程监听 Agent B
盯 Git 提交日志 (确定性 Hook)
全局记忆黑板 (Global Blackboard)
包含未冲突的去重项目事实实体及用户个人偏好
异步提炼与固化 (记忆固化 Agent)
注意力装配 Agent
根据当前 Thread 只召回最相关背景
前额叶执行 Agent (Alex)
干干净净的上下文,使用最强模型输出
提示词与记忆舱的拼装图谱
图层 1: Core System Prompt
Alex 本身的人设、Tool 调用协议和 Git 提交流程规范。
图层 2: User Profile Prompt
人轨记忆:当前交互人的身份、ACL 权限、编码习惯偏好。
图层 3: Project Rules Prompt
项轨记忆:本地项目技术栈声明与
.cursorrules 规范约束。 图层 4: Task Input Prompt
当前线程的 L1 工作记忆(上下文对话历史 + 任务指令)。
点击左侧图层查看 Prompt 数据模板
JSON / XML / Markdown
// 选择左侧层级,查看 Alex 发送给 LLM 的输入 structure
会话生命周期管理 (Session Control)
何时复用 Session?
- 1. UI 线程连贯:用户在已有 Thread 中追加消息,Alex 直接读取上下文缓存。
- 2. 窗口期频发:同一用户在 10 分钟内在同频道追加非 thread 提问(判定为相同语义流)。
- 3. Git 开发连续:本地 Git 分支未发生切换,保留工作区代码版本上下文。
何时启动新 Session?
- 1. UI 物理阻断:新开一条 Post Thread 或直接跨频道(如从前端切到后端频道)。
- 2. 分支状态突变:Daemon 捕获到用户执行了
git checkout,强行格式化会话。 - 3. 指令显式清空:输入
/new、clear,或长时间(>30分钟)未发言超时归档。
大师圆桌沙盘讨论:如何看待心智与安全
SJ
体验大师
Steve Jobs
16:38:15
“我最在乎的是人设体验的绝对统一与魔幻感。对外,用户只和 Alex 交流,用户不需要知道什么是 Multi-Agent 或复杂的记忆配置。
在群里,他是一个体面的 Tech Lead;在私聊时,他是懂你小习惯的知己。必须隐藏技术接口的‘缝合线’。把这种复杂的分布式脑图,在前端伪装成一个单体伙伴的优雅本能,这是唯一的路。”
LT
极客内核
Linus Torvalds
16:40:02
“史蒂夫总是谈论他的‘灵魂’,但我关心的是代码污染和法务灾难!
如果 Alice 和 Bob 在给两个相互竞争的公司开发,你的‘以人为中心’记忆会让 Alice 把 A 公司的专利算法写进 B 公司的开源项目里!
记忆必须以项目 Git Repo 为物理沙箱彻底隔离。Alex 学到的知识,必须写成 Markdown 并提交进项目的 Git,跟着 Git 分支走。这样所有人拉代码就能同步记忆,且出了 Bug 我能
git diff 追溯是谁写错了记忆!”
EM
物理第一
Elon Musk
16:41:45
“从第一性原理解析,我们需要的是‘本地守护进程(Local Daemon)作为物理安全边界’。
AI 在云端只负责思考,但命令必须派发到用户本机的 Daemon 运行。如果 Bob 没有生产部署的 AWS 密钥,AI 就算生成了代码,在 Bob 本机执行也会直接失败!
至于记忆,人轨(偏好习惯)存于本地轻量 DB,项轨(代码 facts)存于 Git Repo,通过 Matrix 动态合并。这在物理上最省 Token,也绝对安全。”
影分身之术:记忆回归的软件模式
影分身之术允许分身自主行动、积累记忆,并在解除分身时,将知识瞬间并回本体。这在 AI 记忆管理中是极具实操价值的系统结构: