架构设计与认知模型

多智能体协作的记忆层与上下文管理

探讨 Slock.ai 与 Multica 在协作环境下的上下文边界、用户隔离机制，以及如何利用内部“影分身”架构合并沉淀长期知识。

Slock vs. Multica 核心取舍对比

去 Vector DB 依赖：存储侧重基于 PostgreSQL/JSONB，放弃高延迟、多噪声的向量嵌入检索。
目的导向任务快照：仅在派发 Task 瞬间动态组装相关的静态 Skill 和 Work 描述，LLM 推理时数据库处于“冷”态。
延迟加载规则（Lazy Loading）：初始 Prompt 仅喂入记忆实体的索引，Agent 只有在检测到相关并调用 multica memory get 时才加载详情。
显式技能沉淀（Trace2Skill）：将任务执行成功的 Trace 提炼为 Skill Table，实现工作流技能复用。

消息史即运行轨迹 (Trajectory)：放弃定义硬状态机，用 IM 频道中的 Thread 和 Chat 历史流作为 Agent 行动的自然状态机。
全知全局上下文 (Omniscient Context)：同一个 Agent 同时盯着多个加入的频道，打破部门与前后端信息孤岛，实现宏观跨频道联想。
双轨记忆物理隔离：人轨（习惯/偏好）放本机，项轨（代码/事实）放 Git。用户无感知，法务无风险。
多路复用回复 (Multiplexed Routing)：大脑知道所有八卦，但发言时通过 LLM 内部决策精确定向到目标 channel_id 和 thread_id。

GWT 内部心智：以多体拟单体

为了在降低 Token 成本的同时，模拟出人类般“全知环境却高度专注”的认知能力，系统在 Alex 的外壳下，设计了类似于人脑的“全局工作空间（Global Workspace Theory）”分布式协作大脑：

频道监听 Agent A

盯 #frontend-api (流式小模型)

线程监听 Agent B

盯 Git 提交日志 (确定性 Hook)

全局记忆黑板 (Global Blackboard)

包含未冲突的去重项目事实实体及用户个人偏好

异步提炼与固化 (记忆固化 Agent)

注意力装配 Agent

根据当前 Thread 只召回最相关背景

前额叶执行 Agent (Alex)

干干净净的上下文，使用最强模型输出

提示词与记忆舱的拼装图谱

图层 1: Core System Prompt

Alex 本身的人设、Tool 调用协议和 Git 提交流程规范。

图层 2: User Profile Prompt

人轨记忆：当前交互人的身份、ACL 权限、编码习惯偏好。

图层 3: Project Rules Prompt

项轨记忆：本地项目技术栈声明与 .cursorrules 规范约束。

图层 4: Task Input Prompt

当前线程的 L1 工作记忆（上下文对话历史 + 任务指令）。

点击左侧图层查看 Prompt 数据模板 JSON / XML / Markdown

// 选择左侧层级，查看 Alex 发送给 LLM 的输入 structure

会话生命周期管理 (Session Control)

何时复用 Session？

1. UI 线程连贯：用户在已有 Thread 中追加消息，Alex 直接读取上下文缓存。
2. 窗口期频发：同一用户在 10 分钟内在同频道追加非 thread 提问（判定为相同语义流）。
3. Git 开发连续：本地 Git 分支未发生切换，保留工作区代码版本上下文。

何时启动新 Session？

1. UI 物理阻断：新开一条 Post Thread 或直接跨频道（如从前端切到后端频道）。
2. 分支状态突变：Daemon 捕获到用户执行了 git checkout，强行格式化会话。
3. 指令显式清空：输入 /new、clear，或长时间（>30分钟）未发言超时归档。

大师圆桌沙盘讨论：如何看待心智与安全

体验大师

Steve Jobs 16:38:15

“我最在乎的是人设体验的绝对统一与魔幻感。对外，用户只和 Alex 交流，用户不需要知道什么是 Multi-Agent 或复杂的记忆配置。在群里，他是一个体面的 Tech Lead；在私聊时，他是懂你小习惯的知己。必须隐藏技术接口的‘缝合线’。把这种复杂的分布式脑图，在前端伪装成一个单体伙伴的优雅本能，这是唯一的路。”

极客内核

Linus Torvalds 16:40:02

“史蒂夫总是谈论他的‘灵魂’，但我关心的是代码污染和法务灾难！如果 Alice 和 Bob 在给两个相互竞争的公司开发，你的‘以人为中心’记忆会让 Alice 把 A 公司的专利算法写进 B 公司的开源项目里！ 记忆必须以项目 Git Repo 为物理沙箱彻底隔离。Alex 学到的知识，必须写成 Markdown 并提交进项目的 Git，跟着 Git 分支走。这样所有人拉代码就能同步记忆，且出了 Bug 我能 git diff 追溯是谁写错了记忆！”

物理第一

Elon Musk 16:41:45

“从第一性原理解析，我们需要的是‘本地守护进程（Local Daemon）作为物理安全边界’。 AI 在云端只负责思考，但命令必须派发到用户本机的 Daemon 运行。如果 Bob 没有生产部署的 AWS 密钥，AI 就算生成了代码，在 Bob 本机执行也会直接失败！至于记忆，人轨（偏好习惯）存于本地轻量 DB，项轨（代码 facts）存于 Git Repo，通过 Matrix 动态合并。这在物理上最省 Token，也绝对安全。”

影分身之术：记忆回归的软件模式

影分身之术允许分身自主行动、积累记忆，并在解除分身时，将知识瞬间并回本体。这在 AI 记忆管理中是极具实操价值的系统结构：

影分身术心智

分身（Kage Bunshin）：主身消耗查克拉，生成拥有相同意志的物理分身。
修行：分身在不同地方与敌人战斗、阅读卷轴，获得独立的工作记忆。
解印（Pop/Release）：分身受到重创或任务结束，化为烟雾消失。
汇聚：所有的疲劳、经验和新知，在同一瞬间融合进入主身的大脑。

Git & LLM 提炼实现

分支（Spawn）：从 Main 检出，克隆当前 PROJECT_MIND.md，分配到特定子线程。
会话运行：在特定分支/线程里写代码、跑单测，积累会话历史和执行日志。
合并（Disperse & Merge）：任务结束，删除本地分支和会话。
提炼（Consolidation）：在 Merge 瞬间，跑一次 LLM 事实提炼，把分支上的产出及新规范追加合入主 PROJECT_MIND.md。