Agentic 系统

学习与自进化

静态 Agent 的天花板是重复犯错。本文给出运行时学习的三个层次(L1 会话内适应、L2 跨会话经验沉淀、L3 行为策略进化)的具体 schema、经验回放与 Prompt 自优化的伪代码、动态 Few-shot 的检索逻辑,以及一条不可越过的红线——学习不能突破安全策略、不能升级权限、不能扩展行为空间。

Agentic 系统

多 Agent 协作

单 Agent 有四个天花板——context、专业性、可靠性、并行度。多 Agent 协作不是把 Agent 串起来,而是用架构换可靠性。本文给出四种协作模式的核心伪代码、通信机制的 schema 选型、失败传播的处理路径,以及最常被低估的乘法效应数学。

Agentic 系统

规划、推理与反思

LLM 的 next-token prediction 天然缺乏前瞻和回溯。规划补前瞻、推理补深度、反思补回溯。本文给出 ReAct、Plan-and-Execute、Tree-of-Thought、Hierarchical 四种范式的核心伪代码与适用边界,反思机制的 schema 与终止条件,以及推理时扩展(test-time compute scaling)对 Agent 架构的影响。