AIGC 创作

AI 短剧工程实践:全自动配音流水线

短剧出海的配音成本扛不住人工——单集利润几毛钱,人工配音要几千块。本文记录一套实际跑通的全自动配音流水线:ASR→说话人分离→翻译→TTS→混音,单集成本 ¥0.3-0.5,支持批量生产。从 SSOT 驱动的架构设计到增量执行的成本控制,从 Voice Casting UI 到行业趋势判断,完整拆解 AI 配音从技术选型到规模化生产的工程路径。

Agentic 系统

多 Agent 协作

单 Agent 有四个天花板——context、专业性、可靠性、并行度。多 Agent 协作不是把 Agent 串起来,而是用架构换可靠性。本文给出四种协作模式的核心伪代码、通信机制的 schema 选型、失败传播的处理路径,以及最常被低估的乘法效应数学。

Agentic 系统

规划、推理与反思

LLM 的 next-token prediction 天然缺乏前瞻和回溯。规划补前瞻、推理补深度、反思补回溯。本文给出 ReAct、Plan-and-Execute、Tree-of-Thought、Hierarchical 四种范式的核心伪代码与适用边界,反思机制的 schema 与终止条件,以及推理时扩展(test-time compute scaling)对 Agent 架构的影响。