基于 LangGraph 的多 Agent 状态机,统一路由、分层记忆、类型化审查
| 档位 | 用途 | 特点 | 延迟 |
|---|---|---|---|
| Fast | 对话路由、结构化决策、质量硬伤检查、元数据提取 | 非流式同步,高准确率 | 1-3s |
| Thinking | 世界/人物/主线构建、正文写作、读者模拟 | 流式 + reasoning chain | 30-120s |
思考模式由两个独立开关控制:ENABLE_THINKING(API 层:是否启用 reasoning) + SHOW_THINKING(UI 层:是否显示思考过程)
Thinking 参数自动按厂商生成,一套代码适配主流大模型:
| 厂商 | Thinking 参数 | 示例模型 |
|---|---|---|
| Qwen (阿里百炼) | extra_body.enable_thinking=True | qwen3-max / qwen3.5-flash |
| Anthropic Claude | thinking.budget_tokens=N | claude-sonnet-4-5 |
| DeepSeek | 默认开启 | deepseek-r1 |
| 智普 GLM | extra_body.thinking.type="enabled" | GLM-Z1 / GLM-4.5 |
| 字节豆包 | extra_body.thinking.type="enabled" | Doubao-1.5-thinking |
| Google Gemini | reasoning_effort | gemini-2.5-pro |
| OpenAI o 系列 | reasoning_effort | o3 / o4-mini |
50+ 字段的 TypedDict 全局状态,覆盖书目/类型/世界/人物/剧情/写作/审查/记忆/流程全维度。
每本书独立 state.db(全量快照)+ checkpoints.db(LangGraph SqliteSaver)。messages 不持久化。
library/book_{id}/chapters/ch0001.txt — 每章正文独立存储。vector_store/ — FAISS 索引 + metadata。
多 Agent 状态机编排
条件边 + checkpoint
统一 LLM 调用层
7+ 厂商 thinking 适配
本地向量检索
SentenceTransformers
CLI 交互界面
Panel / Spinner / 流式输出
零构建步骤
pip install 即用