fix(agent): 强化 prompt 可靠性——结果验证、budget 语义、安全边界与认识论纪律 by cyfung1031 · Pull Request #1354 · scriptscat/scriptcat

cyfung1031 · 2026-04-18T03:19:34Z

背景

在对 agent 行为的实际观察中，发现四类系统性失效模式：

主 agent 盲目消费 sub-agent 结果——即使结果包含失败信息，也被静默拼入最终输出，错误静默传播。
Sub-agent 因误解 budget 语义而过早放弃——现有措辞与主 agent 的 50 轮限制框架一致，导致 sub-agent 误认为 budget 紧张而提前终止本可完成的子任务。
不可逆操作清单缺少 userscript 场景——安装/修改 userscript 与提交表单同属不可逆高风险操作，但未被纳入确认前置流程。
Sub-agent 静默猜测，不区分已确认事实与推断——主 agent 拿到的结果中，事实、推断、缺口混在一起，无法正确决策。

此外，compact 摘要器在长对话中频繁丢失用户中途修正指令，导致恢复后 agent 重复已纠正的错误；并行 sub-agent 有依赖关系时，下游 agent 在上游未成功的情况下也会静默继续执行。

变更内容

`system_prompt.ts`

新增：sub-agent 结果接收规范

在 SECTION_SUB_AGENT 的 ### Anti-Patterns 之后插入 ### Receiving Sub-Agent Results 段，明确要求：

收到结果后先检查 Issues 字段，有问题则显式决策（重试 / 换 agent / 上报用户），不得静默并入
部分完成 ≠ 成功，需作为部分失败处理
合并多个 sub-agent 结果前须逐个独立校验

新增：并行任务 fallback 指引

在 ### Writing Sub-Agent Prompts 末尾追加：若 sub-agent 依赖上游输出（如 OPFS 文件），必须在委托 prompt 中写明输入缺失时的 fallback 行为，不得假设上游已成功。

扩展：不可逆操作确认清单

SECTION_SAFETY 第一条在 posting content 后追加 installing or modifying userscripts，并说明原因：userscript 安装后在所有匹配页面持续运行，安装前须展示 @match 模式与功能摘要供用户确认。

`sub_agent_types.ts`

SUB_AGENT_SECTION_TOOL_USAGE：budget 语义修正

将旧措辞：

You have a limited number of tool calls. Use them wisely…

替换为：

Your budget covers this subtask only — it is independent of the parent agent's budget. … Do not conserve budget by skipping verification steps or giving up prematurely.

明确 sub-agent budget 仅针对当前子任务，与主 agent 独立，消除"省 budget"导致的过早放弃行为。

researcher.systemPromptAddition：置信度分层输出

末尾追加规范：输出中须区分三类信息——

已确认事实（前缀来源："Source X states…"）
推断（显式标注："Based on the above, it appears…"）
缺口（明确说明："I could not confirm…"）

不得将三者混入单一叙述，主 agent 需要可区分的置信度信号才能正确决策。

page_operator.systemPromptAddition：动作与结果分离

末尾追加规范：「点击了提交按钮」与「表单已成功提交」是两个不同事实。每次操作后须通过 get_tab_content 或 execute_script 验证结果，无法确认时如实说明，不得推断为成功。

general.systemPromptAddition：选择透明度与失败诚实

末尾追加规范：存在多种可行方案时须简述取舍理由；方案失败时报告为失败，不得包装成"部分成功"。

`compact_prompt.ts`

buildCompactUserPrompt：中途修正指令优先级

Section 3 User Messages 改为：

明确标注"中途修正为最高优先级"
要求逐字记录用户在操作过程中插入的修正指令（如"停下"、"换个方法"）
注明后果：这类消息在长对话中最容易丢失，恢复后 agent 将重复已纠正的错误

影响范围

文件	改动性质
`system_prompt.ts`	纯字符串修改，无类型/逻辑变更
`sub_agent_types.ts`	纯字符串修改，无类型/逻辑变更
`compact_prompt.ts`	纯字符串修改，无类型/逻辑变更
`system_prompt.test.ts`	新增断言覆盖本次所有改动，存量测试不变

所有改动均为 prompt 文本，不涉及架构调整、新 agent 类型或 TypeScript 运行时逻辑。

测试

新增断言已覆盖本次所有文本变更，包括：

### Receiving Sub-Agent Results 段及关键措辞
budget 新措辞（covers this subtask only）；旧措辞（Use them wisely）已断言不再出现
Safety 段 installing or modifying userscripts 及 @match 说明
compact prompt Section 3 的 Mid-task corrections are highest priority 及逐字记录要求
researcher 三级置信度标注规范
page_operator 动作/结果分离规范
general tradeoff 透明度及失败诚实规范
fallback 指引措辞

* 删除 uint8Array 重复封装 * 添加 ResourceService.loadByUrl 单元测试 --------- Co-authored-by: 王一之 <yz@ggnb.top>

…避免 supply chain 攻击） (#1341) * pnpm cooldown: 不抓取一星期内最新版 * pnpm: 提升至 10.33.0 以使用 minimumReleaseAge 避免 supply chain 攻击 * minimumReleaseAge 延长至 30 天(43200 分钟) --------- Co-authored-by: 王一之 <yz@ggnb.top>

cyfung1031 and others added 7 commits April 8, 2026 10:07

♻️ 删除 uint8Array 重复封装 (#1340)

39aff8a

* 删除 uint8Array 重复封装 * 添加 ResourceService.loadByUrl 单元测试 --------- Co-authored-by: 王一之 <yz@ggnb.top>

✅ 单元测试中 axios 改为 moment (#1349)

89694a6

⬆️ 修复所有 npm vulnerability (#1350)

283bbef

Merge branch 'main' into release/v1.4-agent

0689fe9

Prompt Updates

cd99b33

Update pnpm-lock.yaml

3f32948

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

fix(agent): 强化 prompt 可靠性——结果验证、budget 语义、安全边界与认识论纪律#1354

fix(agent): 强化 prompt 可靠性——结果验证、budget 语义、安全边界与认识论纪律#1354
cyfung1031 wants to merge 7 commits intorelease/v1.4-agentfrom
v1.4-agent-prompt-change-01

cyfung1031 commented Apr 18, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

cyfung1031 commented Apr 18, 2026

背景

变更内容

system_prompt.ts

sub_agent_types.ts

compact_prompt.ts

影响范围

测试

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

`system_prompt.ts`

`sub_agent_types.ts`

`compact_prompt.ts`