Skip to content

Instantly share code, notes, and snippets.

@tiye
Created October 13, 2025 16:26
Show Gist options
  • Select an option

  • Save tiye/54955eec5a8b96370e579a7724ec9358 to your computer and use it in GitHub Desktop.

Select an option

Save tiye/54955eec5a8b96370e579a7724ec9358 to your computer and use it in GitHub Desktop.
Some suggestion from GPT 4.1 about how to make agent focused

如果你要模仿 Claude CODE 和 Gemini CLI 自己实现一个 agent 命令行,并且希望你的 Agent 能够持续进行多轮对话,并且始终准确围绕用户提出的任务持续探索和行动,你需要从以下几个方面做优化:


1. 高质量的任务上下文维护与“记忆”设计

  • 对话历史管理

    • 保存所有轮次的用户输入、Agent回复、工具调用请求与结果,并设计合适的“摘要”或“压缩”机制,避免 prompt 长度溢出。
    • 优化历史内容选择,确保每轮对话都能带上最相关的任务信息(如目标描述、关键中间结果、约束条件)。
  • 任务目标持续强化

    • 每轮都要重新提炼当前的“任务目标”,可以用显式的 system prompt 或 special message 让模型始终聚焦目标。
    • 支持用户随时补充或修正目标,Agent能自动调整任务推进策略。

2. 工具调用/外部操作生命周期优化

  • 工具调用的确认机制

    • 设计工具调用前的参数校验与用户确认(尤其是有副作用的操作,如写文件、执行 shell)。
    • 工具调用结果要被自动纳入上下文,供后续推理参考。
  • 工具调用错误处理与回退

    • 每轮都要能检测、处理工具调用失败(如权限、参数、环境问题),并给出智能建议或回退机制。
  • 异步或流式处理支持

    • 支持工具调用过程中实时反馈,允许用户和 Agent 随时中断、插入新指令。

3. 持续性与一致性的 Agent 逻辑

  • Agent 执行主循环设计

    • 类似 Gemini CLI 的 executor,设计清晰的“轮询循环”:每轮都交互模型(或 Claude)、处理工具调用,直到任务明确完成。
    • 设置合理的终止条件(如轮数、超时、任务完成信号),防止死循环或无效探索。
  • 分阶段策略与自适应规划

    • Agent 应支持分阶段规划:先探索,再收敛,再行动。可用“思考”环节(Claude/Gemini都有)让模型自我总结、反思、修正方案。
    • 支持动态调整探索深度和广度,防止跑偏。

4. Prompt 设计与模型指令工程

  • 系统提示/指令工程

    • 明确告诉模型你的目标、约束、工具列表,以及每轮需要它做什么(如“请思考、提出方案、调用工具、总结结果”)。
    • 融合 Claude/Gemini 的“思考”机制,要求每轮都输出 reasoning/plan,而不是只给最终答案。
  • 自动补齐与连贯性提示

    • 若中途因 token 限制丢失上下文,要有机制自动补齐关键信息(如问题描述、已完成步骤)。
    • Prompt 中要持续强化“请始终围绕目标任务进行探索和行动”。

5. 多轮任务跟踪与用户交互优化

  • 用户随时插入指令/修正目标的能力

    • 允许用户在多轮任务中,随时补充细节、纠正偏差,Agent要能自动吸收这些变更。
  • 透明化任务进度与状态

    • 实时展示任务进度、已完成步骤、下一步计划,让用户能随时了解 Agent 的思路和行动。

6. 可扩展性与安全性设计

  • 易扩展的工具/插件系统

    • 让工具注册、参数校验、执行都标准化,方便后续扩展新能力。
  • 敏感操作保护与日志审计

    • 对于写/删/执行类工具,强制二次确认,并自动记录操作日志。

总结建议

  1. 学习 Gemini CLI 的 executor、工具生命周期、上下文管理代码,吸收其设计思路。
  2. 结合 Claude CODE 的“思考-行动-反馈”范式,设计 prompt 和执行流程。
  3. 重点关注“任务目标持续强化”、“历史内容高效摘要”、“工具调用安全确认”、“多轮动态调整”这几大板块。
  4. 用流式异步处理和事件机制,保证长任务的延续性和实时响应。

如果需要具体的代码结构或者关键接口建议,可以进一步补充需求细节!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment