<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>AI Agent 实战 on 卓琪的开发笔记</title>
    <link>https://zhuoqidev.com/categories/ai-agent-%E5%AE%9E%E6%88%98/</link>
    <description>Recent content in AI Agent 实战 on 卓琪的开发笔记</description>
    <generator>Hugo -- gohugo.io</generator>
    <language>zh-CN</language>
    <copyright>© 2026 Liu ZhuoQi</copyright>
    <lastBuildDate>Sat, 13 Jun 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://zhuoqidev.com/categories/ai-agent-%E5%AE%9E%E6%88%98/index.xml" rel="self" type="application/rss+xml" />
    
    <item>
      <title>Claude 工具调用范式转移：Programmatic Tool Calling 与 Dynamic Filter 深度解读</title>
      <link>https://zhuoqidev.com/posts/claude-programmatic-tool-calling-dynamic-filter/</link>
      <pubDate>Sat, 13 Jun 2026 00:00:00 +0000</pubDate>
      
      <guid>https://zhuoqidev.com/posts/claude-programmatic-tool-calling-dynamic-filter/</guid>
      <description>&lt;h2 class=&#34;relative group&#34;&gt;背景：Agent 工具调用的成本困境&#xA;    &lt;div id=&#34;背景agent-工具调用的成本困境&#34; class=&#34;anchor&#34;&gt;&lt;/div&gt;&#xA;    &#xA;    &lt;span&#xA;        class=&#34;absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none&#34;&gt;&#xA;        &lt;a class=&#34;text-primary-300 dark:text-neutral-700 !no-underline&#34; href=&#34;#%e8%83%8c%e6%99%afagent-%e5%b7%a5%e5%85%b7%e8%b0%83%e7%94%a8%e7%9a%84%e6%88%90%e6%9c%ac%e5%9b%b0%e5%a2%83&#34; aria-label=&#34;锚点&#34;&gt;#&lt;/a&gt;&#xA;    &lt;/span&gt;&#xA;    &#xA;&lt;/h2&gt;&#xA;&lt;p&gt;在传统 Agent 工具调用模型中，每调用一个工具都需要完成一次&amp;quot;模型推理 → 工具执行 → 结果返回 → 模型再推理&amp;quot;的完整回合。这个看似自然的循环，在工具调用变多时会暴露出三个致命问题：&lt;/p&gt;&#xA;&lt;ol&gt;&#xA;&lt;li&gt;&lt;strong&gt;上下文污染&lt;/strong&gt;：每个工具的结果都被原封不动地注入上下文窗口。查 20 个员工的报销记录，2000+ 条费用明细全部进入 context，即使你只需要知道&amp;quot;哪 3 个人超预算了&amp;quot;。&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;推理开销&lt;/strong&gt;：每个工具调用都需要一次完整的模型推理。5 个工具调用 = 5 次推理 pass，每次几百毫秒到几秒不等。&lt;/li&gt;&#xA;&lt;li&gt;&lt;strong&gt;噪声导致准确率下降&lt;/strong&gt;：当上下文窗口塞满了中间结果，模型不得不在大量噪声中寻找信号。&lt;a href=&#34;https://arxiv.org/abs/2509&#34;  target=&#34;_blank&#34; rel=&#34;noreferrer&#34;&gt;Context Rot 研究&lt;/a&gt; 表明，LLM 在复杂任务上的性能会随上下文增长而下降 50-70%。&lt;/li&gt;&#xA;&lt;/ol&gt;&#xA;&lt;p&gt;正如 Bruno 在 &lt;a href=&#34;https://cc.bruniaux.com/guide/architecture/&#34;  target=&#34;_blank&#34; rel=&#34;noreferrer&#34;&gt;Claude Code Architecture Guide&lt;/a&gt; 中所指出的：&lt;strong&gt;&amp;ldquo;Outer Loop（模型外的一切：上下文管理、工具调用、验证、记忆巩固）开始比模型推理本身更决定系统质量。&amp;rdquo;&lt;/strong&gt;&lt;/p&gt;&#xA;&lt;p&gt;Anthropic 在 2025 年 11 月到 2026 年 2 月间陆续推出的一系列工具使用增强功能，本质上都是为了解决 Outer Loop 的效率问题。其中 &lt;strong&gt;Programmatic Tool Calling (PTC)&lt;/strong&gt; 和 &lt;strong&gt;Dynamic Filtering&lt;/strong&gt; 是最具范式转移意义的两项。&lt;/p&gt;</description>
      
    </item>
    
    <item>
      <title>OpenClaw 生产踩坑：当最先进的记忆系统遇到最静默的失败</title>
      <link>https://zhuoqidev.com/posts/openclaw-pitfalls/</link>
      <pubDate>Wed, 27 May 2026 00:00:00 +0000</pubDate>
      
      <guid>https://zhuoqidev.com/posts/openclaw-pitfalls/</guid>
      <description>&lt;h2 class=&#34;relative group&#34;&gt;为什么是 OpenClaw&#xA;    &lt;div id=&#34;为什么是-openclaw&#34; class=&#34;anchor&#34;&gt;&lt;/div&gt;&#xA;    &#xA;    &lt;span&#xA;        class=&#34;absolute top-0 w-6 transition-opacity opacity-0 -start-6 not-prose group-hover:opacity-100 select-none&#34;&gt;&#xA;        &lt;a class=&#34;text-primary-300 dark:text-neutral-700 !no-underline&#34; href=&#34;#%e4%b8%ba%e4%bb%80%e4%b9%88%e6%98%af-openclaw&#34; aria-label=&#34;锚点&#34;&gt;#&lt;/a&gt;&#xA;    &lt;/span&gt;&#xA;    &#xA;&lt;/h2&gt;&#xA;&lt;blockquote&gt;&lt;p&gt;编程 Agent 的能力跃迁不只是&amp;quot;更强&amp;quot;&amp;ndash;每次代际跃迁改变的是&lt;strong&gt;验证循环的归属权&lt;/strong&gt;。Gen 1 补全时代（Copilot, 2021）：人类写、AI 补、人类验证&amp;ndash;验证完全在人手里。Gen 2 对话时代（Cursor, 2023）：AI 生成代码块、人类审查 diff&amp;ndash;验证仍以人为主，但 AI 开始做 lint/fix 的轻量自检。Gen 3 自治时代（Claude Code / Codex CLI / OpenClaw, 2025）：AI 写代码、AI 跑测试、AI 看报错、AI 修&amp;ndash;验证循环从人转移到 harness。&lt;strong&gt;整个 Outer Loop（模型外的一切：上下文管理、工具调用、验证、记忆巩固）开始比模型推理本身更决定系统质量&lt;/strong&gt;。OpenClaw 是这个趋势里记忆侧最激进、但 harness 稳定性最不足的一个。&lt;/p&gt;&#xA;&lt;p&gt;同一代内还有一条关键分岔：&lt;strong&gt;Vibe Coding&lt;/strong&gt;（Bolt.new、Lovable、Replit）把验证也扔给用户&amp;ndash;&amp;ldquo;生成即交付&amp;rdquo;；&lt;strong&gt;Engineering Rigor&lt;/strong&gt;（Claude Code、Aider、OpenClaw）则把验证编码进 harness&amp;ndash;测试跑不过就重试。两者的差距不在模型，在 outer loop 的设计哲学。&lt;/p&gt;&#xA;&lt;/blockquote&gt;&lt;p&gt;先看一眼 OpenClaw 的整体架构——用思维导图展示组件层级，后面所有踩坑都跟这些模块有关：&lt;/p&gt;&#xA;&lt;pre class=&#34;not-prose mermaid&#34;&gt;&#xA;mindmap&#xA;  root((OpenClaw))&#xA;    📨 消息入口&#xA;      飞书&#xA;      企业微信&#xA;      WebChat&#xA;      Telegram&#xA;    🔌 Channels 层&#xA;      消息路由 allowlist&#xA;      去重 dedup&#xA;      会话绑定 envelope&#xA;    🖥️ Gateway 守护进程&#xA;      WebSocket Server :18789&#xA;      认证 设备配对&#xA;      定时任务 CRON 引擎&#xA;    🔄 Agent Loop&#xA;      消息摄入 agent RPC&#xA;      上下文组装 bootstrap session skills&#xA;      模型推理 多后端 fallback&#xA;      工具执行 memory shell web&#xA;      回复生成 流式投递&#xA;    🧠 Memory 系统&#xA;      MEMORY.md 长期记忆&#xA;      每日流水 YYYY-MM-DD.md&#xA;      DREAMS.md 巩固日记&#xA;      向量 BM25 混合检索 7:3&#xA;&lt;/pre&gt;&#xA;&#xA;&lt;p&gt;OpenClaw 是 Gen 3 自治编程 Agent，跨模型 CLI，支持 DeepSeek / Anthropic / OpenAI 多后端。它最吸引我的一点是&lt;strong&gt;记忆系统&lt;/strong&gt;——在当前所有生产可用的编程 Agent 中，它的记忆架构是最激进的：&lt;/p&gt;</description>
      
    </item>
    
  </channel>
</rss>
