⌁ Agent 生态情报

追踪 AgentOS 时代的信号、更新与实战指南。

AgentOS Watch 关注 OpenClaw、Hermes、Mercury、Claude Code、skills、工作流、社交验证与风险,把嘈杂更新整理成可行动判断。

最近扫描 May 4 · 05:30 UTC 来源 X · GitHub · V2EX · ClawHub 处理 27 → 5 发布

今日雷达 Feed

5 分钟扫读:发生了什么、为什么重要、下一步做什么。

全部信号 →
2026-05-03 产品更新 关注

OpenClaw 2026.5.2 发布 provider、plugin、gateway 与多渠道修复

官方强调插件安装更稳、Gateway 路径更轻、多渠道和语音体验改进;但社区也出现 context overflow、工具调用过度等反馈,适合先测试再升级。

影响观察中 来源4 置信B+

下一步: 先读更新说明和社区反馈,用现有 workflow 做回归测试,再决定是否升级生产环境。

2026-05-04 技能 可试用

Agent Skills 数量爆炸,真正的瓶颈变成发现与筛选

ClawHub、Agent Skills 和社区精选列表显示 skills 生态正在快速膨胀。价值不在再做一个原始目录,而在按场景筛选、提示风险、说明安装和使用方法。

影响 来源6 置信B+

下一步: 优先做场景包:研究简报、浏览器自动化、GitHub 工作流、内容工作室、邮件日程、安全权限。

2026-05-04 新产品 关注

Mercury 将自己定位为常驻、权限加固的个人 Agent

Mercury 主打 markdown 人格、Telegram/CLI、多进程常驻、定时任务、工具权限和 token 预算。这个方向回应了真实需求:一个能长期运行、不会静默越权的个人 Agent。

影响观察中 来源3 置信B

下一步: 继续观察真实使用反馈,并与 OpenClaw/Hermes 对比稳定性、记忆行为和权限边界。

2026-05-02 社区反馈 关注

用户已经在问:哪个个人 Agent 真的能用来干活?

V2EX 讨论直接暴露核心痛点:很多 Agent 看起来都是 LLM + tools + skills + IM,但用户担心不稳定、记忆被重置、workflow 不可靠。

影响观察中 来源4 置信B+

下一步: 建立产品评分卡,重点评估稳定性、记忆持久性、权限安全和工作流可复现性。

产品追踪

用评分卡追踪动能、稳定性、Skill 生态、记忆能力和风险。

本地个人 Agent OS关注

OpenClaw

本地运行、多渠道接入的 AI 助手,支持工具、skills、gateway 路由和多模型 provider。

动能4/5
稳定3/5
生态5/5
记忆3/5
风险3/5

适合: 希望自托管,并把 Agent 接入真实 app 与聊天渠道的高级用户。

注意: 迭代很快,可能带来回归问题;需要验证上下文、工具调用和渠道稳定性。

学习 / 记忆型 Agent关注

Hermes

常被讨论为更强调学习与记忆闭环的 Agent。

动能5/5
稳定3/5
生态4/5
记忆5/5
风险4/5

适合: 想探索自学习、重记忆 Agent 行为的用户。

注意: 记忆系统可能变得不透明;真正依赖前要评估可检查性和恢复能力。

常驻 Telegram / CLI Agent关注

Mercury

Soul-driven Agent,强调权限工具、token 预算、定时任务和 daemon 常驻。

动能4/5
稳定2/5
生态2/5
记忆3/5
风险3/5

适合: 想要一个可通过 Telegram 或 CLI 随时访问的常驻个人 Agent 的用户。

注意: 仍需要真实使用验证稳定性、安全默认值和生态深度。

编码 Agent可采用

Claude Code

成熟的 coding agent,并逐渐和可复用 Agent Skills 工作流结合。

动能5/5
稳定4/5
生态5/5
记忆3/5
风险2/5

适合: 软件开发、代码审查、重构、调试和结构化实现任务。

注意: 多 Agent 共用不同 skills 文件夹和约定时,skill 膨胀会成为问题。

技能观察

按场景组织的 Skills 包,而不是原始目录。

Skill Packresearch-brief

研究与每日简报

收集信息源、总结变化,并生成每日/每周情报。

风险: 注意引用幻觉和过期来源。

Skill Packbrowser-automation

浏览器自动化

把重复网页流程变成可复用 Agent Skill 或脚本。

风险: 权限边界和账号安全比速度更重要。

Skill Packgithub-workflow

GitHub Issue 工作流

分拣 issue、起草 PR、总结 review、监控 CI。

风险: 不要在没有明确审查时自动 merge 或 push。

少而准

每封简报最多 5 条信号。

Daily Brief 用于快速浏览;Weekly Field Guide 用于深度采用建议、Skill 推荐和风险总结。