本文最后更新于13 天前,其中的信息可能已经过时,如有错误请发送邮件到big_fw@foxmail.com
本周工作总结:
-
本周主要围绕 OpenClaw 智能体平台的技能(Skill)生态展开系统性调研,累计调研技能 40+ 个,覆盖多个应用场景:
| 类别 | 代表技能 |
| 数据与文档 | whodb/query-builder、nano-pdf等 |
| 搜索与研究 | Brave Search、EXA等 |
| 开发工具 | Coding-Agent、conventional-commits等 |
| 办公协同 | notion、Todoist等 |
| 内容创作 | Humanizer、SuperDesign等 |
| 系统安全 | clawdbot-security-check、self-improving-agent等 |
| 多媒体处理 | youtube-watcher、yt-dlp-downloader-skill等 |
-
文档体系建设
-
完成已测试技能的分类归档,按功能模块建立结构化调研文档
-
补充各技能的完整 skill.md 文档及源文件,建立可下载的技能知识库
-
规划构建技能导航目录,提升后续查阅效率
-
技术预研
-
调研社区项目 clawdia-bridge(智能体电话通话),因版本不兼容暂停
-
跟踪 clawra 等新兴技能动态,并复现
-
开始探究源码内容,但研究过程较难
问题与洞察:
主要障碍:
-
API 资源门槛过高
-
有大量技能依赖 Google Gemini、OpenAI、Google Cloud 等付费 API
-
部分服务需绑定信用卡,国内开发者接入成本高
2. 环境兼容性问题突出
-
浏览器自动化类技能(agent-browser 等)在服务器/本地 Windows 环境均无法正常运行
-
多媒体处理技能,如音频、视频等技能对系统环境有特定要求,测试成功率低
关键洞察:
-
技能质量参差不齐:社区技能文档完善度差异大,部分技能缺乏维护
-
本地化适配不足:多数技能针对海外生态设计,国内开发者使用门槛高
-
浏览器自动化是瓶颈:涉及 UI 操作的技能在 headless 环境下稳定性差,需探索替代方案
-
有绝大多数实用技能实际上是对其他平台的进行适配的“插件”,实用性体现在该平台的实用性。
下周重点工作:
-
持续关注社区动态,复刻近期热门技能案例
-
尝试使用openclaw控制手机摄像头、麦克风
-
推进可用技能落地,完成更多技能的深度测试
-
继续深入源码探究,多向AI求助