本周工作总结:
1. Coze工作流智能体开发与优化迭代
-
完成Coze平台工作流智能体创建,实现可在豆包分享的版本。发现重大性能瓶颈:该工作流极大程度增加了Tokens消耗与响应时间,且输出效果未达预期,需重新评估架构合理性。
-
基于泰康之家案例模板,搭建更为详细的公司背景智能体调研工作流,优化信息收集与输出结构,提升专业场景适配性。
2. 桌面自动化键鼠录制技术深度调研
-
uiohook-napiI方案评估:验证uiohook-napi库可实现键盘、鼠标录制及键盘回放功能,但存在关键缺陷——无法回放鼠标操作,不满足完整自动化需求。随后快速调研Autokey、MacroCreator,确认MacroCreator能较好实现目标功能,但需评估其扩展性。
-
Pynput核心方案验证:深入调研pynput库,验证其可完整实现键盘鼠标录制与回放功能。技术特点:需人工编写录制与回放代码(但借助大模型可快速生成),整体效果符合预期,偶现精度问题(坐标偏差)。
3. QClaw产品调研与评估
调研与体验QClaw,定位其产品本质:在OpenClaw基础上增加安全防护层与可视化界面,面向新手降低入门门槛,能实现不需要提醒自动寻找合适技能使用。关键缺陷识别:移除CLI支持,缺乏快速下载Skills的机制,严重限制开发者效率与高级定制能力。评估结论:实用性较差,不适合技术团队深度使用,建议继续沿用OpenClaw原方案。
问题与洞察:
-
Coze创建智能体不宜在豆包中使用:coze创建的智能体若使用了工作流,豆包会无法使用其中的工作流,此外,Coze创建的智能体必须使用指定模型(doubao-1.6),体验较差,且消耗tokens较多,不适合使用。
-
键鼠自动化技术的精度与稳定性瓶颈:pynput虽能实现完整功能闭环,但偶发的精度问题(坐标偏差)在关键业务场景可能成为致命缺陷。经过实际测试,当鼠标移动过快,或windows存在缩放时,有可能会存在录制错误,导致回放效果不及预期,通常解决办法是鼠标移动速度不宜过快,且每次操作结束等待一段时间。
下周重点工作:
-
目前大致完成第一部分前三章内容的生成,仍需大模型进行整合
-
需要以泰康之家案例为模板,进一步补充工作流内容,完善背景调研报告,生成易懂的md文档