本文最后更新于6 天前,其中的信息可能已经过时,如有错误请发送邮件到big_fw@foxmail.com
今日工作内容与总结:
-
向昊总、豪哥汇报最近调研成果,重点包括Edge TTS文字转语音,openai-whisper文字转语音等内容,根据反馈明确了后续优化方向,确定了技能展示形式的改进要求
-
修改补充Edge TTS技能和email技能的使用案例,以视频形式展现该技能与其他技能的组合,完成固定场景任务,并对接到不同channel
-
修改多个skill的内容、调整内容结构和展现顺序,提升可读性和逻辑性,将部分较长截图以视频形式展现,重构”实现结果”与”实现过程”的排版顺序
-
调研turix,该工具支持对浏览器、微信、桌面应用等GUI元素的精准控制,官方定位”人能点击的地方Agent都能点击”。但该agent同样对Windows系统适配性差,技术架构上与OpenClaw的Skill形式仅MacOS能实现兼容性,可作为后续集成候选方案。
-
完成多Agent系统实现方案的技术预研,包括Agent通信机制、任务分配策略和协同工作流设计,使用Trae AI编程工具完成完整的技术说明文档,涵盖架构设计、接口定义和部署指南
工作中遇到的问题与困难,需要的支持:
minimax的发票尚未开具,相关费用无法报销
明日工作计划:
-
展示Edge TTS技能和email技能的修改结果,收集反馈并确定下一阶段迭代目标
-
尝试部署多agent,构建AI团队