本周工作总结:

将dify中的第五个视频：知识检索与知识库中的案例pdf改成中文pdf，该pdf是由chatgpt生成的虚假内容，既有效保护了隐私内容，又能方便对比dify对pdf的切割效果
搭建了一套基于 FastAPI 的多 Agent 调度架构：用户提问后，由路由模型依据各 Agent 预生成的 route_questions 完成 Agent 选择；被选中的 Agent 并行调用回答模型生成各自答复；当命中多个 Agent 时，再通过回答模型将多份结果合并为统一回复。
1. Agent 创建阶段，在 agents.json 中完成登记，并建立 files/agent_{id}/ 目录。初始化阶段读取该目录下的 knowledge.md，调用初始化模型生成 50～100 条路由问题并写入配置，Agent 标记为 initialized 后方可参与在线问答。
2. 知识处理方面，早期采用 PDF 文本抽取后直接注入 API 的方式；后续调整为读取 Markdown 文件，MD 仅承载 FAQ 知识内容，回答格式与角色约束由代码统一封装于 system 消息，MD 全文作为【知识内容】传入模型。以 u001_whole.md 为母本按页拆分至 13 个 Agent 目录，并转换为 FAQ 格式存储。
3. 问答执行阶段，各 Agent 独立加载 knowledge.md，组装 system 与 user 消息后调用回答模型；MD 中的图片引用不传入模型，于回答生成后解析路径，由前端完成配图展示。系统未引入向量库，路由依赖 route_questions 语义匹配，证据引用基于 MD 文本及图片路径进行关联。

问题与洞察:

经过对比发现：影响回答速度的主要因素是命中agent数量。命中的agent数量越多，回答的时间越长
此外，模型整理所有命中agent的回答也需要十几秒的时间，推测为思考模式需要花一定时间

下周重点工作:

调研工具Graphify
调研大模型的语音输入、语音输出能力

本周工作总结:

问题与洞察:

下周重点工作:

发送评论 编辑评论

推荐文章

发送评论编辑评论