本周工作总结:
-
将dify中的第五个视频:知识检索与知识库中的案例pdf改成中文pdf,该pdf是由chatgpt生成的虚假内容,既有效保护了隐私内容,又能方便对比dify对pdf的切割效果
-
搭建了一套基于 FastAPI 的多 Agent 调度架构:用户提问后,由路由模型依据各 Agent 预生成的 route_questions 完成 Agent 选择;被选中的 Agent 并行调用回答模型生成各自答复;当命中多个 Agent 时,再通过回答模型将多份结果合并为统一回复。
-
Agent 创建阶段,在 agents.json 中完成登记,并建立 files/agent_{id}/ 目录。初始化阶段读取该目录下的 knowledge.md,调用初始化模型生成 50~100 条路由问题并写入配置,Agent 标记为 initialized 后方可参与在线问答。
-
知识处理方面,早期采用 PDF 文本抽取后直接注入 API 的方式;后续调整为读取 Markdown 文件,MD 仅承载 FAQ 知识内容,回答格式与角色约束由代码统一封装于 system 消息,MD 全文作为【知识内容】传入模型。以 u001_whole.md 为母本按页拆分至 13 个 Agent 目录,并转换为 FAQ 格式存储。
-
问答执行阶段,各 Agent 独立加载 knowledge.md,组装 system 与 user 消息后调用回答模型;MD 中的图片引用不传入模型,于回答生成后解析路径,由前端完成配图展示。系统未引入向量库,路由依赖 route_questions 语义匹配,证据引用基于 MD 文本及图片路径进行关联。
-
问题与洞察:
-
经过对比发现:影响回答速度的主要因素是命中agent数量。命中的agent数量越多,回答的时间越长
-
此外,模型整理所有命中agent的回答也需要十几秒的时间,推测为思考模式需要花一定时间
下周重点工作:
-
调研工具Graphify
-
调研大模型的语音输入、语音输出能力