2026.6.5周报

本周工作总结:

  1. 将dify中的第五个视频:知识检索与知识库中的案例pdf改成中文pdf,该pdf是由chatgpt生成的虚假内容,既有效保护了隐私内容,又能方便对比dify对pdf的切割效果
  2. 搭建了一套基于 FastAPI 的多 Agent 调度架构:用户提问后,由路由模型依据各 Agent 预生成的 route_questions 完成 Agent 选择;被选中的 Agent 并行调用回答模型生成各自答复;当命中多个 Agent 时,再通过回答模型将多份结果合并为统一回复。
    1. Agent 创建阶段,在 agents.json 中完成登记,并建立 files/agent_{id}/ 目录。初始化阶段读取该目录下的 knowledge.md,调用初始化模型生成 50~100 条路由问题并写入配置,Agent 标记为 initialized 后方可参与在线问答。
    2. 知识处理方面,早期采用 PDF 文本抽取后直接注入 API 的方式;后续调整为读取 Markdown 文件,MD 仅承载 FAQ 知识内容,回答格式与角色约束由代码统一封装于 system 消息,MD 全文作为【知识内容】传入模型。以 u001_whole.md 为母本按页拆分至 13 个 Agent 目录,并转换为 FAQ 格式存储。
    3. 问答执行阶段,各 Agent 独立加载 knowledge.md,组装 system 与 user 消息后调用回答模型;MD 中的图片引用不传入模型,于回答生成后解析路径,由前端完成配图展示。系统未引入向量库,路由依赖 route_questions 语义匹配,证据引用基于 MD 文本及图片路径进行关联。

问题与洞察:

  • 经过对比发现:影响回答速度的主要因素是命中agent数量。命中的agent数量越多,回答的时间越长
  • 此外,模型整理所有命中agent的回答也需要十几秒的时间,推测为思考模式需要花一定时间

下周重点工作:

  • 调研工具Graphify
  • 调研大模型的语音输入、语音输出能力
暂无评论

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇
下一篇