Dify
简体中文
简体中文
  • 入门
    • 欢迎使用 Dify
      • 特性与技术规格
      • 模型供应商列表
    • 云服务
    • 社区版
      • Docker Compose 部署
      • 本地源码启动
      • 宝塔面板部署
      • 单独启动前端 Docker 容器
      • 环境变量说明
      • 常见问题
    • Dify Premium
    • Dify 教育版
  • 手册
    • 接入大模型
      • 增加新供应商
      • 预定义模型接入
      • 自定义模型接入
      • 接口方法
      • 配置规则
      • 负载均衡
    • 构建应用
      • 创建应用
      • 聊天助手
        • 多模型调试
      • Agent
      • 应用工具箱
        • 敏感内容审查
    • 工作流
      • 关键概念
      • 变量
      • 节点说明
        • 开始
        • LLM
        • 知识检索
        • 问题分类
        • 条件分支
        • 代码执行
        • 模板转换
        • 文档提取器
        • 列表操作
        • 变量聚合
        • 变量赋值
        • 迭代
        • 参数提取
        • HTTP 请求
        • Agent
        • 工具
        • 结束
        • 直接回复
        • 循环
      • 快捷键
      • 编排节点
      • 文件上传
      • 异常处理
        • 预定义异常处理逻辑
        • 错误类型
      • 附加功能
      • 预览与调试
        • 预览与运行
        • 单步调试
        • 对话/运行日志
        • 检查清单
        • 运行历史
      • 应用发布
      • 结构化输出
      • 变更公告:图片上传被替换为文件上传
    • 知识库
      • 创建知识库
        • 1. 导入文本数据
          • 1.1 从 Notion 导入数据
          • 1.2 从网页导入数据
        • 2. 指定分段模式
        • 3. 设定索引方法与检索设置
      • 管理知识库
        • 维护知识库内文档
        • 通过 API 维护知识库
      • 元数据
      • 在应用内集成知识库
      • 召回测试/引用归属
      • 知识库请求频率限制
      • 连接外部知识库
      • 外部知识库 API
    • 工具
      • 快速接入工具
      • 高级接入工具
      • 工具配置
        • Google
        • Bing
        • SearchApi
        • StableDiffusion
        • Dall-e
        • Perplexity Search
        • AlphaVantage 股票分析
        • Youtube
        • SearXNG
        • Serper
        • SiliconFlow (支持 Flux 绘图)
        • ComfyUI
    • 发布
      • 发布为公开 Web 站点
        • Web 应用的设置
        • 文本生成型应用
        • 对话型应用
      • 嵌入网站
      • 基于 APIs 开发
      • 基于前端组件再开发
    • 标注
      • 日志与标注
      • 标注回复
    • 监测
      • 集成外部 Ops 工具
        • 集成 LangSmith
        • 集成 Langfuse
        • 集成 Opik
      • 数据分析
    • 扩展
      • API 扩展
        • 使用 Cloudflare Workers 部署 API Tools
        • 敏感内容审查
      • 代码扩展
        • 外部数据工具
        • 敏感内容审查
    • 协同
      • 发现
      • 邀请与管理成员
    • 管理
      • 应用管理
      • 团队成员管理
      • 个人账号管理
      • 订阅管理
      • 版本管理
  • 动手实验室
    • 初级
      • 如何搭建 AI 图片生成应用
      • AI Agent 实战:搭建个人在线旅游助手
    • 中级
      • 使用文件上传搭建文章理解助手
      • 使用知识库搭建智能客服机器人
      • ChatFlow 实战:搭建 Twitter 账号分析助手
  • 社区
    • 寻求支持
    • 成为贡献者
    • 为 Dify 文档做出贡献
  • 插件
    • 功能简介
    • 快速开始
      • 安装与使用插件
      • 插件开发
        • 初始化开发工具
        • Tool 插件
        • Model 插件
          • 创建模型供应商
          • 接入预定义模型
          • 接入自定义模型
        • Agent 策略插件
        • Extension 插件
        • Bundle 插件包
      • 插件调试
    • 插件管理
    • 接口定义
      • Manifest
      • Endpoint
      • Tool
      • Agent
      • Model
        • 模型设计规则
        • 模型接口
      • 通用规范定义
      • 持久化存储
      • 反向调用 Dify 服务
        • App
        • Model
        • Tool
        • Node
    • 最佳实践
      • 开发 Slack Bot 插件
      • Dify MCP 插件指南:一键连接 Zapier 并自动发送邮件
    • 发布插件
      • 自动发布插件
      • 发布至 Dify Marketplace
        • 插件开发者准则
        • 插件隐私政策准则
      • 发布至个人 GitHub 仓库
      • 本地发布与分享
      • 第三方签名验证
    • 常见问题
  • 研发
    • 后端
      • DifySandbox
        • 贡献指南
    • 模型接入
      • 接入 Hugging Face 上的开源模型
      • 接入 Replicate 上的开源模型
      • 接入 Xinference 部署的本地模型
      • 接入 OpenLLM 部署的本地模型
      • 接入 LocalAI 部署的本地模型
      • 接入 Ollama 部署的本地模型
      • 接入 LiteLLM 代理的模型
      • 接入 GPUStack 进行本地模型部署
      • 接入 AWS Bedrock 上的模型(DeepSeek)
    • 迁移
      • 将社区版迁移至 v1.0.0
  • 阅读更多
    • 应用案例
      • DeepSeek 与 Dify 集成指南:打造具备多轮思考的 AI 应用
      • 本地私有化部署 DeepSeek + Dify,构建你的专属私人 AI 助手
      • 如何训练出专属于“你”的问答机器人?
      • 教你十几分钟不用代码创建 Midjourney 提示词机器人
      • 构建一个 Notion AI 助手
      • 如何在几分钟内创建一个带有业务数据的官网 AI 智能客服
      • 使用全套开源工具构建 LLM 应用实战:在 Dify 调用 Baichuan 开源模型能力
      • 手把手教你把 Dify 接入微信生态
      • 使用 Dify 和 Twilio 构建 WhatsApp 机器人
      • 将 Dify 应用与钉钉机器人集成
      • 使用 Dify 和 Azure Bot Framework 构建 Microsoft Teams 机器人
      • 如何让 LLM 应用提供循序渐进的聊天体验?
      • 如何将 Dify Chatbot 集成至 Wix 网站?
      • 如何连接 AWS Bedrock 知识库?
      • 构建 Dify 应用定时任务助手
      • 如何在 Dify 内体验大模型“竞技场”?以 DeepSeek R1 VS o1 为例
      • 在 Dify 云端构建 AI Thesis Slack Bot
      • 将 Dify 快速接入 QQ、微信、飞书、钉钉、Telegram、Discord 等平台
    • 扩展阅读
      • 什么是 LLMOps?
      • 什么是数组变量?
      • 检索增强生成(RAG)
        • 混合检索
        • 重排序
        • 召回模式
      • 提示词编排
      • 如何使用 JSON Schema 让 LLM 输出遵循结构化格式的内容?
    • 常见问题
      • 本地部署
      • LLM 配置与使用
      • 插件
  • 政策
    • 开源许可证
    • 用户协议
      • 服务条款
      • 隐私政策
      • 获取合规报告
Powered by GitBook
On this page
  • 本实验中你将掌握的知识点
  • 前提条件
  • 添加节点
  • 开始节点
  • 文档提取器
  • LLM
  • 思考题 1 : 处理多个上传文件
  • 思考题 2 : 针对思考题 1,只处理文件列表的特定文件
  1. 动手实验室
  2. 中级

使用文件上传搭建文章理解助手

Previous中级Next使用知识库搭建智能客服机器人

Last updated 3 months ago

作者:Steven Lynn。Dify Technical Writer。

在 Dify ,你可以使用知识库工具让 Agent 从大量的文本内容中获取准确的信息。然而,很多情况下需要理解的本地文件并不是很大,不至于用上知识库。这种情况下可以使用文件上传功能直接把本地文件作为上下文给 LLM 理解。

本次实验中,我们将以文章理解助手为案例。这个文章理解助手将会根据上传的文档进行提问,协助用户带着问题去阅读论文等材料。

本实验中你将掌握的知识点

  • 文件上传功能

  • Chatflow的基本操作

  • 提示词撰写

  • 迭代的使用

  • 文档解析器和列表操作节点

前提条件

在 Dify 中创建一个 Chatflow。请确保你已添加模型供应商并有足够额度。

添加节点

在本次实验中至少需要涉及四种节点:开始节点、文档提取器节点、LLM 节点、回复节点。

开始节点

在开始节点需要添加文件变量。在 0.10.0 版本的 Dify 中支持了文件上传功能,你可以将文件作为变量加入。

在开始节点需要增加一个文件变量,在支持的文件类型中,需要勾选文档。

一些读者可能会注意到在系统变量中有 sys.files,这个变量是用户在对话框中上传的文件或者文件列表。

和自己创建文件变量的区别在于,这个功能需要在功能中打开文件上传并且设置上传文件类型,并且在对话中每次上传新的文件都会将这个变量覆写。

请需要根据业务场景选取合适的文件上传方式。

文档提取器

LLM 是无法直接读取文件的。 这是很多用户在第一次使用文件上传功能的一个误区,会认为直接把文件作为变量在 LLM 节点应用就可以了,实际上 LLM 读到的内容为空。

所以,Dify 引入了文档提取器,这个节点可以从文件变量中提取文本,输出文本格式的变量。

将开始节点的文件变量作为输入变量,文档提取器会将文档格式的文件转为文本变量输出。

LLM

本次实验中需要设计两个 LLM 节点,分别是结构提取和问题抛出。

结构提取

结构提取节点能够从原文内容中提取文章结构,总结关键内容。

提示词内容如下:

阅读以下文章内容并执行任务
{{文档提取器结果的变量}}
# 任务

- **主要目标**:全面解析文章的结构。
- **目标**:详细说明文章每个部分的内容。
- **要求**:尽可能详细地分析。
- **限制**:无特别的格式限制,但需要保持解析的条理性和逻辑性。
- **预期输出**:文章结构的详细解析,包括每个部分的主要内容和作用。

# 推理顺序

- **推理部分**:通过仔细阅读文章,识别和解析其结构。
- **结论部分**:提供每个部分的具体内容和作用。

# 输出格式

- **解析格式**:每个部分应以标题形式列出,后跟对该部分内容的详细说明。
- **结构形式**:Markdown,以增强可读性。
- **具体说明**:每个部分的内容和作用,包括但不限于引言、正文、结论、引用等。

# 示例输出

## 示例文章解析

### 引言
- **内容**:介绍研究的背景、目的和重要性。
- **作用**:吸引读者的注意力,为文章内容提供上下文。

### 方法
- **内容**:描述研究的具体方法和步骤,包括实验设计、数据收集和分析技术。
- **作用**:使读者了解研究的科学性和可重复性。

### 结果
- **内容**:展示研究的主要发现和数据。
- **作用**:提供研究结论的证据基础。

### 讨论
- **内容**:解释结果的意义,对比其他研究,提出可能的改进方向。
- **作用**:帮助读者理解结果的广泛影响和未来研究的潜力。

### 结论
- **内容**:总结研究的主要发现和贡献。
- **作用**:强化文章的核心信息,提供明确的结论。

### 引用
- **内容**:列出文章中引用的所有文献。
- **作用**:提供进一步阅读的资源,确保学术诚信。

# 备注

- **边缘情况**:如果文章结构不典型(例如,缺少某些部分或有额外的部分),应在解析中明确指出这些特殊情况。
- **重要考虑事项**:解析时应关注文章的逻辑性和连贯性,确保每个部分的内容与文章的整体目标一致。

问题抛出

问题抛出节点能够从结构提取节点总结的内容中总结文章的问题,协助读者在阅读的过程中带着问题去思考。

提示词如下:

阅读以下文章内容并执行任务
{{结构提取的输出}}
# 任务

- **主要目标**:全面阅读上文,针对文章各个部分提出尽可能多的问题。
- **要求**:问题要有意义和价值,值得思考。
- **限制**:无特定限制。
- **预期输出**:一系列针对文章各个部分的问题,每个问题都应有深度和思考价值。

# 推理顺序

- **推理部分**:全面阅读文章,分析文章各个部分的内容,思考每个部分可能引发的深层次问题。
- **结论部分**:提出有意义和有价值的问题,确保问题能够引发深入的思考。

# 输出格式

- **格式**:每个问题单独成行,编号列出。
- **内容**:针对文章的各个部分(如引言、背景、方法、结果、讨论、结论等)提出问题。
- **数量**:尽可能多,但每个问题都应有意义和价值。

# 备注

- **边缘情况**:如果文章的某些部分内容较少,可以适当调整问题的数量和深度,但每个问题都应有思考价值。
- **重要考虑事项**:确保问题能够引导读者深入理解文章内容,而不仅仅是表面的疑问。

思考题 1 : 处理多个上传文件

为了处理多个上传文件,需要用到迭代节点。

迭代节点类似于许多编程语言中的 while,区别在于 Dify 中没有条件限制,且输入变量只能是 array 类型(列表)。原因是 Dify 会将列表中的全部内容都执行完为止。

因此,你需要把开始节点中的文件变量调整为array类型,也就是文件列表。

在开始节点之后需要加入迭代节点,并且设置输入变量和输出变量。在迭代节点内部,设置每次循环执行的内容,这部分和前文内容完全一致。

思考题 2 : 针对思考题 1,只处理文件列表的特定文件

在思考题 1 中,有的读者可能会注意到 Dify 会把所有文件处理完才会结束循环,而有些情况下只要操作其中一部分的文件而非全部。对于这个问题,可以对文件列表进行处理,在 Dify 中对列表进行操作的节点叫做列表操作。列表操作可以对所有array类型的变量进行操作,不光是文件列表。

例如,限定只对文档类型的文件进行分析,并且把要处理的文件顺序按文件名称排序。

在迭代节点前加入列表操作,调整过滤条件、排序,然后将迭代节点的输入改为列表操作节点的输出。

有关文件上传的更多文档内容请阅读:

文件上传