Dify
简体中文
简体中文
  • 入门
    • 欢迎使用 Dify
      • 特性与技术规格
      • 模型供应商列表
    • 云服务
    • 社区版
      • Docker Compose 部署
      • 本地源码启动
      • 宝塔面板部署
      • 单独启动前端 Docker 容器
      • 环境变量说明
      • 常见问题
    • Dify Premium
    • Dify 教育版
  • 手册
    • 接入大模型
      • 增加新供应商
      • 预定义模型接入
      • 自定义模型接入
      • 接口方法
      • 配置规则
      • 负载均衡
    • 构建应用
      • 创建应用
      • 聊天助手
        • 多模型调试
      • Agent
      • 应用工具箱
        • 敏感内容审查
    • 工作流
      • 关键概念
      • 变量
      • 节点说明
        • 开始
        • LLM
        • 知识检索
        • 问题分类
        • 条件分支
        • 代码执行
        • 模板转换
        • 文档提取器
        • 列表操作
        • 变量聚合
        • 变量赋值
        • 迭代
        • 参数提取
        • HTTP 请求
        • Agent
        • 工具
        • 结束
        • 直接回复
        • 循环
      • 快捷键
      • 编排节点
      • 文件上传
      • 异常处理
        • 预定义异常处理逻辑
        • 错误类型
      • 附加功能
      • 预览与调试
        • 预览与运行
        • 单步调试
        • 对话/运行日志
        • 检查清单
        • 运行历史
      • 应用发布
      • 结构化输出
      • 变更公告:图片上传被替换为文件上传
    • 知识库
      • 创建知识库
        • 1. 导入文本数据
          • 1.1 从 Notion 导入数据
          • 1.2 从网页导入数据
        • 2. 指定分段模式
        • 3. 设定索引方法与检索设置
      • 管理知识库
        • 维护知识库内文档
        • 通过 API 维护知识库
      • 元数据
      • 在应用内集成知识库
      • 召回测试/引用归属
      • 知识库请求频率限制
      • 连接外部知识库
      • 外部知识库 API
    • 工具
      • 快速接入工具
      • 高级接入工具
      • 工具配置
        • Google
        • Bing
        • SearchApi
        • StableDiffusion
        • Dall-e
        • Perplexity Search
        • AlphaVantage 股票分析
        • Youtube
        • SearXNG
        • Serper
        • SiliconFlow (支持 Flux 绘图)
        • ComfyUI
    • 发布
      • 发布为公开 Web 站点
        • Web 应用的设置
        • 文本生成型应用
        • 对话型应用
      • 嵌入网站
      • 基于 APIs 开发
      • 基于前端组件再开发
    • 标注
      • 日志与标注
      • 标注回复
    • 监测
      • 集成外部 Ops 工具
        • 集成 LangSmith
        • 集成 Langfuse
        • 集成 Opik
      • 数据分析
    • 扩展
      • API 扩展
        • 使用 Cloudflare Workers 部署 API Tools
        • 敏感内容审查
      • 代码扩展
        • 外部数据工具
        • 敏感内容审查
    • 协同
      • 发现
      • 邀请与管理成员
    • 管理
      • 应用管理
      • 团队成员管理
      • 个人账号管理
      • 订阅管理
      • 版本管理
  • 动手实验室
    • 初级
      • 如何搭建 AI 图片生成应用
      • AI Agent 实战:搭建个人在线旅游助手
    • 中级
      • 使用文件上传搭建文章理解助手
      • 使用知识库搭建智能客服机器人
      • ChatFlow 实战:搭建 Twitter 账号分析助手
  • 社区
    • 寻求支持
    • 成为贡献者
    • 为 Dify 文档做出贡献
  • 插件
    • 功能简介
    • 快速开始
      • 安装与使用插件
      • 插件开发
        • 初始化开发工具
        • Tool 插件
        • Model 插件
          • 创建模型供应商
          • 接入预定义模型
          • 接入自定义模型
        • Agent 策略插件
        • Extension 插件
        • Bundle 插件包
      • 插件调试
    • 插件管理
    • 接口定义
      • Manifest
      • Endpoint
      • Tool
      • Agent
      • Model
        • 模型设计规则
        • 模型接口
      • 通用规范定义
      • 持久化存储
      • 反向调用 Dify 服务
        • App
        • Model
        • Tool
        • Node
    • 最佳实践
      • 开发 Slack Bot 插件
      • Dify MCP 插件指南:一键连接 Zapier 并自动发送邮件
    • 发布插件
      • 自动发布插件
      • 发布至 Dify Marketplace
        • 插件开发者准则
        • 插件隐私政策准则
      • 发布至个人 GitHub 仓库
      • 本地发布与分享
      • 第三方签名验证
    • 常见问题
  • 研发
    • 后端
      • DifySandbox
        • 贡献指南
    • 模型接入
      • 接入 Hugging Face 上的开源模型
      • 接入 Replicate 上的开源模型
      • 接入 Xinference 部署的本地模型
      • 接入 OpenLLM 部署的本地模型
      • 接入 LocalAI 部署的本地模型
      • 接入 Ollama 部署的本地模型
      • 接入 LiteLLM 代理的模型
      • 接入 GPUStack 进行本地模型部署
      • 接入 AWS Bedrock 上的模型(DeepSeek)
    • 迁移
      • 将社区版迁移至 v1.0.0
  • 阅读更多
    • 应用案例
      • DeepSeek 与 Dify 集成指南:打造具备多轮思考的 AI 应用
      • 本地私有化部署 DeepSeek + Dify,构建你的专属私人 AI 助手
      • 如何训练出专属于“你”的问答机器人?
      • 教你十几分钟不用代码创建 Midjourney 提示词机器人
      • 构建一个 Notion AI 助手
      • 如何在几分钟内创建一个带有业务数据的官网 AI 智能客服
      • 使用全套开源工具构建 LLM 应用实战:在 Dify 调用 Baichuan 开源模型能力
      • 手把手教你把 Dify 接入微信生态
      • 使用 Dify 和 Twilio 构建 WhatsApp 机器人
      • 将 Dify 应用与钉钉机器人集成
      • 使用 Dify 和 Azure Bot Framework 构建 Microsoft Teams 机器人
      • 如何让 LLM 应用提供循序渐进的聊天体验?
      • 如何将 Dify Chatbot 集成至 Wix 网站?
      • 如何连接 AWS Bedrock 知识库?
      • 构建 Dify 应用定时任务助手
      • 如何在 Dify 内体验大模型“竞技场”?以 DeepSeek R1 VS o1 为例
      • 在 Dify 云端构建 AI Thesis Slack Bot
      • 将 Dify 快速接入 QQ、微信、飞书、钉钉、Telegram、Discord 等平台
    • 扩展阅读
      • 什么是 LLMOps?
      • 什么是数组变量?
      • 检索增强生成(RAG)
        • 混合检索
        • 重排序
        • 召回模式
      • 提示词编排
      • 如何使用 JSON Schema 让 LLM 输出遵循结构化格式的内容?
    • 常见问题
      • 本地部署
      • LLM 配置与使用
      • 插件
  • 政策
    • 开源许可证
    • 用户协议
      • 服务条款
      • 隐私政策
      • 获取合规报告
Powered by GitBook
On this page
  • 什么是元数据?
  • 定义
  • 知识库元数据定义
  • 如何管理知识库元数据?
  • 管理知识库元数据字段
  • 编辑文档元数据信息
  • 如何使用元数据功能在知识库中筛选文档?
  • API 信息
  • FAQ
  1. 手册
  2. 知识库

元数据

Previous通过 API 维护知识库Next在应用内集成知识库

Last updated 3 months ago

什么是元数据?

定义

元数据是用于描述其他数据的信息。简单来说,它是“关于数据的数据”。它就像一本书的目录或标签,可以为你介绍数据的内容、来源和用途。 通过提供数据的上下文,元数据能帮助你在知识库内快速查找和管理数据。

知识库元数据定义

  • 字段(Field):元数据字段是用于描述文档特定属性的标识项,每个字段代表文档的某个特征或信息。例如“author”“language”等。

  • 字段值(Value):字段值是该字段的具体信息或属性,例如“Jack”“English”。

Field name and value
  • 字段值计数(Value Count):字段值计数是指在某条元数据字段中标记的字段值数量,包括重复项。例如,此处的“3”是字段值计数,指该字段中有 3 个独特的字段值。

  • 值类型(Value Type):值类型指字段值的类型。

    • 目前,Dify 的元数据功能支持以下三种值类型:

      • 字符串(String):文本值。

      • 数字(Number):数值。

      • 时间(Time):日期和时间。

如何管理知识库元数据?

管理知识库元数据字段

在知识库管理界面,你可以创建、修改和删除元数据字段。

注意:所有在此界面进行的更新均为全局更新,这意味着对元数据字段列表的任何更改都会影响整个知识库,包括所有文档中标记的元数据。

元数据管理界面简介

进入元数据管理界面

在知识库管理界面,点击右上方的 元数据 按钮,进入元数据管理界面。

知识库元数据字段的类型

在知识库中,元数据字段分为两类:内置元数据(Built-in) 和 自定义元数据。

内置元数据(Built-in)
自定义元数据

显示位置

知识库界面 元数据 栏的下半部分。

知识库界面 元数据 栏的上半部分。

启用方式

默认禁用,需要手动开启才能生效。

由用户根据需求自由添加。

生成方式

启用后,由系统自动提取相关信息并生成字段值。

用户手动添加,完全由用户自定义。

修改权限

一旦生成,无法修改字段与字段值。

可以删除或编辑字段名称,也可以修改字段值。

应用范围

启用后,适用于已上传和新上传的所有文档。

添加元数据字段后,字段会储存在知识库的元数据列表中/需要手动设置,才能将该字段应用于具体文档。

字段

由系统预定义,包括: • document_name (string):文件名 • uploader (string):上传者 • upload_date (time):上传日期 • last_update_date (time):最后更新时间 • source (string):文件来源

在初始状态下,知识库无自定义元数据字段,需要用户手动添加。

字段值类型

• 字符串 (string):文本值 • 数字 (number):数值 • 时间 (time):日期和时间

• 字符串 (string):文本值 • 数字 (number):数值 • 时间 (time):日期和时间

新建元数据字段

  1. 点击 +添加元数据 按钮,弹出 新建元数据 弹窗。

  1. 在 字段值类型 中选择元数据字段的值类型。

  2. 在 名称 框中填写字段的名称。

字段名仅支持小写字母、数字和下划线(_)字符,不支持空格和大写字母。

  1. 点击 保存 按钮,保存字段。

修改元数据字段

  1. 点击单条元数据字段右侧的编辑按钮,弹出 重命名 弹窗。

  1. 在 名称 框中修改字段名称。

此弹窗仅支持修改字段名称,不支持修改字段值类型。

  1. 点击 保存 按钮,保存修改后的字段。

修改并保存后,该字段将在知识库中的所有相关文档中同步更新。

删除元数据字段

点击单条元数据字段右侧的删除按钮,可以删除该字段。

如果删除单条字段,该字段及该字段下包含的字段值将从知识库的所有文档中删除。

编辑文档元数据信息

批量编辑文档元数据信息

你可以在知识库管理界面批量编辑文档的元数据信息。

打开编辑元数据弹窗

  1. 打开知识库管理界面,在文档列表左侧的白色方框中勾选你希望批量操作的文档。勾选后,页面下方会弹出操作选项。

  1. 点击操作选项中的 元数据,弹出 编辑元数据 弹窗。

批量新增元数据信息

  1. 在 编辑元数据 弹窗中点击底部的 +添加元数据 按钮,弹出操作弹窗。

  • 如需为选中文档添加已创建的字段:

    • 可以从下拉列表中选择已有的字段,添加到字段列表中。

    • 可以在 搜索元数据 搜索框中搜索你需要的字段,添加到该文档的字段列表中。

  • 如需为选中文档新建字段,可以点击弹窗左下角的 +新建元数据 按钮,并参考前文的 新建元数据字段 章节新建字段。

    在 +新建元数据 弹窗中新建的元数据字段,将自动同步至知识库字段列表中。

  • 如需管理已创建的字段,可以点击该弹窗右下角的 管理 按钮,跳转到知识库的管理界面。

  1. (可选) 新增字段后,在字段值框内填写该字段相应的字段值。

  • 如果值类型为 时间,在填写字段值时会弹出时间选择器,供你选择具体时间。

  1. 点击 保存 按钮,保存操作。

批量删改元数据信息

  1. 在 编辑元数据 弹窗中删改元数据信息:

  • 添加字段值: 在需要添加元数据值的字段框内直接输入所需值。

  • 重置字段值: 将光标悬停在字段名左侧的蓝色圆点上,蓝点将变为 重置 按钮。点击蓝点,将字段框内修改后的内容重置为原始元数据值。

  • 删除字段值:

    • 删除一个字段值:在需要删除字段值的字段框内直接删除该字段值。

    • 删除多个字段值:点击 多个值 卡片的删除图标,清空所有选中文档的该元数据字段的值。

  • 删除单条元数据字段: 点击字段最右侧的删除符号,删除该字段。删除后,该字段会被横线划掉且置灰。

    此操作仅会删除已选文档的该字段与字段值,字段本身依然保留在知识库中。

  1. 点击 保存 按钮,保存操作。

调整批量操作的应用范围

  • 调整批量操作的应用范围: 你可以使用 编辑元数据 弹窗左下角的 应用于所有文档 选框来调整编辑模式中改动的应用范围。

    • 否(默认): 如果不选中该选项,编辑模式中的改动仅对原本已有该元数据字段的文档生效,其他文档不会受到影响。

    • 是: 如果选中该选项,编辑模式中的改动会对所有选中的文档生效。原本没有该字段的文档,会自动添加该字段。

编辑单篇文档元数据信息

你可以在文档详情界面中编辑单篇文档的元数据信息。

进入文档元数据编辑模式

  1. 在文档详情界面,点击信息栏上方的 开始标记 按钮。

  1. 进入文档元数据编辑模式。

新增文档元数据信息

  • 如需使用新建字段为该文档标记字段值,可以点击弹窗左下角的 + 新建元数据 按钮,并参考前文的 新建元数据字段 章节新建字段。

    在文档页面新建的元数据字段,将自动同步至知识库字段列表中。

  • 如需使用知识库已有的字段为该文档标记字段值,可以选择下列任意一种方式使用已有的字段:

    • 从下拉列表中选择知识库已有的字段,添加到该文档的字段列表中。

    • 在 搜索元数据 搜索框中搜索你需要的字段,添加到该文档的字段列表中。

  • 如需管理知识库已有的字段,可以点击弹窗右下角的 管理 按钮,跳转到知识库的管理界面。

  1. (可选) 添加字段后,在字段名右侧的元数据栏中填写字段值。

  1. 点击右上角的 保存 按钮,保存字段值。

删改文档元数据信息

  1. 在文档的元数据编辑模式中,点击右上角的 编辑 按钮,进入编辑模式。

  1. 删改文档元数据信息:

    • 删改字段值: 在字段名右侧的字段值框内,删除或修改字段值。

    此模式仅支持修改字段值,不支持修改字段名。

    • 删除字段: 点击字段值框右侧的删除按钮,删除字段。

    此操作仅会删除该文档的该字段与字段值,字段本身依然保留在知识库中。

  1. 点击右上角的 保存 按钮,保存修改后的字段信息。

如何使用元数据功能在知识库中筛选文档?

API 信息

FAQ

  • 元数据有什么作用?

    • 提升搜索效率:用户可以根据元数据标签快速筛选和查找相关信息,节省时间并提高工作效率。

    • 增强数据安全性:通过元数据设置访问权限,确保只有授权用户能访问敏感信息,保障数据的安全性。

    • 优化数据管理能力:元数据帮助企业或组织有效分类和存储数据,提高数据的管理和检索能力,增强数据的可用性和一致性。

    • 支持自动化流程:元数据在文档管理、数据分析等场景中可以自动触发任务或操作,简化流程并提高整体效率。

  • 知识库元数据管理列表中的元数据字段和某篇文档中的元数据值有什么区别?

/
定义
性质
举例

元数据管理列表中的元数据字段

预定义的字段,用于描述文档的某些属性。

全局性字段。所有文档都可以使用这些字段。

作者、文档类型、上传日期。

某篇文档中的元数据值

每个文档按需标记的针对特定文档的信息。

文档特定的值。每个文档根据其内容会标记不同的元数据值。

文档 A 的“作者”字段值为“张三”,文档 B 的“作者”字段值为“李四”。

  • “在知识库管理界面删除某条元数据字段”“在编辑元数据弹窗中删除已选文档的某条元数据字段”和“在文档详情界面删除某条元数据字段”有什么区别?

操作方式
操作方法
影响范围
结果

在知识库管理界面删除某条元数据字段

在知识库管理界面,点击某条元数据字段右侧的删除图标,删除该字段。

从知识库管理列表中完全删除该元数据字段及其所有字段值。

该字段从知识库中移除,所有文档中的该字段及包含的所有字段值也会消失。

在编辑元数据弹窗中删除已选文档的某条元数据字段

在编辑元数据弹窗中,点击某条元数据字段右侧的删除图标,删除该字段。

仅删除已选文档的该字段与字段值,字段本身依然保留在知识库管理列表中。

选中文档中的字段与字段值被移除,但字段仍保留在知识库内,字段值计数会发生数值上的变化。

在文档详情界面删除某条元数据字段

在文档详情界面中的元数据编辑模式里,点击某条元数据字段右侧的删除图标,删除该字段。

仅删除该文档的该字段与字段值,字段本身依然保留在知识库管理列表中。

该文档中的字段与字段值被移除,但字段仍保留在知识库内,字段值计数会发生数值上的变化。

Metadata field
Value type
Entrance of Metadata Panel
New metadata
New metadata
Value type
Save field
Rename field
Rename field
Renamed field
Delete field
Entrance of Edit Metadata
Edit metadata
Add metadata
Existing field
New metadata field
Manage field
Value for field
Date picker
Reset values
Multiple values
Delete fields
Apply all changes
Details page
Start labeling

在文档的元数据编辑模式中,点击 +添加元数据 按钮,弹出操作弹窗。

New fields
Existing fields
Manage metadata
Values for fields
Edit mode
Edit metadata

请参阅 中的 使用元数据筛选知识 章节。

请参阅 。

在应用内集成知识库
通过 API 维护知识库