接入 GPUStack 进行本地模型部署

GPUStack 是一个用于运行 AI 模型的开源 GPU 集群管理器。

Dify 支持与 GPUStack 集成，用于本地部署大语言模型推理、嵌入、重排序、语音转文本和文本转语音能力。

部署 GPUStack

你可以参考官方文档进行部署，或按照以下步骤快速集成：

GPUStack 提供了一个脚本，可以将其作为服务安装在基于 systemd 或 launchd 的系统上。要使用此方法安装 GPUStack，只需运行：

curl -sfL https://get.gpustack.ai | sh -s -

以管理员身份运行 PowerShell（避免使用 PowerShell ISE），然后运行以下命令安装 GPUStack：

Invoke-Expression (Invoke-WebRequest -Uri "https://get.gpustack.ai" -UseBasicParsing).Content

然后你可以按照终端的输出说明访问 GPUStack 界面。

以某个托管在 GPUStack 的大语言模型为例：

更多关于 GPUStack 的信息，请参考 GitHub 仓库。

Last updated 11 months ago