AMD显卡本地部署DeepSeek

问题描述

如果你的DeepSeek只在CPU和内容中运行(显存占用很低)。

或者是你不知道如何在本地部署DeepSeek，那么本篇文章将帮助你解决这个问题。

资源获取

本文档中的所有下载的所需资源都可以在网盘下载或在右上角的群内容获取。

1. Ollama部署

Ollama是一个开源的大模型管理框架，可以帮助你在本地部署DeepSeek。

你可以从这里访问Ollama的官网下载。

注意，如果你是AMD显卡，你应该下载Ollama的AMD版本，否则大模型会在CPU上运行，推理效率低。

你可以使用ALT+鼠标左键，在新标签中打开链接，防止此页面丢失。

github：ollama-for-amd

打开后点击右侧Releases标签，进入软件列表，将页面拖至最低部，~~如果你的~~AMD~~显卡是6000/7000系列以上（支持~~ROCm~~），下载前两个版本，否则下载第三个版本。~~

视频中此部分内容介绍有误，如果你是A卡6800及以上用户直接使用网盘中的OllamaSetup(A卡6800及以上、N卡等).exe安装包即可，否则使用Ollama-for-amd(6800及一下).exe 安装包

网盘内包括A卡6800及以上ollama安装包（包括N卡）、mac安装包

获取安装包后一路下一步，直至右下角出现羊驼图标，表明Ollama服务已启动。

如果磁盘空间不足，你可使用网盘文件中的磁盘分区助手.zip 进行调整。

2. 下载DeepSeek

2.1 下载DeepSeek

在开始菜单处搜索cmd,打开命令行窗口，输入以下命令下载DeepSeek：

ollama run deepseek-r1:1.5b

当看到有百分比显示时，说明DeepSeek已经开始下载。

如果下载过程较慢，耐心等待即可一般不会卡死。

当屏幕出现send a message时，说明DeepSeek已经下载完毕，可以向他提问了。

2.2 确认是否在显卡中运行

在开始菜单处搜索任务,打开任务管理器，切至性能，观察专用显存占用情况，如果很低，证明DeepSeek没有在显卡中运行。

如下图所示：

此时你需要替换部分文件，才能修复此问题。

访问github：v0.6.1.2

网盘压缩包内文件名：romc(A卡6800及以下需替换).zip

如果你无法解压 .7z文件可以使用网盘文件中的 7z压缩包解压工具.EXE 。

替换rocm

页面最低部，根据你的显卡类型，下载对应的文件：

如5700xt就下载：rocm.gfx1010-xnack-.for.hip.sdk.6.1.2.7z

下载完成后，将解压的内容分别对应替换：

C:\Users\你的用户名\AppData\Local\Programs\Ollama\lib\ollama\rocblas.dll

C:\Users\你的用户名\AppData\Local\Programs\Ollama\lib\ollama\rocblas\library

网盘中我将全部gpu_type的内容都下载下来了，你可以根据自己的显卡类型替换。

主流消费级显卡对照

显卡型号	微架构	GFX 代号	备注
Radeon RX 580	Polaris	gfx803	经典 GCN 架构，ROCm 5.0+ 已弃用
Radeon VII	Vega	gfx906	7nm 工艺，HBM2 显存
Radeon RX 5700 XT	Navi 10	gfx1010	首代 RDNA 架构，ROCm 6.0+ 有限支持
Radeon RX 6700 XT	Navi 22	gfx1031	RDNA2 架构，主流 ROCm 兼容型号
Radeon RX 6900 XT	Navi 21	gfx1030	旗舰 RDNA2，ROCm 官方支持
Radeon RX 7900 XTX	Navi 31	gfx1100	RDNA3 架构，需 ROCm 5.6+

专业卡/计算卡对照

显卡型号	GFX 代号	用途场景
AMD Instinct MI50	gfx906	计算卡（Vega 20）
AMD Instinct MI210	gfx90a	CDNA2 架构，专为 HPC/AI 优化
AMD Instinct MI300	gfx940	CDNA3 + Zen4 混合架构

APU/集成显卡对照

型号示例	GFX 代号	架构说明
Ryzen 5 5600G	gfx902	Vega 架构，ROCm 不支持
Ryzen 7 7840HS	gfx1103	移动端 RDNA3（Phoenix APU）

2.3 重启Ollama

再次查看性能，如果专用显存占用有提升，说明DeepSeek已经在显卡中运行。

2.4 UI界面

安装page assist拓展，可以使用Ollama的UI界面。

此拓展需要在谷歌浏览器或火狐浏览器中安装，其中谷歌浏览器的拓展商店需要科学上网才能访问。

如果你无法科学上网，可下载安装火狐浏览器，下载地址

下载完成后，点击右上角拼图图标，打开管理扩展，点击下方添加附加组件，搜索page-assist，打开后点击添加到Firefox。

下载过程可能会比较慢，耐心等待即可。

拓展下载完成后，浏览器右上角会弹窗提示添加，点击添加。

击右上角拼图图标，打开page assist界面，在右上角选择你刚下好的模型，在下方输入框输入内容就可以向deepseek提问了。

2.5 语言设置

语言设置

点击右上角设置图标，你可以设置语言，如下：

3.主要问题解答

我该下载使用那个版本的DeepSeek

关于B的选择：

显存	可用	流畅运行	备注
手机	1.5B	1.5B	玩玩可以
核显	8B	4B	主要靠内存
4G及以下	8B	7B及以下	-
8G	14B	8B	10tokens/s左右
16G	32B	14B	理论上
24G	70B	32B	理论上
32G	70B	-	理论上

关于内容使用：

可以使用内存来跑，无非就是慢，2-3tokens/s甚至更低。
适合不关注效率的推理。

关于Q的选择：

如果你通过其他渠道可以下载模型（Ollame默认是4Q）

建议下载4Q以上版本，Q值越低精度越低。
下载高Q值不如下载高B值的模型。

AMD显卡本地部署DeepSeek

http://localhost:8090/archives/amdxian-qia-ben-di-bu-shu-deepseek

作者

Administrator

发布于

2025年04月21日

更新于

2025年04月21日

许可协议

Lmstudio本地部署DeepSeek 及部署后的性能调节上一篇

Ollama更改下载环境部署下一篇