AMD显卡可以本地玩DeepSeek了!附简单部署教程

vipkang vipkang 2025-02-09 18:30:05 新闻 阅读: 729
摘要: 石家庄都市网2月9日消息,DeepSeek火得一塌糊涂,国内外的相关企业都在积极适配支持,而对于AI大模型来说,使用GPU运行无疑是最高效的,比如AMD,无论是Instinct加速卡还是Radeon游戏卡,都已经适配到位。 你只需要任意一块

石家庄都市网2月9日消息,DeepSeek火得一塌糊涂,国内外的相关企业都在积极适配支持,而对于AI大模型来说,使用GPU运行无疑是最高效的,比如AMD,无论是Instinct加速卡还是Radeon游戏卡,都已经适配到位。

你只需要任意一块AMD RX 7000系列显卡,就可以在本地体验DeepSeek。

AMD显卡可以本地玩DeepSeek了!附简单部署教程

AMD Radeon游戏卡本地部署DeepSeek非常简单,只需打开AMD官网(中英文均可),搜索“15.1.1”,进入第一个结果,下载AMD Adrenalin 25.1.1测试版驱动,安装并重启。

直接下载地址:

https://www.amd.com/zh-cn/resources/support-articles/release-notes/RN-RAD-WIN-25-1-1.html

AMD显卡可以本地玩DeepSeek了!附简单部署教程

然后打开LM Studio官网网站的锐龙专栏(https://lmstudio.ai/ryzenai),并下载LM Studio for Ryzen AI安装包,安装并运行。

AMD显卡可以本地玩DeepSeek了!附简单部署教程

启动之后,点击右下角设置(可选中文语言),找到并开启“Use LM Studio's Hugging Face”这个选项。

AMD显卡可以本地玩DeepSeek了!附简单部署教程

回到主界面,在左侧菜单栏点击搜索图标,输入“DeepSeek R1”,就可以看到已经训练好的各种DeepSeek模型。

AMD显卡可以本地玩DeepSeek了!附简单部署教程

至于如何选择,可以参考如下的AMD官方推荐列表,比如旗舰级的RX 7900 XTX可以支持到32B参数,主流的RX 7600则仅支持8G模型。

AMD显卡可以本地玩DeepSeek了!附简单部署教程

然后下载合适的模型,在主界面上方选择已下载的模型,然后调高“GPU Offload”的数值,不同选项的具体含义可自行搜索或者直接询问DeepSeek。

AMD显卡可以本地玩DeepSeek了!附简单部署教程

AMD显卡可以本地玩DeepSeek了!附简单部署教程

模型加载完毕后,就可以尽情地在本地体验DeepSeek了。

AMD显卡可以本地玩DeepSeek了!附简单部署教程

与此同时,AMD Instinct GPU加速卡也已经部署集成DeepSeek V3模型,并优化了SGLang性能,支持完整的671B参数,开发者可以借助AMD ROCm平台快速、高效地开发AI应用。

1、启动Docker容器

docker run -it --ipc=host --cap-add=SYS_PTRACE --network=host \

 --device=/dev/kfd --device=/dev/dri --security-opt seccomp=unconfined \

 --group-add video --privileged -w /workspace lmsysorg/sglang:v0.4.2.post3-rocm630

2、开始使用

(1)、使用CLI登陆进入Hugging Face。

huggingface-cli login 

(2)、启动SGLang Server,在本地部署DeepSeekV3 FP8模型。

python3 -m sglang.launch_server --model-path deepseek-ai/DeepSeek-V3 --port 30000 --tp 8 --trust-remote-code

(3)、服务器启动后,打开新的终端,发送请求。

curl http://localhost:30000/generate \

 -H "Content-Type: application/json" \

 -d '{

  "text": "Once upon a time,",

  "sampling_params": {

  "max_new_tokens": 16,

  "temperature": 0

 }

}'

3、基准测试

export HSA_NO_SCRATCH_RECLAIM=1

python3 -m sglang.bench_one_batch --batch-size 32 --input 128 --output 32 --model deepseek-ai/DeepSeek-V3 --tp 8 --trust-remote-code

python3 -m sglang.launch_server --model deepseek-ai/DeepSeek-V3 --tp 8 --trust-remote-code

python3 benchmark/gsm8k/bench_sglang.py --num-questions 2000 --parallel 2000 --num-shots 8

Accuracy: 0.952

Invalid: 0.000

另外,如果需要BF16精度,可以自行转换:

cd inference

python fp8_cast_bf16.py --input-fp8-hf-path /path/to/fp8_weights --output-bf16-hf-path /path/to/bf16_weights

AMD显卡可以本地玩DeepSeek了!附简单部署教程

    其他相关
    笔记本显卡特效调整手册,优化指南与设置技巧

    笔记本显卡特效调整手册,优化指南与设置技巧

    作者: 站长小白 时间:2025-05-07 阅读: 626
    本文是关于笔记本显卡特效调整指南的摘要,内容涵盖如何优化笔记本显卡性能,提升游戏和图形应用体验,通过简单的步骤指导用户调整显卡设置,以达到最佳视觉效果和性能平衡,本文旨在帮助用户充分利用笔记本硬件资源,提高日常使用电脑的满意度。...

    RTX 50系列显卡新低价曝光,RTX 5060定价仅2499元,首发开卖日期已定

    作者: 站长小白 时间:2025-05-07 阅读: 6905
    RTX 50系列显卡中最便宜的型号RTX 5060的中国定价公布,令人惊喜的是其价格杀至2499元,这款显卡将于5月20日零点正式开卖,为消费者提供了高性价比的选择。...

    Intel XeSS游戏突破突破至超两百款,XeSS 2游戏达十九款,帧率飙升四倍!

    作者: 站长小白 时间:2025-05-07 阅读: 6088
    Intel的XeSS游戏已经突破200款,其中XeSS 2更是达到了惊人的19款,这一技术的推出,让游戏的帧率飙升四倍,为游戏玩家带来了前所未有的流畅体验,这一进步无疑将推动游戏行业的发展,为玩家带来更加出色的游戏体验。...
    如何辨别显卡类型?

    如何辨别显卡类型?

    作者: hao123 时间:2025-05-07 阅读: 789
    要区分使用的显卡类型,可以通过查看计算机硬件信息、运行相关软件检测或检查显卡型号等方法来判断,不同显卡类型在性能、功能和适用场景上有所差异,了解显卡类型有助于更好地发挥计算机性能,满足个人或工作需求。...
    探讨显卡最大显存及HD3000显卡显存占用情况

    探讨显卡最大显存及HD3000显卡显存占用情况

    作者: hao123 时间:2025-05-07 阅读: 585
    本文将探讨显卡的最大显存以及HD3000显卡的显存使用量,显卡的最大显存决定了其能处理的数据量大小,影响图形性能,而HD3000显卡作为主流型号,其显存使用量对于游戏和图形设计应用至关重要,本文将分析这些方面,帮助读者了解显卡性能与显存使用量的关系。...

    AMD RX 7300四单元亮机卡,亮眼性能引发意外重启

    作者: 站长小白 时间:2025-05-07 阅读: 3747
    AMD RX 7300显卡意外重启,尽管只有四单元,却展现出令人瞩目的性能,成为一款优秀的亮机卡,其性能表现令人惊喜,足以满足用户的日常使用需求。...

    年度爆文