适用环境:Windows 11 + WSL2 + Ubuntu 24.04 + AMD RX 7700 XT
本教程将引导你在 Windows Subsystem for Linux 2 (WSL2) 上安装 AMD ROCm 7.2 和 PyTorch,以便在 AMD 显卡上进行机器学习开发。
在安装前,请确认你的系统满足以下要求:
Win + R,输入 winver,按回车Win + R,输入 dxdiag,按回车根据 ROCm 7.2 官方兼容性矩阵:
| 项目 | 支持版本 |
|---|---|
| Ubuntu | 22.04 或 24.04.2 Desktop (HWE) |
| WSL 内核 | 5.15 |
| ROCm | 7.2 |
| Windows 驱动 | Adrenalin Edition 26.1.1 |
| PyTorch | 2.9.1 + ROCm 7.2 |
| Python | 3.10 (Ubuntu 22.04) 或 3.12 (Ubuntu 24.04) |
如果你还没有安装 WSL2,请按照以下步骤操作:
wsl --install
安装完 WSL2 后,默认会安装 Ubuntu。如果需要指定版本:
# 查看可用的 Linux 发行版
wsl --list --online
# 安装 Ubuntu 24.04
wsl --install -d Ubuntu-24.04
# 或安装 Ubuntu 22.04
wsl --install -d Ubuntu-22.04
首次启动 Ubuntu 时:
在 PowerShell 中运行:
wsl --list --verbose
确认输出显示 VERSION 为 2:
NAME STATE VERSION
* Ubuntu-24.04 Running 2
如果显示的是 VERSION 1,请升级到 WSL 2:
wsl --set-version Ubuntu-24.04 2
wsl --update
ROCm 7.2 需要 AMD Software: Adrenalin Edition 26.1.1 驱动。
访问 AMD 官方驱动下载页面: https://www.amd.com/en/resources/support-articles/release-notes/RN-RAD-WIN-26-1-1.html
点击下载链接:
重要:安装驱动后,必须重启计算机才能生效。
重启后,确认驱动已正确安装:
sudo apt update
根据你的 Ubuntu 版本选择对应的命令:
# 下载安装脚本
wget https://repo.radeon.com/amdgpu-install/7.2/ubuntu/noble/amdgpu-install_7.2.70200-1_all.deb
# 安装脚本
sudo apt install ./amdgpu-install_7.2.70200-1_all.deb
# 下载安装脚本
wget https://repo.radeon.com/amdgpu-install/7.2/ubuntu/jammy/amdgpu-install_7.2.70200-1_all.deb
# 安装脚本
sudo apt install ./amdgpu-install_7.2.70200-1_all.deb
使用 amdgpu-install 脚本安装 ROCm:
sudo amdgpu-install -y --usecase=wsl,rocm --no-dkms
参数说明:
-y:自动确认,无需手动确认--usecase=wsl,rocm:安装 WSL 用例和 ROCm--no-dkms:不安装内核模块(WSL 不需要)注意:此过程可能需要几分钟时间,具体取决于网络速度。
安装完成后,运行以下命令验证:
rocminfo
预期输出:
*******
Agent 2
*******
Name: gfx1100
Marketing Name: Radeon RX 7700 XT
Vendor Name: AMD
[...]
如果看到你的显卡信息(如 Radeon RX 7700 XT),说明 ROCm 安装成功。
推荐使用 Miniconda 来管理 Python 环境:
# 下载 Miniconda 安装脚本
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
# 运行安装脚本
bash Miniconda3-latest-Linux-x86_64.sh
Enter 查看许可协议yes 接受许可Enter 确认安装位置(默认为 ~/miniconda3)yes 初始化 Miniconda# 关闭并重新打开终端,或运行
source ~/.bashrc
# 验证 Conda 安装
conda --version
根据你的 Ubuntu 版本创建对应的 Python 环境:
# 创建名为 rocm 的环境,Python 版本为 3.12
conda create -n rocm python=3.12 -y
# 激活环境
conda activate rocm
# 创建名为 rocm 的环境,Python 版本为 3.10
conda create -n rocm python=3.10 -y
# 激活环境
conda activate rocm
提示:以后每次使用 PyTorch 时,都需要先激活此环境:
conda activate rocm
# 安装 pip
sudo apt install python3-pip -y
# 更新 pip
pip3 install --upgrade pip wheel
根据你的 Ubuntu 版本和 Python 版本下载对应的 wheel 文件:
# 下载 PyTorch 和相关库
wget https://repo.radeon.com/rocm/manylinux/rocm-rel-7.2/torch-2.9.1%2Brocm7.2.0.lw.git7e1940d4-cp312-cp312-linux_x86_64.whl
wget https://repo.radeon.com/rocm/manylinux/rocm-rel-7.2/torchvision-0.24.0%2Brocm7.2.0.gitb919bd0c-cp312-cp312-linux_x86_64.whl
wget https://repo.radeon.com/rocm/manylinux/rocm-rel-7.2/triton-3.5.1%2Brocm7.2.0.gita272dfa8-cp312-cp312-linux_x86_64.whl
wget https://repo.radeon.com/rocm/manylinux/rocm-rel-7.2/torchaudio-2.9.0%2Brocm7.2.0.gite3c6ee2b-cp312-cp312-linux_x86_64.whl
# 下载 PyTorch 和相关库
wget https://repo.radeon.com/rocm/manylinux/rocm-rel-7.2/torch-2.9.1%2Brocm7.2.0.lw.git7e1940d4-cp310-cp310-linux_x86_64.whl
wget https://repo.radeon.com/rocm/manylinux/rocm-rel-7.2/torchvision-0.24.0%2Brocm7.2.0.gitb919bd0c-cp310-cp310-linux_x86_64.whl
wget https://repo.radeon.com/rocm/manylinux/rocm-rel-7.2/triton-3.5.1%2Brocm7.2.0.gita272dfa8-cp310-cp310-linux_x86_64.whl
wget https://repo.radeon.com/rocm/manylinux/rocm-rel-7.2/torchaudio-2.9.0%2Brocm7.2.0.gite3c6ee2b-cp310-cp310-linux_x86_64.whl
pip3 uninstall torch torchvision triton torchaudio -y
pip3 install torch-2.9.1+rocm7.2.0.lw.git7e1940d4-cp312-cp312-linux_x86_64.whl \
torchvision-0.24.0+rocm7.2.0.gitb919bd0c-cp312-cp312-linux_x86_64.whl \
torchaudio-2.9.0+rocm7.2.0.gite3c6ee2b-cp312-cp312-linux_x86_64.whl \
triton-3.5.1+rocm7.2.0.gita272dfa8-cp312-cp312-linux_x86_64.whl
注意:在 Python 3.12 的非虚拟环境中安装时,可能需要添加 --break-system-packages 标志。如果使用 Conda 环境(推荐),则不需要此标志。
pip3 install torch-2.9.1+rocm7.2.0.lw.git7e1940d4-cp310-cp310-linux_x86_64.whl \
torchvision-0.24.0+rocm7.2.0.gitb919bd0c-cp310-cp310-linux_x86_64.whl \
torchaudio-2.9.0+rocm7.2.0.gite3c6ee2b-cp310-cp310-linux_x86_64.whl \
triton-3.5.1+rocm7.2.0.gita272dfa8-cp310-cp310-linux_x86_64.whl
这是 关键步骤,用于确保 PyTorch 能在 WSL 环境中正常工作:
# 定位 torch 库的安装位置
location=$(pip show torch | grep Location | awk -F ": " '{print $2}')
# 进入 torch 库目录
cd ${location}/torch/lib/
# 移除不兼容的 HSA 运行时库
rm libhsa-runtime64.so*
NumPy 2.0 与当前版本的 PyTorch wheel 不兼容,需要降级:
pip3 install numpy==1.26.4
如果你在使用 Conda 环境时遇到 ImportError: version 'GLIBCXX_3.4.30' not found 错误,需要升级 GCC:
conda install -c conda-forge gcc=12.1.0 -y
python3 -c 'import torch' 2> /dev/null && echo 'PyTorch 导入成功' || echo 'PyTorch 导入失败'
预期输出:
PyTorch 导入成功
python3 -c 'import torch; print(torch.cuda.is_available())'
预期输出:
True
如果输出为 False,说明 PyTorch 无法检测到 GPU,请参考故障排除部分。
python3 -c "import torch; print(f'GPU 设备: {torch.cuda.get_device_name(0)}')"
预期输出(以 RX 7700 XT 为例):
GPU 设备: Radeon RX 7700 XT
python3 -m torch.utils.collect_env
这会显示完整的 PyTorch 环境信息,包括:
创建一个测试脚本:
cat > test_gpu.py << 'EOF'
import torch
# 检查 GPU 是否可用
if torch.cuda.is_available():
print(f"✓ GPU 可用")
print(f"✓ GPU 数量: {torch.cuda.device_count()}")
print(f"✓ 当前 GPU: {torch.cuda.get_device_name(0)}")
# 在 GPU 上创建张量
x = torch.rand(5, 3).cuda()
print(f"✓ 在 GPU 上创建张量成功")
print(f"张量内容:\n{x}")
# 简单的 GPU 计算
y = x * 2
print(f"✓ GPU 计算成功")
print(f"计算结果:\n{y}")
else:
print("✗ GPU 不可用")
EOF
# 运行测试
python3 test_gpu.py
预期输出:
✓ GPU 可用
✓ GPU 数量: 1
✓ 当前 GPU: Radeon RX 7700 XT
✓ 在 GPU 上创建张量成功
张量内容:
tensor([[0.xxxx, 0.xxxx, 0.xxxx],
[0.xxxx, 0.xxxx, 0.xxxx],
[0.xxxx, 0.xxxx, 0.xxxx],
[0.xxxx, 0.xxxx, 0.xxxx],
[0.xxxx, 0.xxxx, 0.xxxx]], device='cuda:0')
✓ GPU 计算成功
计算结果:
[...]
rocminfo 无法识别 GPU可能原因:
解决方法:
sudo amdgpu-uninstall
sudo amdgpu-install -y --usecase=wsl,rocm --no-dkms
torch.cuda.is_available() 返回 False可能原因:
解决方法:
pip3 show torch
应显示版本为 2.9.1+rocm7.2.0
重新执行 HSA 运行时库更新步骤(6.5 节)
原因:Conda 环境中的 GCC 版本过低
解决方法:
conda install -c conda-forge gcc=12.1.0 -y
症状:
解决方法:
pip3 install numpy==1.26.4
原因:网络连接问题或 URL 编码
解决方法:
检查方法:
wsl --list --verbose
升级到 WSL 2:
wsl --set-version Ubuntu-24.04 2
如果遇到其他问题:
安装完成后,你可以:
| 组件 | 版本 | 备注 |
|---|---|---|
| Windows | 10 (Build 19041+) 或 11 | 推荐 Windows 11 |
| WSL 内核 | 5.15 | 自动安装 |
| Ubuntu | 22.04 或 24.04 | 推荐 24.04 |
| Python | 3.10 (22.04) 或 3.12 (24.04) | 根据 Ubuntu 版本 |
| ROCm | 7.2 | |
| PyTorch | 2.9.1 + ROCm 7.2 | |
| Triton | 3.5.1 + ROCm 7.2 | |
| NumPy | 1.26.4 | 不支持 2.0+ |
| AMD 驱动 | Adrenalin Edition 26.1.1 | WSL2 必需 |
最后更新日期:2026 年 2 月 12 日
文档版本:1.0
如有问题或建议,请参考故障排除部分或联系社区获取帮助。