快資訊:提高Stable Diffusion AI畫圖 Nvidia顯卡十倍計算速度
在啟動Stable Diffusion時一直報Torch not compiled with CUDA enabled警告,一開始沒在意本著能用就行的態(tài)度湊活用,每個圖都耗時十多秒,然后本著好奇Torch not compiled with CUDA enabled這個警告去搜索解決方案,都沒說這個警告解決了有什么用,并且網(wǎng)上資料東拼西湊根本不能解決問題,本著專研解決問題的心態(tài)花一晚上解決這個警告,并將計算速度提高了十倍基本4G的模型2秒能出圖。
(資料圖片僅供參考)
本地環(huán)境:windows11 13900k 32G ? Nvidia 3080ti
當(dāng)前顯卡驅(qū)動版本:
注意上面的CUDA12.0.147不一定要和CUDA Toolkit 版本一樣,但是CUDA Toolkit一定要和pytorch中版本一樣
我沒用conda太麻煩了,直接裸裝到本地python環(huán)境速度還快,下面是步驟:
正式開始
首先要安裝cuda_11.6.0_511.23_windows.exe ?這個版本必須要和pytorch官網(wǎng)對應(yīng)(其實不一定非要安裝最新的cuda老的也可以的只要版本對上),然后安裝pytorch可以從官網(wǎng)或者本地,如果安裝過程中出現(xiàn)以來報錯,可以檢查手動安裝依賴再重新安裝
關(guān)于CUDA Toolkit 與你的顯卡驅(qū)動版本對應(yīng)關(guān)系可以參考這個文檔,他都是大于等于也就是說你的cuda老版本也沒關(guān)系 https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html ? 可以如上圖看顯卡版本或者cmd命令行執(zhí)行nvidia-smi查看
1.下載CUDA Toolkit
https://developer.nvidia.com/cuda-11-6-0-download-archive?target_os=Windows&target_arch=x86_64&target_version=11&target_type=exe_local
cuda_11.6.0_511.23_windows.exe (全部下一步)
2.安裝pytorch
https://pytorch.org/get-started/locally/ 參考地址
pip都是在cmd命令行安裝如果沒pip去baidu查一下python pip安裝教程,python版本我這里是10.0
組合腳本(在線安裝):
pip install protobuf==3.20.0 ?requests==2.28.2 torch==1.13.1 torchvision==0.14.1 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu116
本地安裝(可選)
下載地址:https://download.pytorch.org/whl/cu116/torch-1.13.1%2Bcu116-cp310-cp310-win_amd64.whl
pip install protobuf==3.20.0 ?requests==2.28.2 torch==1.13.1 torchvision==0.14.1 torchaudio==0.13.1 torch-1.13.1+cu116-cp310-cp310-win_amd64.whl
python命令行:
import torch
torch.cuda.is_available()
如果返回true表示安裝成功
50步加了很多關(guān)鍵詞才19秒不到
如果20步只要3秒,并且分辨率也高不會崩潰。