Local에 CUDA설치하지 않고 Conda 가상환경 내에서 설치하고자 할 때
왜냐면 로컬에 설치할 경우 버전 오류가 너무 많아서,,
conda cuda 11.6 설치
pip pytorch 1.13 설치
1. nvcc --version check
nvcc --version
output)) nvidia-driver: 470
참고로, nvidia-smi에서 나오는 cuda 버전은 추천하는 버전인 것임. 로컬에 설치된 것이 아니라 !
2. cuda, cuDNN 설치 확인
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
없다고 나오면 없는 것 !
버전 체크(Python, Pytorch, CUDA)
Pytorch version check
ref)) https://pytorch.org/get-started/locally/#linux-anaconda
https://pytorch.org/get-started/previous-versions/
Previous PyTorch Versions
Installing previous versions of PyTorch
pytorch.org
위에 가면 cuda버전에 맞는 pytorch 버전별로 깔 수 있는 코드를 알려줌 (설치는 아래)
3. conda 가상환경 생성
# 생성
conda create -n NAME python=3.10
# 활성화
conda activate NAME
# (참고) 가상환경 빠져나오기
conda deactivate
NAME에는 본인이 지정하고 싶은 가상환경 이름 넣기
4. CUDA 설치
CUDA toolkit version check
https://docs.nvidia.com/deploy/cuda-compatibility/index.html
CUDA Toolkit Linux x86_64 Minimum Required Driver Version
확인해보니, nvidia driver 버전이 450.80.02* 이상이면 CUDA 11.x 중 아무거나 깔면 됨.
가상환경 활성화해준 다음, nvidia driver에 호환되는 cuda 버전 conda로 설치
conda install nvidia/label/cuda-11.6.0::cuda-nvcc
5. Pytorch 설치
CUDA 11.6 버전에 맞는 Pytorch를 conda로 설치한다.
conda install pytorch==1.13.0 torchvision==0.14.0 torchaudio==0.13.0 pytorch-cuda=11.6 -c pytorch -c nvidia
: solving environment 오류 !! 설치되지 않고 계속 로딩만 한다. Ctrl+C 눌러서 keyboard interrupt 해버리기
해결 방법 1
pip로 설치
pip install torch==1.13.1+cu116 torchvision==0.14.1+cu116 torchaudio==0.13.1 --extra-index-url
해당 코드는 아래 공식 pytorch 사이트에 나와있음
https://download.pytorch.org/whl/cu116
https://download.pytorch.org/whl/cu116
download.pytorch.org
해결 방법 2 ((아래 내용은 해결방법 1 으로 이어짐))
다시 nvidia driver부터 삭제하고 다시 깔고나서 tmux 세션에서 새로운 가상환경에 pytorch 깔아봄!!
세션 목록 확인
$ tmux ls
0: 1 windows (created Sun Apr 7 21:08:12 2024)
tmux 세션 활성화
tmux a
conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia
화면 종료 시 Ctrl+B+D
항상 solving environment 에러가 났었는데, 그냥 tmux 세션에서 명령해두고 시간지나고 보니 process[y/n] 떠있어서 yes 눌렀더니 바로 설치됨 !!
코드 출처
PyTorch
pytorch.org
6. 설치 확인
terminal에서
# 가상환경 활성화
conda activate NAME
# python 열기
python3
import torch
아무 output 없으면 성공!!
항상 No module 뜨다가 아무것도 안뜰 때의 행복감이란,,, 이루 말할 수 없다,,,
No module 에러는 파이썬 인터프리터 지정이 안됐기 때문 !
인터프리터를 내가 생성한 가상환경으로 해주어야 한다.
cudnn은 따로 깔지 않았는데 있나 확인해본다.
print("cudnn version:{}".format(torch.backends.cudnn.version()))
cudnn version:8302
쿠다 버전도 재확인
print("cuda version: {}".format(torch.version.cuda))
cuda version: 11.6
GPU 장치명 확인
torch.cuda.get_device_name(0)
'NVIDIA GeForce RTX 3080'
YOLO 돌리기 성공,,

맨날 코랩이나 캐글노트북쓰다가 내 GPU 써 보니까 겁나 빠르게 느껴진다.
행복하다..
내일은 원격서버 끊겨도 로컬 서버에서 돌아갈 수 있는 방법을 알아봐야겠다!
'Computer' 카테고리의 다른 글
Ubuntu20.04 Nvidia driver 삭제 및 재설치 (1) | 2024.04.08 |
---|---|
vscode SSH reload 무한 새로고침 해결 (1) | 2024.04.07 |
[Ubuntu 18.04 Deep learning Local 환경설정] NVIDIA cuDNN Installation 설치 확인 Tensorflow Pytorch (0) | 2024.01.16 |
Virus & Artificial Intelligence (1) | 2022.08.31 |
Python 반복문 (1) | 2022.07.10 |