Computer

[Ubuntu18.04] Deep learning conda 환경설정

Opti-Mr 2024. 3. 31. 21:31
반응형

 

Local에 CUDA설치하지 않고 Conda 가상환경 내에서 설치하고자 할 때

왜냐면 로컬에 설치할 경우 버전 오류가 너무 많아서,,

conda cuda 11.6 설치
pip pytorch 1.13 설치

1. nvcc --version check

 nvcc --version


output)) nvidia-driver: 470

참고로, nvidia-smi에서 나오는 cuda 버전은 추천하는 버전인 것임. 로컬에 설치된 것이 아니라 !

2. cuda, cuDNN 설치 확인

cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

없다고 나오면 없는 것 !

버전 체크(Python, Pytorch, CUDA)

Pytorch version check
ref)) https://pytorch.org/get-started/locally/#linux-anaconda
https://pytorch.org/get-started/previous-versions/

 

Previous PyTorch Versions

Installing previous versions of PyTorch

pytorch.org

위에 가면 cuda버전에 맞는 pytorch 버전별로 깔 수 있는 코드를 알려줌 (설치는 아래)

3. conda 가상환경 생성

# 생성
conda create -n NAME python=3.10

# 활성화
conda activate NAME

# (참고) 가상환경 빠져나오기
conda deactivate

NAME에는 본인이 지정하고 싶은 가상환경 이름 넣기

4. CUDA 설치

CUDA toolkit version check
https://docs.nvidia.com/deploy/cuda-compatibility/index.html

CUDA Toolkit Linux x86_64 Minimum Required Driver Version
확인해보니,  nvidia driver 버전이 450.80.02* 이상이면 CUDA 11.x  중 아무거나 깔면 됨.

가상환경 활성화해준 다음, nvidia driver에 호환되는 cuda 버전 conda로 설치

conda install nvidia/label/cuda-11.6.0::cuda-nvcc

 

5. Pytorch 설치

CUDA 11.6 버전에 맞는 Pytorch를 conda로 설치한다.

conda install pytorch==1.13.0 torchvision==0.14.0 torchaudio==0.13.0 pytorch-cuda=11.6 -c pytorch -c nvidia

 
: solving environment 오류 !! 설치되지 않고 계속 로딩만 한다. Ctrl+C 눌러서 keyboard interrupt 해버리기

해결 방법 1

pip로 설치

pip install torch==1.13.1+cu116 torchvision==0.14.1+cu116 torchaudio==0.13.1 --extra-index-url

해당 코드는 아래 공식 pytorch 사이트에 나와있음

 https://download.pytorch.org/whl/cu116

 

https://download.pytorch.org/whl/cu116

 

download.pytorch.org

해결 방법 2 ((아래 내용은 해결방법 1 으로 이어짐))

다시 nvidia driver부터 삭제하고 다시 깔고나서 tmux 세션에서 새로운 가상환경에 pytorch 깔아봄!!

세션 목록 확인

$ tmux ls
0: 1 windows (created Sun Apr  7 21:08:12 2024)

 

tmux 세션 활성화

tmux a
conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia

 

 화면 종료 시 Ctrl+B+D

항상 solving environment 에러가 났었는데, 그냥 tmux 세션에서 명령해두고 시간지나고 보니 process[y/n] 떠있어서 yes 눌렀더니 바로 설치됨 !!

코드 출처

https://pytorch.org

 

PyTorch

 

pytorch.org

 

6. 설치 확인

terminal에서

# 가상환경 활성화
conda activate NAME

# python 열기
python3

 

import torch

아무 output 없으면 성공!!

항상 No module 뜨다가 아무것도 안뜰 때의 행복감이란,,, 이루 말할 수 없다,,,

No module 에러는 파이썬 인터프리터 지정이 안됐기 때문 !

인터프리터를 내가 생성한 가상환경으로 해주어야 한다.

 

cudnn은 따로 깔지 않았는데 있나 확인해본다.

print("cudnn version:{}".format(torch.backends.cudnn.version()))

cudnn version:8302

 

쿠다 버전도 재확인

print("cuda version: {}".format(torch.version.cuda))


cuda version: 11.6

 

GPU 장치명 확인

torch.cuda.get_device_name(0)

'NVIDIA GeForce RTX 3080'

 

YOLO 돌리기 성공,,

맨날 코랩이나 캐글노트북쓰다가 내 GPU 써 보니까 겁나 빠르게 느껴진다.

행복하다..

내일은 원격서버 끊겨도 로컬 서버에서 돌아갈 수 있는 방법을 알아봐야겠다!

반응형