반응형
저는 기존에 사용하던 tensorflow-gpu 2.1버전이 아닌 tensorflow-gpu 2.4 버전이 나와서 버전 업데이트를 해보려고 했으나 실패했습니다.
When can we expect Tensorflow builds with Cuda 11.1 or Cuda 11.2? 저도 해당 이슈와 같은 에러가 떠서 실패했습니다.
한번 꼬여버리니까 제 실력으로 복구가 불가능해져서... 다음 기회에 다시 도전해보기로 하였습니다.
Ubuntu를 포맷시키고 이전 버전인 tensorflow-gpu 2.3에 맞는 cuda와 cudnn을 설치하기로 하고 정리를 해보게 됐습니다.
nvidia-driver와 cuda의 기본 정보를 제거하고 시작하겠습니다.
1. 기존에 설치된 nvidia와 cuda제거
sudo apt-get remove --purge '^nvidia-.*'
sudo apt-get autoremove --purge 'cuda*'
2. cuda 10.1 install 및 확인
sudo apt install nvidia-cuda-toolkit
# cuda version check
nvcc -V
3. Cudnn 설치
Download cuDNN v7.6.5 for cuda 10.1에 있는 cuDNN Library for Linux를 다운받으세요.
다운로드 받은 경로로가서
tar -xvzf cudnn-10.1-linux-x64-v7.6.5.32.tgz
이 명령어를 입력하셔서 압축을 풀어줍니다.
4. Cudnn 복사 및 권한설정
Cuda가 설치된 곳의 폴더로 Cudnn의 파일을 덮어쓰기 해야합니다.
압축 해제한곳에 cuda라는 폴더명으로 압축이 해제되기때문에 아래 명령어를 똑같이 입력해줍니다.
# 복사
sudo cp cuda/include/cudnn.h /usr/lib/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/lib/cuda/lib64/
# 권한설정
sudo chmod a+r /usr/lib/cuda/include/cudnn.h
sudo chmod a+r /usr/lib/cuda/lib64/libcudnn*
5. 환경변수 등록 및 적용
# 저는 zsh을 사용합니다.
sudo vim ~/.zshrc
or
# bash shell 사용자들은
sudo vim~/.bashrc
----------------------
맨 아래줄에 입력해줍니다.
#CUDA ENV
export LD_LIBRARY_PATH=/usr/lib/cuda/lib64:$LD_LIBRARY_PATH
export LD_LIBRARY_PATH=/usr/lib/cuda/include:$LD_LIBRARY_PATH
마지막으로 환경변수를 적용시켜줍니다.
source ~/.zshrc
or
source ~/.bashrc
nvidia-smi를 위한 선택사항
6. nvidia driver 설치
nvidia driver version with cuda version에서 Cuda버전에 맞는 최소한의 드라이버 버전만 맞춰주시면 됩니다.
# 설치 가능한 버전 체크
ubuntu-drivers devices
# 저는 recommended 버전을 설치했습니다.
sudo apt install nvidia-driver-460
#여기서 FAILED CUDA Driver and Runtime version may be mismatched. 에러가 떠도 괜찮습니다.
# 재부팅
sudo reboot
7. nvidia-smi로 드라이버 확인 및 cuda version 확인
nvidia-smi
이렇게 우측 상단을 보시면 CUDA Version: 11.2이라고 되어있지만 우리는 CUDA Version 10.1 를 사용중입니다.
nvcc -V
반응형
'개발 > Tensorflow' 카테고리의 다른 글
Tensorflow v2.3 Object Detection API fine tuning (3) (1) | 2021.03.14 |
---|---|
Tensorflow v2.3 Object Detection API fine tuning (2) (1) | 2021.03.14 |
Tensorflow v2.3 Object Detection API fine tuning (1) (0) | 2021.03.14 |
Google Colab session 유지 (2) | 2021.02.06 |
CNN UnknownError: Failed to get convolution algorithm. (3) | 2021.02.02 |