OOM

부스트캠프 AI Tech 2기/2기 U-Stage

3주차 PyTorch Trouble Shooting

OOM(out of memory) OOM이 해결하기 어려운 이유 어디서 발생했는지 알기 어려움 Error backtracking이 이상한데로 감 메모리의 이전상황의 파악이 어려움 GPU Util 사용하기 nvidia-smi 처럼 GPU의 상태를 보여주는 모듈 colab은 환경에서 GPU 상태를 보여주기 편함 iter마다 메모리가 늘어나는지 확인가능 ! pip install GPUtil import GPUtil GPUtil.showUtilization() torch.cuda.empty_cache()써보기 사용되지 않는 GPU상 cache를 정리 가용 메모리를 확보 del 과는 구분이 필요 reset 대신 쓰기 좋은 함수 empty_cache를 사용했을때 강제적으로 garbage collector를 실행 학..

모플로
'OOM' 태그의 글 목록