728x90
학습을 시키다 보면 OOM이 발생하는데, 발생 후 batch_size를 줄여서 실행시키려 할 때 기존의 데이터가 GPU의 메모리를 차지하고 있다면 계속 OOM이 발생한다. 이 때 GPU의 메모리를 비우는 것이 필요한데, GPU 메모리를 확인하는 방법과 비우는 방법을 정리한다.
GPU 사용량 확인
기본적으로 사용량을 확인하는 명령어는 아래와 같다.
nvidia-smi
조금 더 자세한 설명은 아래 글 참고.
리눅스에서 gpu 사용량 확인하기 (tistory.com)
리눅스에서 gpu 사용량 확인하기
nvidia-smi nvidia-smi 명령어를 활용해서 메모리 상황을 볼 수 있다. 실시간으로 gpu의 메모리 사용량 및 변화를 보고 싶다면, watch명령어를 활용하면 된다. -n 옵션 : 몇 초마다 갱신할지 설정 -d 옵션 :
bbooo.tistory.com
GPU 메모리 비우기
아래 메모리 부분을 보면 모든 메모리가 꽉 차 있는 것을 볼 수 있다.
ps 명령어를 활용해서 메모리를 차지하고 있는 프로세스를 kill 명령어를 통해 종료함으로써 메모리를 비울 수 있다.
ps aux | grep python
kill -9 [종료시킬 프로세스번호]
기존에 학습을 돌리던 명령어를 kill 명령어를 통해 종료시킨 후, GPU 메모리를 확인해보니 모두 비워진 것을 확인할 수 있다.
728x90
'Setting' 카테고리의 다른 글
Conda activate가 되지 않을 때 PowerShell 실행 정책 바꾸기 (0) | 2023.04.07 |
---|---|
github 학생 인증하기 (0) | 2023.03.22 |
history 명령어 (0) | 2023.01.25 |
리눅스에서 gpu 사용량 확인하기 (0) | 2023.01.12 |
리눅스에서 구글 클라우드 사용 위한 gsutill 설치 (0) | 2023.01.11 |