컨테이너 기반 가상화 환경에서 GPU 메모리 자원 관리 및 스케줄링 방법 및 시스템이 제시된다. 본 발명에서 제안하는 컨테이너 기반 가상화 환경에서 GPU 메모리 자원 관리 및 스케줄링 방법은 사용자 정의된 nvidia-도커(docker)에 명령이 전송되면, NVIDIA GPU 사용 옵션을 갖는 오리지널 도커에 명령이 리디렉션되는 단계, ConVGPU가 상기 NVIDIA GPU 와 통신 및 제어하여 CUDA 래퍼(wrapper) API 모듈을 컨테이너에 삽입하는 단계, 컨테이너 런타임 중에 CUDA 래퍼 API 모듈이 일부 API를 캡처하여 GPU 메모리 스케줄러로 전송하는 단계 및 GPU 메모리 스케줄러가 컨테이너와 GPU 메모리 사용을 스케줄링하는 단계를 포함한다.