Compare commits
2 Commits
bd54854bc6
...
feat/train
| Author | SHA1 | Date | |
|---|---|---|---|
| 3d2a4049d3 | |||
| 0cbaf53e86 |
@@ -5,7 +5,6 @@ services:
|
|||||||
dockerfile: Dockerfile-dev
|
dockerfile: Dockerfile-dev
|
||||||
image: kamco-cd-training-api:${IMAGE_TAG:-latest}
|
image: kamco-cd-training-api:${IMAGE_TAG:-latest}
|
||||||
container_name: kamco-cd-training-api
|
container_name: kamco-cd-training-api
|
||||||
runtime: nvidia
|
|
||||||
deploy:
|
deploy:
|
||||||
resources:
|
resources:
|
||||||
reservations:
|
reservations:
|
||||||
|
|||||||
@@ -5,6 +5,13 @@ services:
|
|||||||
dockerfile: Dockerfile
|
dockerfile: Dockerfile
|
||||||
image: kamco-train-api:${IMAGE_TAG:-latest}
|
image: kamco-train-api:${IMAGE_TAG:-latest}
|
||||||
container_name: kamco-train-api
|
container_name: kamco-train-api
|
||||||
|
deploy:
|
||||||
|
resources:
|
||||||
|
reservations:
|
||||||
|
devices:
|
||||||
|
- driver: nvidia
|
||||||
|
count: all
|
||||||
|
capabilities: [gpu]
|
||||||
expose:
|
expose:
|
||||||
- "8080"
|
- "8080"
|
||||||
environment:
|
environment:
|
||||||
|
|||||||
@@ -60,7 +60,7 @@ public class GpuDmonReader {
|
|||||||
runDmon(); // GPU 사용률 수집 시작
|
runDmon(); // GPU 사용률 수집 시작
|
||||||
} catch (Exception e) {
|
} catch (Exception e) {
|
||||||
// dmon 프로세스 종료되면 여기로 들어옴
|
// dmon 프로세스 종료되면 여기로 들어옴
|
||||||
log.warn("dmon restart...");
|
log.warn("dmon restart: {}", e.getMessage());
|
||||||
}
|
}
|
||||||
|
|
||||||
// 5초 대기 후 재시작
|
// 5초 대기 후 재시작
|
||||||
|
|||||||
Reference in New Issue
Block a user