diff --git a/src/main/java/com/kamco/cd/training/train/service/DockerTrainService.java b/src/main/java/com/kamco/cd/training/train/service/DockerTrainService.java index 4d9bec2..fbb7753 100644 --- a/src/main/java/com/kamco/cd/training/train/service/DockerTrainService.java +++ b/src/main/java/com/kamco/cd/training/train/service/DockerTrainService.java @@ -231,11 +231,7 @@ public class DockerTrainService { // GPU 전체 사용 c.add("--gpus"); - if ("prod".equals(profile)) { - c.add("1"); // 학습서버 GPU 1개인 곳은 1이어야 함 - } else { - c.add("all"); - } + c.add("all"); // IPC host 사용 여부 if (ipcHost) { @@ -290,6 +286,7 @@ public class DockerTrainService { // addArg(c, "--gpu-ids", req.getGpuIds()); // null if ("prod".equals(profile)) { addArg(c, "--batch-size", 2); // 학습서버 GPU 1개인 곳은 batch-size:2 까지만 가능 + addArg(c, "--gpus", "1"); // 학습서버 GPU 1개인 곳은 1이어야 함 addArg(c, "--gpu-ids", "0"); // 학습서버 GPU 1개인 곳은 0이어야 함 } else { addArg(c, "--batch-size", req.getBatchSize()); // 학습서버 GPU 1개인 곳은 batch-size:2 까지만 가능 @@ -458,11 +455,8 @@ public class DockerTrainService { c.add("run"); c.add("--rm"); c.add("--gpus"); - if ("prod".equals(profile)) { - c.add("1"); // 학습서버 GPU 1개인 곳은 1이어야 함 - } else { - c.add("all"); - } + c.add("all"); + c.add("--ipc=host"); c.add("--shm-size=" + shmSize);