ai 학습실행 run command 수정

This commit is contained in:
2026-03-11 10:18:33 +09:00
parent da31bd9d99
commit 7416327cc3

View File

@@ -231,11 +231,7 @@ public class DockerTrainService {
// GPU 전체 사용
c.add("--gpus");
if ("prod".equals(profile)) {
c.add("1"); // 학습서버 GPU 1개인 곳은 1이어야 함
} else {
c.add("all");
}
c.add("all");
// IPC host 사용 여부
if (ipcHost) {
@@ -290,6 +286,7 @@ public class DockerTrainService {
// addArg(c, "--gpu-ids", req.getGpuIds()); // null
if ("prod".equals(profile)) {
addArg(c, "--batch-size", 2); // 학습서버 GPU 1개인 곳은 batch-size:2 까지만 가능
addArg(c, "--gpus", "1"); // 학습서버 GPU 1개인 곳은 1이어야 함
addArg(c, "--gpu-ids", "0"); // 학습서버 GPU 1개인 곳은 0이어야 함
} else {
addArg(c, "--batch-size", req.getBatchSize()); // 학습서버 GPU 1개인 곳은 batch-size:2 까지만 가능
@@ -458,11 +455,8 @@ public class DockerTrainService {
c.add("run");
c.add("--rm");
c.add("--gpus");
if ("prod".equals(profile)) {
c.add("1"); // 학습서버 GPU 1개인 곳은 1이어야 함
} else {
c.add("all");
}
c.add("all");
c.add("--ipc=host");
c.add("--shm-size=" + shmSize);