Merge pull request '리커버리 수정' (#151) from feat/training_260303 into develop

Reviewed-on: #151
This commit was merged in pull request #151.
This commit is contained in:
2026-03-04 01:00:45 +09:00

View File

@@ -43,6 +43,7 @@ public class JobRecoveryOnStartupService {
private final ModelTrainJobCoreService modelTrainJobCoreService;
private final ModelTrainMngCoreService modelTrainMngCoreService;
private final ModelTrainMetricsJobService modelTrainMetricsJobService;
/**
* Docker 컨테이너가 쓰는 response(산출물) 디렉토리의 "호스트 측" 베이스 경로. 예) /data/train/response
@@ -95,6 +96,8 @@ public class JobRecoveryOnStartupService {
modelTrainJobCoreService.markSuccess(job.getId(), 0);
// model 상태 변경
markStepSuccessByJobType(job);
// 결과 csv 파일 정보 등록
modelTrainMetricsJobService.findTrainValidMetricCsvFiles();
} else {
// 3-3) 산출물이 부족하면 실패 처리(운영 정책에 따라 "유예"도 가능)
@@ -184,6 +187,8 @@ public class JobRecoveryOnStartupService {
modelTrainJobCoreService.markSuccess(job.getId(), 0);
// model 상태 변경
markStepSuccessByJobType(job);
// 결과 csv 파일 정보 등록
modelTrainMetricsJobService.findTrainValidMetricCsvFiles();
} else {
// 5-2) exitCode != 0 이거나 null이면 실패로 간주 → FAILED 처리