산업 현장의 고질적인 난제 중 하나인 개방형 작업장 스케줄링 문제(OSSP)를 딥 강화 학습(DRL) 기반의 트랜스포머(Transformer) 모델이 효과적으로 해결할 수 있다는 연구 결과가 발표되었습니다. 이 새로운 접근 방식은 작업 수와 기계 수가 증가할수록 계산 복잡도가 기하급수적으로 늘어나는 OSSP의 한계를 극복하며, 기존의 정밀 해법이나 휴리스틱 방식의 단점을 보완합니다.
해당 연구는 인코더-디코더(encoder-decoder) 아키텍처와 멀티 헤드 어텐션(multi-head attention)을 활용한 트랜스포머 기반 스케줄링 정책을 개발했습니다. 이 모델은 작업 처리 시간 행렬(processing-time matrix)만을 입력으로 사용하며, Taillard 벤치마크 인스턴스(4x4, 5x5, 7x7, 10x10)로 학습되었습니다. 학습된 모델은 최적 해(makespan) 대비 15~30% 범위 내의 실행 가능한 스케줄을 생성했으며, 특히 40x40에서 100x100에 이르는 대규모 무작위 생성 인스턴스에 재훈련 없이 적용했을 때도 기존의 고전적인 디스패칭 휴리스틱(SPT, LPT, MWKR, EST)과 비교하여 경쟁력 있는 성능을 보였습니다. 평균적으로 표준 하한 대비 12.89~15.12%의 오차율을 기록하며, EST와는 비슷한 수준을 유지하고 SPT, LPT보다는 훨씬 뛰어난 결과를 나타냈습니다.
이 연구는 트랜스포머 모델이 작은 규모의 OSSP 인스턴스 학습만으로도 훨씬 큰 문제에 일반화(generalize)될 수 있음을 보여줍니다. 이는 복잡한 산업 환경에서 생산 계획을 최적화하고 효율성을 높이는 데 AI 기술이 실질적인 대안이 될 수 있음을 시사합니다. 특히, 적은 특징(feature) 정보만으로도 학습 기반의 스케줄링 솔루션을 제공함으로써, 기존의 복잡한 규칙 기반 시스템을 대체하거나 보완할 수 있는 잠재력을 가지고 있습니다.