대규모 언어모델(LLM)은 다양한 분야에서 놀라운 성능을 보이지만, 복잡한 장기 계획(long-horizon planning)을 세울 때는 여전히 신뢰성과 견고성(robustness and reliability) 문제에 직면합니다. 특히 여러 단계로 이루어진 의사결정 과정에서 비현실적이거나 잘못된 해결책을 제시하는 경우가 많아, 실제 시스템에 적용하기 어렵다는 한계가 있었습니다.
이러한 문제를 해결하기 위해, 최근 연구에서는 '심볼릭 피드백 기반 반복적 자가 개선(Symbolic Feedback-Driven Iterative Self-Refinement)' 프레임워크를 제안했습니다. 이 방식은 크게 세 가지 핵심 구성 요소를 포함합니다. 첫째, 자연어 프롬프트 메커니즘을 도입하여 논리 기호(logical symbols)를 자연어 설명으로 변환함으로써 LLM이 작업 제약 조건과 의미를 더 잘 이해하도록 돕습니다. 둘째, 심볼릭 검증기(symbolic verifier)를 설계하여 LLM이 생성한 계획의 오류를 식별하고, 이를 LLM이 이해할 수 있는 교정 지침으로 변환하여 스스로 계획을 수정하도록 유도합니다. 셋째, 계획 인식기(plan recognizer)를 활용해 목표 달성 가능성(goal reachability)을 추론하고, 이를 통해 LLM이 원하는 목표를 향해 더 효과적으로 계획을 수정하도록 안내합니다.
이 프레임워크는 LLM이 단순히 텍스트를 생성하는 것을 넘어, 논리적 추론과 문제 해결 능력을 강화하는 데 중요한 의미를 가집니다. 특히 복잡한 작업 환경에서 LLM 기반 시스템의 신뢰성을 높여, 자율 에이전트, 로봇 공학, 복잡한 비즈니스 프로세스 자동화 등 다양한 분야에서 더욱 신뢰할 수 있는 인공지능(AI) 시스템을 구축할 잠재력을 보여줍니다. 연구 결과는 이 프레임워크가 장기 계획 작업에서 계획의 실현 가능성(feasibility)과 정확성(correctness)을 일관되게 개선함을 입증했습니다.
