OpenAI가 차세대 대규모 언어모델(LLM)인 GPT-5.6 시리즈를 일부 신뢰 파트너와 조직에 제한적으로 공개하며 인공지능(AI) 기술의 새로운 지평을 열었습니다. 이번 시리즈는 플래그십 모델인 Sol을 필두로, 일상 업무에 최적화된 Terra, 그리고 빠르고 저렴한 Luna 세 가지 모델로 구성되어 다양한 사용자 요구에 대응합니다. 특히 Sol은 코딩, 생물학, 사이버보안 등 전문 분야에서 에이전트(agent) 능력을 크게 강화하여 복잡한 작업을 효율적으로 수행할 수 있게 됐습니다.
GPT-5.6 Sol은 OpenAI가 개발한 모델 중 가장 강력한 성능을 자랑하며, 'max reasoning effort'와 'ultra 모드'를 통해 더욱 깊이 있는 추론과 서브 에이전트(sub-agent) 활용을 지원합니다. 이는 복잡한 명령줄 작업(Terminal-Bench 2.1)과 유전체학 분석(GeneBench v1)에서 최고 수준의 성능을 기록하며 입증되었습니다. 사이버보안 분야에서는 ExploitBench와 ExploitGym 벤치마크에서 기존 모델 대비 향상된 능력을 보였지만, Chromium 및 Firefox 평가에서는 완전한 기능적 익스플로잇(full-chain exploit)을 자율적으로 생성하지 못해 'Cyber Critical' 임계값은 넘지 못했습니다. OpenAI는 모델 능력에 맞춰 계층형 안전장치(layered safety stack)를 적용하고 있으며, 100만 토큰(token)당 Sol은 입력 5달러/출력 30달러, Terra는 입력 2.50달러/출력 15달러, Luna는 입력 1달러/출력 6달러의 가격 정책을 발표했습니다.
이번 GPT-5.6 시리즈 출시는 AI 모델의 에이전트 능력이 실제 업무 환경에서 더욱 중요해지고 있음을 시사합니다. 특히 코딩, 생물학, 사이버보안과 같은 전문 영역에서 AI가 복잡한 문제를 해결하고 생산성을 높이는 핵심 도구로 자리매김할 가능성을 보여줍니다. OpenAI는 미국 정부와의 협의를 거쳐 제한적 프리뷰를 진행하고 있으며, 몇 주 안에 더 넓은 공개를 계획하고 있습니다. 이는 AI 기술이 사회에 미칠 영향력을 고려하여 안전성과 책임 있는 배포에 대한 중요성이 커지고 있음을 반영하며, 앞으로 AI 모델 개발과 활용에 있어 정부 및 이해관계자들과의 협력이 더욱 중요해질 것임을 보여줍니다.