AI 에이전트가 웹 브라우저를 직접 제어하며 복잡한 웹 작업을 수행할 수 있도록 돕는 새로운 도구, WebCLI가 공개되었습니다. 이 기술은 에이전트가 웹 페이지를 열고, 상태를 관찰하며, 필요한 작업을 실행하고, 심지어 문제가 발생했을 때 인간의 개입을 요청하는 등 실제 사람처럼 웹을 다룰 수 있게 합니다. 기존 AI 에이전트가 웹 작업에 어려움을 겪었던 한계를 극복하며, 대시보드, 포털, 인증 흐름 등 실제 웹사이트에서 이루어지는 다양한 업무를 자동화할 수 있는 길을 열었습니다.
WebCLI는 브라우저를 유닉스(Unix) 명령어처럼 다루는 방식을 제안합니다. 예를 들어, `web open` 명령어로 특정 URL을 열고, `web observe`로 페이지의 구조화된 상태를 JSON 형태로 받아 필요한 요소를 식별합니다. 이후 `web do` 명령어로 특정 요소(예: 버튼 클릭, 텍스트 입력)에 대한 액션을 취할 수 있습니다. 특히 이 방식은 기존의 스크린샷 기반 접근 방식이나 깨지기 쉬운 셀렉터(selector) 기반 자동화와 달리, 웹 페이지의 실제 상태를 관찰하고 이에 따라 유연하게 대응할 수 있다는 장점이 있습니다. 또한, 작업 중 패스키(passkey) 인증과 같은 인간의 개입이 필요한 상황에서는 `web pause` 명령어를 통해 작업을 일시 중단하고 인간에게 도움을 요청할 수도 있습니다.
이러한 WebCLI의 등장은 AI 에이전트의 활용 범위를 크게 넓힐 것으로 기대됩니다. 클라우드 콘솔(Azure, AWS, GCP)에서 가상 머신(VM)을 생성하고 삭제하거나, DNS 설정을 변경하고 웹사이트를 배포하는 등 복잡하고 반복적인 웹 기반 업무를 스크립트 작성 없이 AI 에이전트가 직접 처리할 수 있게 됩니다. 이는 기업의 운영 효율성을 높이고, 개발자들이 반복적인 수동 작업에서 벗어나 더 중요한 업무에 집중할 수 있도록 도울 것입니다. 또한, 웹 애플리케이션 테스트 및 검증, 데이터 수집 등 다양한 분야에서 새로운 자동화 기회를 창출할 잠재력을 가지고 있습니다.