AI 마임(AI Mime)은 사용자가 반복적인 컴퓨터 작업을 직접 화면에 녹화하는 것만으로 해당 작업을 자동화하는 혁신적인 솔루션을 선보였습니다. 기존의 복잡한 프롬프트(prompt) 작성이나 수동 설정 없이, AI 에이전트가 사용자의 행동을 관찰하고 학습하여 빠르고 안정적인 자동화 스크립트를 생성합니다. 이는 마치 AI에게 '한 번 보여주면 영원히 실행한다'는 철학을 구현한 것으로, 특히 맥OS(macOS) 사용자를 위한 데스크톱 앱 형태로 제공됩니다.
AI 마임의 핵심은 세 단계로 이루어집니다. 첫째, 사용자가 한 번 작업을 수행하면 클릭, 타이핑, 화면 캡처 등 모든 행동이 기록됩니다. 둘째, AI 에이전트가 이 기록을 분석하여 재사용 가능한 '의미론적 워크플로우(semantic workflow)'를 구축하고, 이를 실행 가능한 코드로 컴파일합니다. 이때 반복적인 부분은 일반 코드로, 의사 결정이 필요한 지점에서는 대규모 언어모델(LLM)을 활용하며, 다른 방법으로 자동화하기 어려운 부분에만 컴퓨터 비전(computer vision)을 적용해 효율성을 높입니다. 셋째, 이렇게 만들어진 '스킬(skill)'은 새로운 입력값과 함께 실행될 수 있으며, 만약 작업 환경이 바뀌어 오류가 발생해도 AI 에이전트가 스스로 스크립트를 수정하여 작업을 완료하는 '자기 치유(self-healing)' 기능을 제공합니다. 현재는 맥OS 13 이상에서 파이썬(Python) 3.12 버전과 앤트로픽(Anthropic) 클로드 코드(Claude Code) 또는 오픈AI(OpenAI) 코덱스(Codex) 같은 에이전트 런타임을 요구합니다.
이 기술은 특히 API가 없거나 약한 시스템에서 데이터를 입력하거나 보고서를 추출하는 등, 사람이 직접 반복적으로 수행해야 했던 업무에 큰 변화를 가져올 수 있습니다. 개발자나 일반 사용자 모두 복잡한 자동화 스크립트를 작성할 필요 없이 직관적으로 작업을 자동화할 수 있게 되어 생산성 향상에 기여할 것입니다. 또한, 환경 변화에 유연하게 대응하는 자기 치유 기능은 자동화 솔루션의 유지보수 부담을 크게 줄여준다는 점에서 중요한 의미를 가집니다. 이는 단순히 작업을 반복하는 것을 넘어, AI가 실제 사용자의 의도를 파악하고 적응하는 다음 단계의 자동화를 제시합니다.