새로운 macOS 메뉴바 앱 '미믹스크라이브(MimicScribe)'가 온디바이스(on-device) 화자 식별(speaker identification) 기능을 앞세워 AI 회의록 시장에 도전장을 내밀었습니다. 이 앱은 약 97%에 달하는 높은 정확도로 회의 참가자를 구분하며, 실시간으로 회의 요점을 정리해주고, 키보드 및 음성 기반의 직관적인 인터페이스를 제공하는 것이 특징입니다. 특히, 모든 오디오 처리가 사용자 맥(Mac) 기기 내에서 이뤄져 민감한 회의 내용의 보안성을 강화했다는 점에서 기존 클라우드 기반 서비스들과 차별점을 보입니다.
미믹스크라이브는 Pyannote의 커뮤니티-1 모델을 기반으로 화자 식별 정확도를 높였으며, Parakeet ST의 문법 구조 단서를 활용해 성능을 개선했습니다. 사용자는 'Control + Space' 단축키 하나로 녹음을 시작하고 종료하며, 회의 중에도 실시간으로 주요 질문이나 준비된 자료의 핵심 내용을 확인할 수 있습니다. 예를 들어, 영업 담당자가 고객과의 디스커버리 콜(discovery call)에서 '이상적인 보고서 설정'이나 '수동 작업 감소'의 구체적인 의미를 놓치지 않도록 돕는 식입니다. 또한, CRM 데이터나 PDF 문서 등 다양한 형식의 준비 자료를 앱에 추가하면, 대화 흐름에 맞춰 관련 정보가 자동으로 제시되어 회의 효율을 극대화합니다.
이러한 온디바이스 처리 방식은 회의 오디오가 외부 서버로 전송되지 않으므로 데이터 유출 우려를 줄여줍니다. 대부분의 AI 회의록 서비스가 회의에 봇(bot)으로 참여하여 오디오를 클라우드로 전송하는 것과 달리, 미믹스크라이브는 OS 수준에서 오디오를 캡처하여 회의 참가자 목록에 추가되지 않고도 작동합니다. 한 번 저장된 화자 프로필은 이후 회의에서도 자동으로 인식되며, 애플 실리콘(Apple Silicon) 기반 맥에서는 60분 분량의 회의를 약 1분 만에 처리할 수 있을 정도로 빠른 성능을 자랑합니다. 이는 기업의 민감한 정보 보호와 개인 정보 보호(GDPR, CCPA 준수)에 대한 우려를 해소하며, AI 회의록 솔루션의 새로운 표준을 제시할 가능성이 있습니다.
