마이크로소프트(Microsoft)가 최근 발표한 '리콜(Recall)' 기능이 사용자 화면 활동을 기록하고 분석하는 과정에서 개인 정보 침해 논란에 휩싸였습니다. 이러한 우려 속에서, 모든 데이터 처리를 사용자 기기 내에서만 수행하는 100% 로컬 기반의 오픈소스 대안 '스크린마인드(ScreenMind)'가 등장해 주목받고 있습니다. 이 솔루션은 구글의 최신 멀티모달(multimodal) AI 모델인 '젬마 4(Gemma 4)'를 활용하여 시각, 오디오, 추론 기능을 모두 로컬에서 처리하며, 사용자의 모든 화면 기록을 안전하게 관리할 수 있도록 돕습니다.
스크린마인드는 단순히 화면을 녹화하는 것을 넘어, AI 기반의 지능형 메모리 시스템을 구축합니다. 화면 내용 변화를 감지하여 스마트하게 스크린샷을 캡처하고, 젬마 4를 통해 앱 감지, 활동 분류, 화면 레이아웃 분석 등을 수행합니다. 사용자는 이 기록들을 키워드뿐만 아니라 의미 기반으로도 검색할 수 있으며, 대화형 AI 기능을 통해 과거 화면 기록에 대해 질문하고 답변을 얻을 수 있습니다. 예를 들어, “알렉스가 디스코드에서 뭐라고 말했지?”와 같은 질문을 하면 실제 메시지를 찾아 보여주는 식입니다. 또한, 회의 자동 감지 및 녹음, 요약 기능, 개인 정보 자동 비식별화(PII redaction), AES 암호화 등의 강력한 보안 및 편의 기능을 제공합니다.
스크린마인드는 마이크로소프트 리콜이 요구하는 고사양의 코파일럿+ PC(Copilot+ PC)나 특정 NPU(신경망 처리 장치) 없이도 4GB 이상의 VRAM을 가진 모든 GPU 또는 CPU만으로도 구동 가능하며, 윈도우(Windows), macOS, 리눅스(Linux) 등 다양한 운영체제를 지원합니다. 모든 소스 코드가 MIT 라이선스로 공개되어 있어 투명성을 확보하고 있으며, 개발자들은 이를 기반으로 자동화 에이전트를 구축하거나 옵시디언(Obsidian), 노션(Notion), 웹훅(Webhooks) 등 다양한 외부 서비스와 연동할 수 있습니다. 이는 사용자들이 자신의 데이터를 완벽하게 통제하면서도 AI의 강력한 생산성 향상 기능을 활용할 수 있는 새로운 가능성을 제시합니다.