대규모 언어모델(LLM)을 활용한 소프트웨어 개발이 확산되면서, LLM이 특정 프로그래밍 언어를 처리하는 데 드는 비용 효율성에 대한 관심이 커지고 있습니다. 최근 해커눈(HackerNoon)의 연구 결과에 따르면, LLM이 코드를 이해하고 생성할 때 타입스크립트(TypeScript)가 자바스크립트(JavaScript)보다 평균 31% 더 많은 토큰(token)을 소비하는 것으로 나타났습니다. 이는 개발자들이 LLM 기반의 코드 생성 및 분석 도구를 사용할 때 언어 선택이 직접적인 비용으로 이어질 수 있음을 의미합니다.
이번 연구는 파이썬(Python), 자바스크립트(JavaScript), 타입스크립트(TypeScript), 고(Go), 러스트(Rust) 등 5가지 주요 프로그래밍 언어를 대상으로 진행되었습니다. 동일한 기능을 수행하는 코드를 각 언어로 작성한 뒤, 이를 LLM이 처리하는 데 필요한 토큰 수를 측정하는 방식이었습니다. 결과적으로 타입스크립트는 자바스크립트 대비 31% 더 많은 토큰을 사용했으며, 이는 타입스크립트가 지닌 정적 타입(static type) 정의, 인터페이스(interface), 제네릭(generic) 등 추가적인 구문과 메타데이터(metadata)가 LLM에게 더 많은 정보를 제공해야 하기 때문으로 분석됩니다. 반면, 파이썬은 가장 적은 토큰을 사용하는 효율적인 언어로 확인되었습니다.
이러한 연구 결과는 LLM 기반 개발 환경에서 프로그래밍 언어 선택의 중요성을 부각시킵니다. 특히 코드 생성, 자동 완성, 버그 수정 등 LLM의 도움을 받아 개발하는 경우, 토큰 소비량이 곧 비용으로 직결되기 때문에 개발팀은 언어의 특성과 LLM 처리 비용을 함께 고려해야 합니다. 타입스크립트의 경우 개발 생산성과 코드 안정성이라는 장점이 명확하지만, LLM 활용 시에는 추가적인 비용 부담을 감수해야 할 수 있습니다. 따라서 개발 프로젝트의 특성, 예산, 그리고 LLM 활용 목표에 따라 최적의 언어 전략을 수립하는 것이 중요해질 것입니다.