AAII(Artificial Analysis Intelligence Index)’에 등재된 믿:음 K [자료=KT] KT는 자체 개발한 초거대 AI 모델 ‘믿:음 K’가 글로벌 AI 모델 성능 종합 평가 플랫폼 ‘AAII(Artificial Analysis Intelligence Index)’에서 국내 중소형 모델 가운데 1위를 기록했다고 밝혔다. 특히 에이전틱 AI 분야에서 높은 성적을 거두며 한국 AI 기술 경쟁력을 입증했다.
AAII는 AI 평가 전문 기관인 Artificial Analysis가 운영하는 글로벌 플랫폼으로, 단일 시험이 아닌 다수의 공개 벤치마크 결과를 종합해 AI 모델 성능을 평가한다. LG 엑사원, 네이버 하이퍼클로바, 업스테이지 솔라, 모티프 등 국내 주요 AI 모델도 함께 등재돼 있다.
이번 평가에서 ‘믿:음 K’는 추론, 전문 지식, 수학·프로그래밍, 에이전트 수행 능력 등 10여 개 핵심 항목에서 전반적으로 우수한 점수를 기록했다. 사용자의 질문에 답하는 수준을 넘어 목표를 이해하고 필요한 도구와 시스템을 활용해 과업을 완수하는 에이전틱 AI로서의 경쟁력을 공식적으로 인정받았다는 평가다.
특히 에이전트 성능 특화 지표인 ‘τ²-bench’에서는 87%를 기록하며 최상위권 모델로 이름을 올렸다. τ²-bench는 실제 업무 환경에서 AI가 사람과 협업하며 여러 도구를 활용해 과업을 끝까지 수행할 수 있는지를 평가하는 벤치마크로, ‘믿:음 K’는 구글의 최신 모델과도 유사한 수준의 성능을 보였다.
또 ‘믿:음 K’는 MMLU Pro, GPQA, HLE 등 전문 지식과 고난도 추론 능력을 평가하는 주요 벤치마크에서도 고른 성과를 냈다. 특히 한국어 이해 성능에서는 국내 최고 수준을 기록했다. 매개변수 40B 이하급 모델임에도 효율성과 범용 지능을 동시에 확보한 점이 특징이다.
KT는 모델 아키텍처 설계부터 학습 데이터 구축까지 전 과정을 자체 수행하는 프롬 스크래치 방식으로 ‘믿:음 K’를 개발했다. 이를 통해 한국 기업 환경과 언어·문맥에 최적화된 모델을 구현했으며, 보고서 작성과 문서 요약, 데이터 분석, 고객 응대 등 기업 실무에 즉시 활용할 수 있도록 설계했다.
KT는 이번 성과를 계기로 ‘믿:음 K’를 국내 B2B 시장에 최적화된 에이전틱 AI 모델로 본격 확산할 계획이다. 금융·공공·제조 등 산업별 맞춤형 AI 에이전트를 통해 기업의 업무 자동화와 AI 전환을 지원한다는 전략이다.
오승필 KT 기술혁신부문장 부사장은 “AAII 등재는 KT의 자체 AI 기술력이 글로벌 기준에 도달했음을 객관적으로 입증한 결과”라며 “에이전틱 AI를 통해 한국 기업의 업무 혁신과 디지털 전환을 이끄는 핵심 파트너가 되겠다”고 말했다.
아주경제=최연재 기자 ch0221@ajunews.com