자체 모델 개발 역량 및 서비스 운영 경험 바탕 ‘독자 AI 파운데이션 모델 프로젝트’에 참여

정부 ‘AI 파운데이션 모델 프로젝트’에 도전장을 낸 카카오가 자체 개발한 고성능 언어모델을 오픈소스로 공개하며 국내 AI 기술 자립과 생태계 경쟁력 강화에 속도를 내고 있다.
카카오는 24일 허깅페이스를 통해 이미지 정보 이해 및 지시 이행 능력을 갖춘 경량 멀티모달 언어모델‘카나나-1.5-v-3b’와 MoE(전문가 혼합) 언어모델 ‘카나나-1.5-15.7b-a3b’를 오픈소스로 공개했다. 5월 공개한 카나나 1.5 시리즈에 이어 약 두 달 만의 추가 공개로 카카오는 독자적 AI 모델 개발 기술력을 재차 입증했다.
이번에 공개된 ‘카나나-1.5-v-3b’는 이미지와 텍스트 정보를 동시에 이해하는 멀티모달 모델로 국내외 유사 사이즈 모델 대비 한국어와 영어에서 높은 성능을 기록했다. 특히 지시 이행(instruction following) 성능에서는 국내 동급 모델 대비 최대 128% 수준을 기록했으며, 글로벌 모델 GPT-4o에 견줄 만한 이미지 인식 정확도도 확보했다.
카카오는 해당 모델에 인간 선호 학습(Human Preference Alignment)과 지식 증류(고성능의 대형 모델로부터 비교적 작은 모델을 학습하는 방식) 기법을 적용해 성능을 극대화했다. 이를 통해 상대적으로 경량 구조임에도 다양한 분야에서 실질적인 활용이 가능한 수준의 정교한 언어이해 능력을 갖췄다.
카카오는 모델의 성능에 집중하는 단계를 넘어 AI가 사람처럼 생각하고 행동할 수 있는 멀티모달 이해 능력, 사용자 지시 수행 능력, 추론능력을 갖추도록 발전시키는 데 주력하고 있다. 하반기 중에는 에이전트형 AI 구현에 필수적인 추론 모델의 성과도 공개할 예정이다.
함께 공개한 MoE 모델인 ‘Kanana-1.5-15.7b-a3b’는 특정 작업에 최적화된 일부 전문가 모델만 활성화되는 방식으로 효율적인 컴퓨팅 자원 활용과 비용 절감이 강점이다. 이러한 장점 덕에 글로벌 시장에서는 AI 모델 개발 트렌드로 자리잡고 있다
카카오의 MoE 모델은 고성능 AI 인프라를 저비용으로 구축하고자 하는 기업이나 연구 개발자들에게 실용적인 도움을 제공할 수 있다.특히 추론 과정에서 제한된 파라미터만 사용하는 구조적 특성 덕분에 저비용, 고효율 서비스 구현에 유리해 활용도가 높다.
카카오는 이번 경량 멀티모달 언어모델과 MoE 모델의 오픈소스 공개를 통해 AI 모델 생태계에 새로운 기준을 제시하고 더 많은 연구자와 개발자가 효율적이고 강력한 AI 기술을 자유롭게 활용할 수 있는 기반을 마련해 갈 계획이다. 이와 더불어 자체 기술 기반의 모델을 지속적으로 고도화하고 모델 스케일업을 통해 글로벌 플래그십 수준의 초거대 모델 개발에 도전함으로써 국내 AI 생태계의 자립성과 기술 경쟁력 강화에 기여할 계획이다.
김병학 카카오 카나나 성과리더는 “이번 오픈소스 공개는 비용 효율성과 성능이라는 유의미한 기술 개발의 성과를 거둔 것으로 단순한 모델 아키텍처의 진보를 넘어 서비스 적용과 기술 자립이라는 두 가지 측면의 목표에 부합하는 결과물”이라고 강조했다.



