네이버클라우드, 옴니모달 하이퍼클로바X 공개…“시각적 이해 탁월”

입력 2025-12-29 11:32

황수민 기자

기자 이름을 클릭하면
더 자세한 정보를
확인할 수 있어요!

북마크 되었습니다.
마이페이지에서 확인하세요.

가장작게
작게
기본
크게
가장크게

옴니모델·추론모델 오픈소스 공개해
일상·산업서 AI 에이전트 구현 시도
‘수능’ 과목 만점 받는 도구활용 역량

▲네이버클라우드는 고성능 추론모델은 글로벌 인공지능(AI) 평가 기관 아티피셜 어낼리시스(Artificial Analysis)가 종합 지식과 고난도 추론, 코딩, 에이전트형 과제 등 10개 주요 벤치마크를 종합해 산출한 지수 기준에서 글로벌 주요 AI 모델들과 유사한 성능 범위에 해당하는 것으로 나타났다고 29일 밝혔다. (사진 제공=네이버클라우드)

네이버클라우드가 과학기술정보통신부가 주최한 ‘독자 AI 파운데이션 모델’ 프로젝트의 주관 사업자로서 추진 중인 ‘옴니(Omni) 파운데이션 모델’ 개발 과제의 첫 번째 성과를 공개했다.

네이버클라우드는 국내에서 최초로 네이티브 옴니모달 구조를 적용한 파운데이션 모델 ‘네이티브 옴니모델(HyperCLOVA X SEED 8B Omni)’과 기존 추론형 인공지능(AI)에 시각·음성·도구 활용 역량을 더한 ‘고성능 추론모델(HyperCLOVA X SEED 32B Think)’을 각각 오픈소스로 공개하며 일상과 산업 현장에서 누구나 활용할 수 있는 AI 에이전트 구현을 본격화한다고 29일 밝혔다.

‘미래 기술’ 옴니모델 토대 구축…데이터 차별화 등 일상·산업서 AI 전환 시도

네이버클라우드가 공개한 옴니모델은 텍스트·이미지·오디오 등 서로 다른 형태의 데이터를 단일 모델에서 처음부터 함께 학습하는 네이티브 옴니모달 구조를 전면 적용한 모델이다.

옴니모달 AI는 정보의 형태가 달라지더라도 하나의 의미 공간에서 맥락을 통합적으로 이해할 수 있어 말·글·시각·음성 정보가 복합적으로 오가는 현실 환경에서 활용도가 높은 차세대 AI 기술로 주목받고 있다. 이러한 특성으로 인해 글로벌 빅테크 기업들이 옴니모달을 차세대 파운데이션 모델의 핵심 기술 축으로 삼고 있다.

성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 “모델을 대규모로 키워도 데이터 다양성이 한정되어 있다면 AI의 문제 해결 능력도 특정 영역 또는 특정 과목에만 집중되어 나타날 수밖에 없다”며 “이에 디지털화되지 않은 생활 맥락 데이터나 지역의 지리적 특성이 반영된 공간 데이터 등 차별화된 현실 세계 데이터를 확보하고 정제하는 과정이 선행돼야 한다”고 설명했다.

네이버클라우드는 향후 차별화된 데이터를 본격적으로 학습시키며 단계적인 스케일업에 나설 계획이다. 텍스트·이미지·음성 모델을 결합하는 방식의 기존 멀티모달 접근과 달리 단일 모델 구조의 옴니모달 AI이 규모 확장 측면에서 상대적으로 용이한 특징을 활용하면서다. 네이버클라우드 관계자는 “이러한 특징을 기반으로 산업과 일상 밀착 서비스에 필요한 다양한 크기의 특화 옴니모달 모델을 효율적으로 확장한다는 전략”이라고 말했다.

“추론형 AI에 시각·음성·도구 역량 결합해 옴니모달 에이전트 구현”

네이버클라우드는 향후 옴니모달 AI 에이전트 활용 가능성을 검증하기 위해 추론모델도 공개했다. 이 모델은 자체 추론형 AI에 시각 이해, 음성 대화, 도구 활용 능력을 결합해 복합적인 입력과 요청을 이해하고 문제를 해결하는 옴니모달 에이전트 경험을 구현했다.

추론모델은 글로벌 AI 평가 기관 아티피셜 어낼리시스(Artificial Analysis)가 종합 지식과 고난도 추론, 코딩, 에이전트형 과제 등 10개 주요 벤치마크를 종합해 산출한 지수 기준에서도 글로벌 주요 AI 모델들과 유사한 성능 범위에 해당하는 것으로 나타났다.

영역별 평가에서는 실사용과 밀접한 항목에서 경쟁력을 보였다. 구체적으로 한국어 기반 종합 지식, 시각 이해, 실제로 도구를 활용해 문제를 해결하는 에이전트 수행 능력 등 주요 능력 항목에서 글로벌 모델들과 비교해 우수한 성능을 기록하며 복합적인 문제 해결 역량을 보였다.

실제 네이버클라우드에 따르면 추론모델로 대학수학능력시험 문제를 풀이한 결과 국어·수학·영어·한국사 등 주요 과목에서 모두 1등급에 해당하는 성과를 거뒀다. 특히 영어와 한국사에서는 만점을 기록했다.

성 총괄은 “텍스트·시각·음성 등 AI의 감각을 수평적으로 확장하는 동시에 사고·추론 능력을 함께 강화했을 때 현실 문제 해결력이 크게 높아진다는 점을 확인했다”며 “이러한 기본기를 갖춘 구조 위에서 점진적으로 규모를 확장해야 단순히 크기만 큰 모델이 아니라 실제로 쓰임새 있는 AI로 발전할 수 있다고 보고 이를 토대로 스케일업을 이어갈 계획”이라고 말했다.