지역·공간 특성 등 반영
한국어 특화…실사용서 경쟁력
'하이퍼클로바X' 오픈소스로 확산
|
29일 네이버클라우드에 따르면 이번에 공개된 모델은 'HyperCLOVA X SEED 8B Omni'와 'HyperCLOVA X SEED 32B Think'다. 'SEED 8B Omni'는 텍스트·이미지·오디오를 단일 모델에서 처음부터 함께 학습하는 네이티브 옴니모달 구조를 전면 적용한 파운데이션 모델이다. 서로 다른 입력 형태를 하나의 의미 공간에서 통합적으로 이해할 수 있어, 말·글·시각·음성 정보가 복합적으로 오가는 현실 환경에 적합한 차세대 AI로 평가된다.
네이버클라우드는 옴니모달 AI의 잠재력을 극대화하기 위해 기존 인터넷 문서나 이미지 중심의 학습을 넘어 현실 세계의 다양한 맥락을 담은 데이터 확보에 집중한다는 전략이다. 성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 "모델을 대규모로 키워도 데이터 다양성이 한정되어 있다면 AI의 문제 해결 능력도 특정 영역 또는 특정 과목에만 집중되어 나타날 수밖에 없다"며 "이에 디지털화되지 않은 생활 맥락 데이터나 지역의 지리적 특성이 반영된 공간 데이터 등 차별화된 현실 세계 데이터를 확보하고 정제하는 과정이 선행돼야 한다"고 설명했다.
'SEED 8B Omni'는 텍스트 지시를 기반으로 이미지 생성과 편집을 수행하는 옴니모달 생성 기능도 갖췄다. 텍스트와 이미지의 맥락을 함께 이해해 의미를 반영한 결과물을 단일 모델에서 자연스럽게 생성·편집하는 방식으로, 글로벌 프런티어 AI 모델 수준의 멀티모달 생성 역량을 확보했다는 평가다.
|
특히 한국어 기반 종합 지식, 시각 이해, 도구 활용형 에이전트 수행 능력 등 실사용과 밀접한 영역에서 경쟁력을 보였다는 설명이다. 실제로 2024학년도 대학수학능력시험 문제를 이미지 입력 방식으로 풀이한 결과, 국어·수학·영어·한국사 전 과목에서 1등급 수준의 성과를 기록했고 영어와 한국사에서는 만점을 받았다.
네이버클라우드는 이번 공개를 통해 네이티브 옴니모달 AI 개발 방법론을 검증한 만큼, 향후 차별화된 데이터 학습과 단계적 스케일업을 통해 다양한 크기의 특화 옴니모달 모델을 확장할 계획이다. 단일 모델 구조의 옴니모달 AI는 기존 멀티모달 결합 방식보다 확장성이 높다는 판단이다.
성 총괄은 "텍스트·시각·음성 등 AI의 감각을 수평적으로 확장하는 동시에 사고와 추론 능력을 함께 강화했을 때 현실 문제 해결력이 크게 높아진다는 점을 확인했다"며 "이러한 기본기를 갖춘 구조 위에서 점진적으로 규모를 확장해야 단순히 크기만 큰 모델이 아닌, 실제로 쓰임새 있는 AI로 발전할 수 있다고 보고 이를 토대로 스케일업을 이어갈 계획"이라고 밝혔다.
네이버클라우드는 이번 옴니모달 하이퍼클로바X를 기반으로 검색·커머스·콘텐츠·공공·산업 현장 등 다양한 영역에서 활용 가능한 AI 에이전트를 단계적으로 확장하며, '모두의 AI' 실현을 위한 기술 생태계 구축에 속도를 낼 계획이다.








![[이미지1] 텍스트와 이미지의 맥락을 함께 이해해 결과물을 만들어내는 HyperCLOVA X SEED 8B Omni 모델](https://img.asiatoday.co.kr/file/2025y/12m/29d/2025122901002490700145961.jpg)
![[이미지2] ‘HyperCLOVA X SEED 32B Think’의 영역별 벤치마크 점수](https://img.asiatoday.co.kr/file/2025y/12m/29d/2025122901002490700145962.jpg)






