HW~SW 풀스택 엔지니어링 보유
13B LLMㆍ비디오 생성모델 공개

세계 최대 인공지능(AI) 플랫폼 허깅페이스(Hugging Face)에서 1위에 오른 뒤 탄생한 국내 AI 스타트업이 있다. 바로 모티프테크놀로지스다. 시작부터 기술력을 입증한 이 회사는 언어 모델을 넘어 텍스트 투 이미지(T2I), 텍스트 투 비디오(T2V)와 같은 멀티모달 생성형 AI 모델을 선보여 에이전틱 AI로 영역을 넓힐 계획이다.
임정환 모티프테크놀로지스 대표는 최근 진행한 본지와 인터뷰에서 “외국 커뮤니티에서 밈(meme·온라인 유행 콘텐츠)으로 오픈 AI가 무언가를 발표하면 3개월 이내 그록이, 그 다음 엔스로픽이, 그 다음 딥시크가 이어 발표한다는 말이 올라오고 있다”면서 “3년이 지나기 전에 이 4개 기업이 저희를 포함한 5개 기업으로 늘어나기를 목표로 하고 있다”며 글로벌 탑5 AI 기업 도약에 대한 포부를 드러냈다.
이러한 자신감은 입증된 기술력에서 비롯된다. 임 대표는 모레에서 근무하던 지난해 '모모(MoMo)-70B' 모델 개발을 주도해 허깅페이스에서 1위를 차지했으며, 올해 2월 자회사로 출범한 모티프테크놀로지스의 대표 자리에 올랐다. 이후 모티프가 처음부터 직접 설계, 개발한 소형언어모델(sLLM) '모티프 2.6B'는 글로벌 빅테크가 내놓은 동급 AI 모델의 성능을 뛰어넘었다. 총 26억 개의 파라미터를 갖춘 경량 이 모델은 AMD MI250 그래픽처리장치(GPU) 한 장만으로도 추론이 가능하며 엔비디아 기반 인프라 대비 약 60% 수준의 비용으로 운영할 수 있다는 강점을 가졌다.
회사는 GPU 환경 제약을 벗어난 AI 개발 역량을 차별점으로 꼽는다. 모회사인 모레 시절부터 AMD GPU 기반 시스템을 다뤄왔으며, 이후 엔비디아 환경까지 통합해 다양한 하드웨어에서 AI 모델을 안정적으로 운용할 수 있도록 하며 하드웨어(HW)부터 소프트웨어(SW)까지 풀스택 엔지니어링 역량을 보유했다는 설명이다. 임 대표는 “모레가 가지고 있던 AMD 인프라가 자연스럽게 이어졌고, 엔비디아 GPU는 상대적으로 환경이 더욱 좋다 보니 더 쉽게 다룰 수 있어 여러 하드웨어를 활용할 수 있는 능력을 가지게 됐다”며 “이렇게 다양한 환경의 하드웨어 환경을 직접 다룰 수 있는 팀은 전 세계에서 우리가 유일하지 않을까 생각한다”고 자부했다.
모티프는 이달 기존 모델들의 성능을 뛰어넘는 13B(130억개) 규모의 거대언어모델(LLM)을 출시할 예정이다. 프롬스크래치에 데이터 활용 노하우와 모티프만의 독자적 기술을 더했다. 연말에는 저화질 비디오 생성 모델을 발표할 계획이다. 이는 내년 상반기 완성을 목표로 하는 고화질 비디오 생성 모델과 초거대 멀티모달 모델 개발의 첫 단계다. 임 대표는 “국내에서 이미지 생성 모델을 프롬 스크래치로 다 만든 곳은 우리가 유일하다”며 “이어 비디오 생성 모델 또한 지속적으로 관심을 갖고 만들고 있는 만큼 언어 모델부터 이미지 생성, 비디오 생성 모델까지 다 다룰 수 있도록 하는 게 최종 목표”라고 말했다.



