“메타ㆍ알리바바 제치고 세계 1위”…업스테이지, 사전학습 LLM ‘솔라’ 공개

입력 2023-12-14 10:49
  • 가장작게

  • 작게

  • 기본

  • 크게

  • 가장크게

▲업스테이지는 세계 최대 머신러닝 플랫폼 허깅페이스에서 운영하는 ‘오픈 LLM 리더보드’에서 세계 1위를 차지한 사전학습 LLM 솔라를 공개했다고 14일 밝혔다. (사진제공=업스테이지)
▲업스테이지는 세계 최대 머신러닝 플랫폼 허깅페이스에서 운영하는 ‘오픈 LLM 리더보드’에서 세계 1위를 차지한 사전학습 LLM 솔라를 공개했다고 14일 밝혔다. (사진제공=업스테이지)

국내 대표 인공지능(AI) 스타트업 업스테이지가 자체 개발한 사전학습 거대언어모델(LLM, Large Language Model) 솔라(Solar)를 공개하며 글로벌 LLM 대전에 본격 참전한다.

업스테이지는 세계 최대 머신러닝 플랫폼 허깅페이스에서 운영하는 ‘오픈 LLM 리더보드’에서 세계 1위를 차지한 사전학습 LLM 솔라를 공개했다고 14일 밝혔다. 솔라는 리더보드 평가에서 74.2점을 기록하며 전체 1위를 차지했다. 이번 결과는 소형 LLM(SLM)의 기준이라고 할 수 있는 300억 매개변수(30B) 이하 사이즈로 글로벌 최고 성능 모델에 올라 더욱 의미가 깊다.

허깅페이스 오픈 LLM 리더보드는 오픈소스 생성 AI 모델의 바로미터로 꼽힌다. 전 세계 500여 개의 오픈 모델들이 추론과 상식 능력, 언어 이해 종합능력 및 환각현상(할루시네이션) 방지, 대명사 참조 및 수학 해결 능력 등 6가지 지표의 평균 점수로 경쟁, 공신력 있는 순위가 매겨진다.

업스테이지의 솔라는 기업들이 활용하기 좋은 프라이빗 LLM을 위해 작은 크기로 구성됐다. 세계 최초의 107억 매개변수(10.7B)인 사전학습 모델이다. 업스테이지는 고도의 지능과 컴팩트함이라는 완벽한 균형을 찾은 모델이라고 자평했다.

업스테이지는 다양한 연구를 통해 작은 사이즈의 솔라 모델 성능을 최적화했다. 성능이 좋지만 큰 13B 모델, 충분히 작지만 지적 제약이 있는 7B 모델 사이의 장점을 모두 잡는 최적의 모델 크기를 찾기 위해 오픈소스의 7B 모델들을 기반으로 자체적인Depth Up-Scaling 방식을 적용했다. 또 레이어를 추가하며 깊이를 더해 소형 모델의 성능을 극대화했다. 그 결과 업스테이지는 3조 개가 넘는 토큰의 우수한 데이터를 통해 확장된 10.7B를 완성, 크기와 성능의 최적의 조합으로 모델을 구축했다.

솔라는 사전 학습 및 파인튜닝 단계에서는 리더보드 벤치마킹 데이터 셋을 사용하지 않고, 자체적으로 구축한 데이터를 적용했다. 이는 리더보드 점수를 높이기 위해 벤치마크 셋을 직접 적용하는 모델들의 사례와 달리 솔라는 다양한 태스크의 실제 업무 활용 등 일반적인 경우 높은 사용성을 보여줄 수 있음을 반증한다.

특히 최근 20억 달러의 기업 가치로 유니콘에 오른 미스트랄AI의 최신 모델 믹스트랄(Mixtral 8x7B) 모델의 성능지표마저 뛰어넘었다. 믹스트랄은 작은 전문 모델 여러 개를 묶는 방식으로 소형 모델임에도 메타 ‘라마’와 GPT-3.5를 능가해 최근 가장 뜨거운 관심을 받고 있다. 믹스트랄은 70억 파라미터의 전문 모델 8개를 묶어 사전학습 모델 중 최고의 성능을 보인 바 있지만, 업스테이지의 솔라는 고도의 모델링 노하우와 최적화 기술력으로 믹스트랄 모델보다 더 가벼운 크기에도 벤치마크평가에서 더 나은 성능을 보였다.

업스테이지는 실사용성 높은 파인튜닝 모델과 자체 추가 학습이 가능한 사전학습 모델까지 공개했다. 특히 모델의 성능을 자체적으로 끌어올리는 데 사용할 수 있는 사전학습 모델 역시 파인튜닝 모델과 함께 공개된 업스테이지의 솔라 모델이 허깅페이스 리더보드 평가 기준 66.04점으로 소형 모델의 대표 주자인 알리바바의 큐원(Qwen), 메타의 라마2(Llama 2), 미스트랄AI의 미스트랄(Mistral) 사전학습 모델들을 모두 제치고 1위에 올랐다.

기업들은 업스테이지의 솔라 모델을 기반으로 자신들의 데이터와 목적에 맞게 추가 학습하고 다양한 생성 AI 서비스를 구축, 운영할 수 있게 됐다.

업스테이지는 AWS, Poe, Together.ai 등 글로벌 플랫폼과 협력을 통해 최고 기술력을 바탕으로 글로벌 생성 AI 시장에 본격적으로 진출할 계획이다. 글로벌 생성 AI 활용 플랫폼 Poe에 메인 모델로 등록돼 있는 솔라 모델을 업데이트해 대중들이 최고 성능의 업스테이지 LLM을 직접 경험해 볼 수 있도록 할 예정이다. Poe는 쿼라가 운영하는 플랫폼으로, 다양한 AI 모델과 대화하고 원하는 프롬프트를 입력해 나만의 챗봇을 만들 수 있다.

업스테이지 김성훈 대표는 “KT의 전략투자를 통한 지원이 큰 도움이 되었고, 앞으로 지속적으로 더 큰 격차를 벌릴 수 있는 최고 성능의 솔라 모델을 활용, B2B 시장에서의 협력도 추진할 것”이라고 말했다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0

주요 뉴스

  • 단독 그 많던 카드 모집인 어디로…첫 5000명 선 붕괴
  • '주가 급락' NCT·김희철 원정 성매매·마약 루머…SM 입장 발표
  • 윤민수, 전 부인과 함께 윤후 졸업식 참석…사진 보니
  • 항상 화가 나 있는 야구 팬들, 행복한 거 맞나요? [요즘, 이거]
  • 비트코인, 美 고용 지표 둔화 속 7만1000달러 일시 터치…5월 비농업 지표 주목 [Bit코인]
  • 트럼프 틱톡, 개설 사흘 만에 팔로워 500만…35만 바이든 캠프 압도
  • 지난해 '폭염' 부른 엘니뇨 사라진다…그런데 온난화는 계속된다고? [이슈크래커]
  • 김호중 후폭풍 일파만파…홍지윤→손호준, 소속사와 줄줄이 계약 해지
  • 오늘의 상승종목

  • 06.05 13:28 실시간

실시간 암호화폐 시세

  • 종목
  • 현재가(원)
  • 변동률
    • 비트코인
    • 98,102,000
    • +1.9%
    • 이더리움
    • 5,266,000
    • +0.34%
    • 비트코인 캐시
    • 664,500
    • +3.1%
    • 리플
    • 727
    • +0.28%
    • 솔라나
    • 238,200
    • +2.63%
    • 에이다
    • 639
    • +0%
    • 이오스
    • 1,117
    • +0.72%
    • 트론
    • 158
    • +0%
    • 스텔라루멘
    • 147
    • +0%
    • 비트코인에스브이
    • 87,400
    • +2.58%
    • 체인링크
    • 24,650
    • +0.65%
    • 샌드박스
    • 639
    • +1.11%
* 24시간 변동률 기준