'2026 수능' 최고 점수 받은 AI 정체는?

입력 2025-11-20 11:17

  • 가장작게

  • 작게

  • 기본

  • 크게

  • 가장크게

(출처=Github 캡처)
(출처=Github 캡처)

구글의 신형 AI 모델 ‘제미나이(Gemini)3’가 최신 언어모델(LLM) 가운데 2026학년도 수능 성능 평가에서 1위를 차지한 것으로 나타났다.

'2026-CSAT' 프로젝트를 올린 한 사용자는 19일 깃허브(GitHub)에 여러 대형 LLM에게 실제 수능 전 과목을 풀게 한 뒤 성적을 비교한 결과를 공개했다.

해당 사용자가 공개한 분석에 따르면, 제미나이3는 국어·수학·영어·한국사·탐구 4과목까지 총 450점 만점 기준 440.2점으로 가장 높은 평균 점수를 기록했다. 이어 GPT-5.1이 435.5점, 클로드 소넷(Claude Sonnet) 4.5가 422점으로 뒤를 이었다.

영역별 편차도 뚜렷하다. 수학에서는 GPT-5.1과 클로드 소넷 4.5만 전 과목 만점을 달성했고, 제미나이3는 선택과목 평균 방식에 따라 98.7점으로 집계됐다.

탐구 영역 중 사회문화에서는 GPT-5.1이 46점(50점 만점)으로 최고점을 기록했으며 제미나이3는 45점으로 한 점 차로 뒤졌다.

반면 시각 자료가 많은 물리1에서는 전체 모델 정답률이 하락했음에도 제미나이3가 40점으로 해당 과목 최고점을 기록했다.

평가 방식은 최대한 모델의 순수한 문제 해결 능력을 검증하는 데 맞춰졌다. PDF 전체를 제공하지 않고 텍스트(OCR 후 수작업 검수본)와 문제에 포함된 이미지(그래프·도표 등)만 별도 캡처해 입력했다.

외부 검색이나 계산기 사용, 시스템 프롬프트 등은 모두 차단됐으며, 모든 문항은 지문+문항 단위로 개별 제시됐다. 수학 영역 단답형 문제는 숫자가 정확히 일치해야만 정답으로 인정됐다.

전체 데이터와 코드, 세부 점수는 깃허브 저장소 '2026-CSAT'에서 누구나 열람할 수 있다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0

주요 뉴스

  • '12일 연속 상승' 코스피, 4904.66 마감⋯현대차 시총 3위 등극
  • TSMC, 대만서 미국으로…"수십 년 안에 시설 상당 부분 해외 이전“
  • 설 자리 잃은 비관론…월가 미국증시 ‘힘’에 베팅 [2026 미국증시 3대 화두 ① 성장]
  • 고부가 선박, 연초 수주 낭보…'테크 퍼스트' 전략 [조선업, 호황의 조건]
  • 두쫀쿠 유행에 쏟아지는 두바이 디저트…파리바게뜨· 투썸도 가세 [그래픽]
  • 단독 지난해 구직자 관심도, 공공기관 두 배↑...자취 감춘 유니콘
  • 당근 없는 트럼프식 관세 거래…한국 경제·기업 더 큰 시련 직면 [2년차 접어드는 트럼프 2.0 ①]
  • “독립성 요구는 커졌는데”…금융권 이사회 덮친 ‘관치 인식의 그림자’ [이사회의 역설上 ①]
  • 오늘의 상승종목

  • 01.19 장종료

실시간 암호화폐 시세

  • 종목
  • 현재가(원)
  • 변동률
    • 비트코인
    • 137,995,000
    • -1.85%
    • 이더리움
    • 4,780,000
    • -2.67%
    • 비트코인 캐시
    • 874,000
    • +0%
    • 리플
    • 2,922
    • -3.75%
    • 솔라나
    • 198,800
    • -5.42%
    • 에이다
    • 543
    • -6.54%
    • 트론
    • 467
    • -0.21%
    • 스텔라루멘
    • 317
    • -5.37%
    • 비트코인에스브이
    • 27,920
    • -2.75%
    • 체인링크
    • 18,890
    • -6.95%
    • 샌드박스
    • 199
    • -9.55%
* 24시간 변동률 기준