산업

마켓

공시

시황

시세

장외/IPO

특징주

투자전략

채권/펀드

환율

국제시황

일반
금융

금융정책

은행

보험

2금융

카드

가상자산/핀테크

일반
부동산

시장동향

업계

정책

분양

일반
산업

재계

전자/통신/IT

자동차

중화학

항공/물류

유통

의료/바이오

중기/벤처

일반
경제

경제정책

경제지표

생활경제

일반
국제

국제경제

국제일반

미국

중국

아시아

유럽/중동
정치

대통령실/총리실

국회/정당

국방/외교

정책

일반
사회

법조

교육

사건/사고

노동/취업

전국

인사/부음

동정

일반
오피니언

논현논단

논현광장

시론

AI 만평

데스크 시각

마감 후

칼럼

노트북 너머

'2026 수능' 최고 점수 받은 AI 정체는?

입력 2025-11-20 11:17

정지윤 인턴 기자

기자 이름을 클릭하면
더 자세한 정보를
확인할 수 있어요!

북마크 되었습니다.
마이페이지에서 확인하세요.

가장작게
작게
기본
크게
가장크게

(출처=Github 캡처)

(출처=Github 캡처)

구글의 신형 AI 모델 ‘제미나이(Gemini)3’가 최신 언어모델(LLM) 가운데 2026학년도 수능 성능 평가에서 1위를 차지한 것으로 나타났다.

'2026-CSAT' 프로젝트를 올린 한 사용자는 19일 깃허브(GitHub)에 여러 대형 LLM에게 실제 수능 전 과목을 풀게 한 뒤 성적을 비교한 결과를 공개했다.

해당 사용자가 공개한 분석에 따르면, 제미나이3는 국어·수학·영어·한국사·탐구 4과목까지 총 450점 만점 기준 440.2점으로 가장 높은 평균 점수를 기록했다. 이어 GPT-5.1이 435.5점, 클로드 소넷(Claude Sonnet) 4.5가 422점으로 뒤를 이었다.

영역별 편차도 뚜렷하다. 수학에서는 GPT-5.1과 클로드 소넷 4.5만 전 과목 만점을 달성했고, 제미나이3는 선택과목 평균 방식에 따라 98.7점으로 집계됐다.

탐구 영역 중 사회문화에서는 GPT-5.1이 46점(50점 만점)으로 최고점을 기록했으며 제미나이3는 45점으로 한 점 차로 뒤졌다.

반면 시각 자료가 많은 물리1에서는 전체 모델 정답률이 하락했음에도 제미나이3가 40점으로 해당 과목 최고점을 기록했다.

평가 방식은 최대한 모델의 순수한 문제 해결 능력을 검증하는 데 맞춰졌다. PDF 전체를 제공하지 않고 텍스트(OCR 후 수작업 검수본)와 문제에 포함된 이미지(그래프·도표 등)만 별도 캡처해 입력했다.

외부 검색이나 계산기 사용, 시스템 프롬프트 등은 모두 차단됐으며, 모든 문항은 지문+문항 단위로 개별 제시됐다. 수학 영역 단답형 문제는 숫자가 정확히 일치해야만 정답으로 인정됐다.

전체 데이터와 코드, 세부 점수는 깃허브 저장소 '2026-CSAT'에서 누구나 열람할 수 있다.

관련 뉴스

#AI #인공지능 #수능 #만점 #제미나이

정지윤 인턴 기자의 주요 뉴스

자세히보기

좋아요0
화나요0
슬퍼요0
추가취재 원해요0

주요 뉴스

싸이, '흠뻑쇼' 광주 공연 불발?⋯광주월드컵경기장 "잔디 훼손 우려"

가수 싸이가 ‘흠뻑쇼’ 광주 공연에 대해 사과했다. 29일 싸이는 자신의 인스타그램을 통해 “광주 팬분들에게”라는 글과 함께 지방 공연 진행 방식에 대해 전했다. 싸이는 “지방 공연은 지역 기획사가 공연장 대관을 확보한 뒤 피네이션에 제안하는 방식”이라며 “광주 지역 기획사로부터 광주월드컵경기장 대관 승인이 완료됐다는 이야기를 듣고
블루오리진 ‘뉴글렌’ 폭발사고 발생, 머스크의 한마디

제프 베이조스가 이끄는 우주기업 블루오리진의 대형 로켓 ‘뉴글렌’이 지상 시험 중 폭발했다. 스페이스X를 따라잡기 위해 상업 발사 시장과 재사용 로켓 경쟁에 속도를 내던 블루오리진에는 적지 않은 타격이다. 경쟁자인 일론 머스크 스페이스X 최고경영자(CEO)는 사고 직후 사회관계망서비스(SNS) X(엑스)에 “Most unfortunate. Rockets are
연봉 14억 아빠 백수로…일본 챗GPT 상담 후폭풍, 한국은?

딸의 첫 상담자는 사람이 아니었습니다. 일본 프로야구 명문 구단 요미우리 자이언츠의 아베 신노스케 감독이 딸에게 폭행을 가한 혐의로 체포됐다가 사임하는 일이 벌어졌는데요. 처음에는 ‘유명 야구인의 가정 내 물의’로 보였죠. 그러나 기자회견장에서 뜻밖의 단어가 등장했는데요. 바로 ‘챗GPT’였습니다. 아베 감독은 25일 딸에 대한 폭행
삼성전자 보통주·우선주 시총 2000조 돌파…‘국민주’ 몸값 새 역사

삼성전자와 삼성전자 우선주를 합친 시가총액이 처음으로 2000조원을 넘어섰다. 이달 1500조원을 돌파한 지 16거래일 만이다. 인공지능(AI) 메모리 슈퍼사이클 기대와 고대역폭메모리(HBM) 경쟁력 재평가가 겹치면서 삼성전자가 국내 증시 시가총액 지형을 다시 쓰고 있다. 29일 한국거래소에 따르면 삼성전자는 전 거래일 대비 5.84% 오른 31만
젠슨 황 다음주 방한…7개월 만에 ‘2차 깐부회동’ 주목

LG·네이버·SK·현대차 총수 만남 젠슨 황 엔비디아 최고경영자(CEO)가 다음 주 한국을 방문할 것으로 알려졌다. 지난해 10월 경주에서 열린 APEC CEO Summit 참석 이후 약 7개월 만의 방한이다. 28일 업계에 따르면 젠슨 황 CEO는 대만 타이베이에서 열리는 엔비디아의 인공지능(AI) 콘퍼런스 GTC 타이베이 2026 참석 이후 한국을 찾을 예정이다.
Vol. 7 초고가 펫 케어: 슈퍼리치들의 반려동물이 사는 세상 [THE RARE]

[ THE RARE ] VOL. 7 초고가 펫 케어:슈퍼리치들의 반려동물이 사는 세상 "천외천(天外天). 하늘 밖의 하늘이 있다." 부자 중에서도 '슈퍼리치'라 불리는 이들이 있습니다. 우리가 흔히 아는 명품관의 오픈런 줄에는 그들이 없습니다. 세상의 0.0001%로 살아가는 그들, '천외천'의 삶은 우리의 상식 밖 궤도에서 움직입니다. 로고가 없는 3000만
단독 대이란 금융제재 명분 흔들렸다…한은, 멜라트 예치 거부 소송서 패소

자금조정예금 예치 거부 책임 인정⋯지연손해금도 지급 대이란 제재 관련 분쟁 속 국내 금융기관 상대 첫 승소 대이란 금융제재를 이유로 이란 멜라트은행 서울지점의 자금조정예금 예치를 거부한 한국은행 조치에 법원이 제동을 걸었다. 미국 주도의 제재에 동참하는 과정에서 이뤄진 거래 제한 조치에도 법적 책임이 따를 수 있다는 판단이어서
회색 넥타이 맨 李대통령, 첫 날 사전투표…"반만 찍혀도 괜찮나"

이재명 대통령은 6·3 지방선거 사전투표 첫날인 29일 청와대 인근에 마련된 투표소에서 한 표를 행사했다. 이 대통령은 이날 낮 12시20분께 서울 종로구 삼청동주민센터 사전투표소를 찾아 김혜경 여사와 함께 투표를 진행했다. 이 대통령은 회색 넥타이를 착용하고 투표소를 찾았다. 특정 정당을 연상시키는 색상을 피하기 위해 중립적인 색상

많이 본 뉴스

최신 영상

"하반기 집값 폭등 없습니다" 역대급 유동성에도 부동산 정말 신중해야 할 이유 I 집땅지성 I 김인만, 이동현 위원

산업 최신 뉴스

뉴스발전소

Vol. 7 초고가 펫 케어: 슈퍼리치들의 반려동물이 사는 세상 [THE RARE]

내가 저장한 뉴스 모아보기

내가 구독한 기자 전체보기

한 컷

'초록색 세이렌 로고를 향한 달라진 시선' [한컷]

마켓 뉴스

오늘의 상승종목
05.29 장종료

1.서울식품우

2,320
2.LG전자

67,500
3.LG씨엔에스

26,200
4.삼성전기우

176,000
5.LG이노텍

324,000

실시간 암호화폐 시세

종목
현재가(원)
변동률

- 비트코인
- 109,468,000
- +0.52%
- 이더리움
- 3,002,000
- +0.6%
- 비트코인 캐시
- 454,000
- +1.27%
- 리플
- 1,990
- +2.16%
- 솔라나
- 122,500
- +0.82%
- 에이다
- 350
- +0.86%
- 트론
- 510
- -0.78%
- 스텔라루멘
- 373
- +21.1%
- 비트코인에스브이
- 20,740
- +1.97%
- 체인링크
- 13,660
- +2.63%
- 샌드박스
- 103
- +1.98%

* 24시간 변동률 기준