산업

마켓

공시

시황

시세

장외/IPO

특징주

투자전략

채권/펀드

환율

국제시황

일반
금융

금융정책

은행

보험

2금융

카드

가상자산/핀테크

일반
부동산

시장동향

업계

정책

분양

일반
산업

재계

전자/통신/IT

자동차

중화학

항공/물류

유통

의료/바이오

중기/벤처

일반
경제

경제정책

경제지표

생활경제

일반
국제

국제경제

국제일반

미국

중국

아시아

유럽/중동
정치

대통령실/총리실

국회/정당

국방/외교

정책

일반
사회

법조

교육

사건/사고

노동/취업

전국

인사/부음

동정

일반
오피니언

논현논단

논현광장

시론

AI 만평

데스크 시각

마감 후

칼럼

노트북 너머

'2026 수능' 최고 점수 받은 AI 정체는?

입력 2025-11-20 11:17

정지윤 인턴 기자

기자 이름을 클릭하면
더 자세한 정보를
확인할 수 있어요!

북마크 되었습니다.
마이페이지에서 확인하세요.

구글 선호매체 추가

가장작게
작게
기본
크게
가장크게

(출처=Github 캡처)

(출처=Github 캡처)

구글의 신형 AI 모델 ‘제미나이(Gemini)3’가 최신 언어모델(LLM) 가운데 2026학년도 수능 성능 평가에서 1위를 차지한 것으로 나타났다.

'2026-CSAT' 프로젝트를 올린 한 사용자는 19일 깃허브(GitHub)에 여러 대형 LLM에게 실제 수능 전 과목을 풀게 한 뒤 성적을 비교한 결과를 공개했다.

해당 사용자가 공개한 분석에 따르면, 제미나이3는 국어·수학·영어·한국사·탐구 4과목까지 총 450점 만점 기준 440.2점으로 가장 높은 평균 점수를 기록했다. 이어 GPT-5.1이 435.5점, 클로드 소넷(Claude Sonnet) 4.5가 422점으로 뒤를 이었다.

영역별 편차도 뚜렷하다. 수학에서는 GPT-5.1과 클로드 소넷 4.5만 전 과목 만점을 달성했고, 제미나이3는 선택과목 평균 방식에 따라 98.7점으로 집계됐다.

탐구 영역 중 사회문화에서는 GPT-5.1이 46점(50점 만점)으로 최고점을 기록했으며 제미나이3는 45점으로 한 점 차로 뒤졌다.

반면 시각 자료가 많은 물리1에서는 전체 모델 정답률이 하락했음에도 제미나이3가 40점으로 해당 과목 최고점을 기록했다.

평가 방식은 최대한 모델의 순수한 문제 해결 능력을 검증하는 데 맞춰졌다. PDF 전체를 제공하지 않고 텍스트(OCR 후 수작업 검수본)와 문제에 포함된 이미지(그래프·도표 등)만 별도 캡처해 입력했다.

외부 검색이나 계산기 사용, 시스템 프롬프트 등은 모두 차단됐으며, 모든 문항은 지문+문항 단위로 개별 제시됐다. 수학 영역 단답형 문제는 숫자가 정확히 일치해야만 정답으로 인정됐다.

전체 데이터와 코드, 세부 점수는 깃허브 저장소 '2026-CSAT'에서 누구나 열람할 수 있다.

관련 뉴스

#AI #인공지능 #수능 #만점 #제미나이

정지윤 인턴 기자의 주요 뉴스

자세히보기

좋아요0
화나요0
슬퍼요0
추가취재 원해요0

주요 뉴스

예탁금 규제 첫날…단일종목 레버리지 거래대금 4분의 1로

단일종목 레버리지 상장지수펀드(ETF)의 기본예탁금이 3000만원으로 오른 첫날 거래대금이 전날의 4분의 1 수준으로 급감했다. 삼성전자와 SK하이닉스가 급등하면서 레버리지 상품 가격도 치솟았지만 개인투자자는 대거 차익 실현에 나섰다. 31일 한국거래소에 따르면 삼성전자와 SK하이닉스를 기초자산으로 삼는 단일종목 레버리지·인버스 ETF
햄토리ㆍ밤으깡 난리더니⋯요즘 유행, '로블록스'에 다 있다 [솔드아웃]

지금 화제 되는 패션·뷰티 트렌드를 소개합니다. 자신의 취향, 가치관과 유사하거나 인기 있는 인물 혹은 콘텐츠를 따라 제품을 사는 '디토(Ditto) 소비'가 자리 잡은 오늘, 잘파세대(Z세대와 알파세대의 합성어)의 눈길이 쏠린 곳은 어디일까요? '햄토리'와 '밤으깡'. 최근 SNS를 뜨겁게 달군 화제의 주인공들입니다. 짧은 영상 하나로 수백만
태풍 '돌핀' 경로 어디로…제주 향한 '이 태풍'과 닮았다? [이슈크래커]

극한 폭염에 시달리는 지겨운 나날. 견딜 수 없는 이들 사이에서 차라리 여름 불청객을 기다린다는 이야기가 흘러나오고 있는데요. 이 바람(?)을 알았는지 덩치를 키운 ‘그’가 다가오고 있습니다. 제13호 태풍 ‘돌핀’이 기상청 태풍 강도 분류의 최고 단계인 ‘강도 5’까지 발달했죠. 31일 오전 중심기압은 910hPa(헥토파스칼)까지 낮아졌고, 이
49억에 산 주식이 하루 만에 13억 ‘껑충’⋯SK하이닉스 상한가에 웃은 최태원

최태원 SK그룹 회장이 전날 매수한 SK하이닉스 주식이 이날 장중 상한가까지 급등하면서 하루 만에 13억원에 달하는 평가이익을 거둔 것으로 추산된다. 31일 한국거래소에 따르면 오후 3시16분 기준 SK하이닉스는 가격제한폭(29.95%)까지 치솟은 171만8000원에 거래되고 있다. 금융감독원 전자공시시스템에 따르면 전날 최태원 회장은 SK하이닉
한달새 주담대 3조원↑⋯가계대출 증가세 견인

가계대출 잔액 778조7869억원⋯5대 은행 4.3조원 ↑ 금융당국, 실수요자 '핀셋 지원' 검토⋯총량 관리 기조 유지 국내 주요 시중은행의 가계대출이 7월에도 증가세를 이어간 가운데 주택담보대출이 3조원 넘게 늘며 증가세를 견인했다. 신용대출도 1조원 이상 증가하며 가계대출 증가를 뒷받침했다. 31일 금융권에 따르면 5대 은행(KB국민·신한·하
강원, 여름 휴가철 교통사고 증가율 전국 1위 [데이터클립]

여름 휴가철 강원 지역의 교통사고 증가율이 전국에서 가장 높은 것으로 조사됐다. 특히 다른 지역에서 강원을 찾은 운전자가 낸 사고는 평상시보다 30% 넘게 급증했다. 한국도로교통공단(이사장 김희중)이 최근 5년간(2021~2025년) 7월 20일부터 8월 31일까지의 여름 휴가철 교통사고 데이터를 분석한 결과, 강원 지역의 사고는 평상시보다 13.
한화오션, KDDX 본계약…전전기·스마트함정 기술 집약 [종합]

7조8000억원 사업 본궤도…2032년 선도함 전력화 통합전기 추진·스마트함교·사이버 방호 등 미래전 대응 한화오션이 7조8000억원 규모의 한국형 차기 구축함(KDDX) 상세설계와 선도함 건조에 착수한다. 통합전기 추진체계와 스마트함교, 함정통합네트워크 등 차세대 함정 기술을 집약해 2032년 선도함 전력화를 추진한다는 목표다. 한화오션은 31
삼전닉스 20% 솟구쳤다⋯코스피, 장 초반 14% 폭등해 6300선 위로

코스피 지수가 장 초반 14% 폭등해 순식간에 5600선에서 6300선까지 튀어 올랐다. 코스닥 지수도 7% 급등해 양 시장에서 동시에 매수 사이드카가 발동됐다. 간밤 미국 뉴욕증시에서 불어온 훈풍의 영향으로 삼성전자와 SK하이닉스는 20%대 강세를 보이고 있다. 31일 한국거래소에 따르면 오전 9시 15분 기준 코스피 지수는 전 거래일 대비 727.2

많이 본 뉴스

최신 영상

"불침범 빼고 CCTV? 누구한테 수의계약 주려고?" 국방부의 야간 경계 민간 위탁과 이권 창출 의혹? I 설주완 I 임윤선 I 정치대학

산업 최신 뉴스

뉴스발전소

햄토리ㆍ밤으깡 난리더니⋯요즘 유행, '로블록스'에 다 있다 [솔드아웃]

내가 저장한 뉴스 모아보기

내가 구독한 기자 전체보기

한 컷

본회의, 형소법 통과…패스트트랙 심사 단축법은 '필버' [포토]

마켓 뉴스

오늘의 상승종목
07.31 장종료

1.두산

270,000
2.삼성전기우

96,000
3.에넥스

447
4.코아스

426
5.SK하이닉스

396,000

실시간 암호화폐 시세

종목
현재가(원)
변동률

- 비트코인
- 90,572,000
- -1.02%
- 이더리움
- 2,686,000
- -0.92%
- 비트코인 캐시
- 299,800
- -3.2%
- 리플
- 1,530
- -0.39%
- 솔라나
- 104,900
- -0.47%
- 에이다
- 247
- +1.65%
- 트론
- 467
- +0.21%
- 스텔라루멘
- 245
- +0.41%
- 비트코인에스브이
- 18,150
- +3.66%
- 체인링크
- 11,730
- -2.33%
- 샌드박스
- 60.27
- +4.13%

* 24시간 변동률 기준