산업

마켓

공시

시황

시세

장외/IPO

특징주

투자전략

채권/펀드

환율

국제시황

일반
금융

금융정책

은행

보험

2금융

카드

가상자산/핀테크

일반
부동산

시장동향

업계

정책

분양

일반
산업

재계

전자/통신/IT

자동차

중화학

항공/물류

유통

의료/바이오

중기/벤처

일반
경제

경제정책

경제지표

생활경제

일반
국제

국제경제

국제일반

미국

중국

아시아

유럽/중동
정치

대통령실/총리실

국회/정당

국방/외교

정책

일반
사회

법조

교육

사건/사고

노동/취업

전국

인사/부음

동정

일반
오피니언

논현논단

논현광장

시론

AI 만평

데스크 시각

마감 후

칼럼

노트북 너머

'2026 수능' 최고 점수 받은 AI 정체는?

입력 2025-11-20 11:17

정지윤 인턴 기자

기자 이름을 클릭하면
더 자세한 정보를
확인할 수 있어요!

북마크 되었습니다.
마이페이지에서 확인하세요.

가장작게
작게
기본
크게
가장크게

(출처=Github 캡처)

(출처=Github 캡처)

구글의 신형 AI 모델 ‘제미나이(Gemini)3’가 최신 언어모델(LLM) 가운데 2026학년도 수능 성능 평가에서 1위를 차지한 것으로 나타났다.

'2026-CSAT' 프로젝트를 올린 한 사용자는 19일 깃허브(GitHub)에 여러 대형 LLM에게 실제 수능 전 과목을 풀게 한 뒤 성적을 비교한 결과를 공개했다.

해당 사용자가 공개한 분석에 따르면, 제미나이3는 국어·수학·영어·한국사·탐구 4과목까지 총 450점 만점 기준 440.2점으로 가장 높은 평균 점수를 기록했다. 이어 GPT-5.1이 435.5점, 클로드 소넷(Claude Sonnet) 4.5가 422점으로 뒤를 이었다.

영역별 편차도 뚜렷하다. 수학에서는 GPT-5.1과 클로드 소넷 4.5만 전 과목 만점을 달성했고, 제미나이3는 선택과목 평균 방식에 따라 98.7점으로 집계됐다.

탐구 영역 중 사회문화에서는 GPT-5.1이 46점(50점 만점)으로 최고점을 기록했으며 제미나이3는 45점으로 한 점 차로 뒤졌다.

반면 시각 자료가 많은 물리1에서는 전체 모델 정답률이 하락했음에도 제미나이3가 40점으로 해당 과목 최고점을 기록했다.

평가 방식은 최대한 모델의 순수한 문제 해결 능력을 검증하는 데 맞춰졌다. PDF 전체를 제공하지 않고 텍스트(OCR 후 수작업 검수본)와 문제에 포함된 이미지(그래프·도표 등)만 별도 캡처해 입력했다.

외부 검색이나 계산기 사용, 시스템 프롬프트 등은 모두 차단됐으며, 모든 문항은 지문+문항 단위로 개별 제시됐다. 수학 영역 단답형 문제는 숫자가 정확히 일치해야만 정답으로 인정됐다.

전체 데이터와 코드, 세부 점수는 깃허브 저장소 '2026-CSAT'에서 누구나 열람할 수 있다.

관련 뉴스

#AI #인공지능 #수능 #만점 #제미나이

정지윤 인턴 기자의 주요 뉴스

자세히보기

좋아요0
화나요0
슬퍼요0
추가취재 원해요0

주요 뉴스

5월 서울 아파트값 상승세 둔화⋯강남구 낙폭 확대

KB부동산 ‘5월 전국 주택가격 동향’ 조사 결과 KB국민은행 조사 결과 이달 서울 아파트값 상승세가 다소 주춤한 것으로 나타났다. 특히 강남구는 하락폭이 더 커지며 약세 흐름이 이어졌다. 25일 KB부동산이 발표한 ‘5월 전국 주택가격 동향’에 따르면 11일 기준 서울 아파트 매매가격은 전월 대비 0.83% 상승했다. 다만 상승률은 전달보다 0.17
삼성전자 잠정합의안 투표 나흘째…투표율 86% 돌파

삼성전자 임금협상 잠정합의안에 대한 노동조합 찬반 투표가 나흘째 진행 중인 가운데 투표율이 86%를 넘어섰다. 25일 삼성그룹 초기업노동조합 삼성전자지부에 따르면 조합원 투표율은 이날 오전 8시 29분 기준 투표율 86.16%를 기록했다. 전체 투표권자 5만7291명 가운데 4만9363명이 참여했다. 투표는 22일 시작돼 오는 27일 오전 10시까지
소비자단체 “스타벅스 충전금 조건 없이 환불해야” 목소리 가열

스타벅스 선불카드 60% 사용해야 환불 가능⋯규정 개선 목소리 확대 소비자주권시민회의 “잔액 전액 환불 가능하도록 표준약관 개정해야” 스타벅스코리아의 ‘탱크데이’ 마케팅 논란 이후 소비자 불매 움직임인 이른바 ‘탈벅(탈 스타벅스)’ 현상이 확산하는 가운데, 소비자단체들이 스타벅스 선불충전금 환불 규정 개선을 촉구하고 나섰다. 25일
“99년식 시빅서 테슬라로”…캐나다 흔든 K잠수함, 정부·군·한화 ‘60조 총력전’

캐나다 해군, 도산안창호함 호평…“최신 잠수함 미래 체감” 방사청장·해군총장 직접 캐나다행…수주전 막판 지원 총력 한화, 친환경 에너지 협력까지 확대…‘산업 패키지’ 승부수 1999년식 혼다 시빅을 타다가 신형 테슬라를 탄 느낌이다. 캐나다 해군 관계자가 한국산 잠수함 도산안창호함(3000t급)을 둘러본 뒤 남긴 평가다. 캐나다 차세대 잠수
에이엔에이치스트럭쳐 IPO…'양산 체력'이 공모 평가 가른다 [IPO 엑스레이]

[편집자 주] 국내 기업공개(IPO) 시장 문턱이 갈수록 높아지는 추세다. 과거처럼 ‘성장성’만으로 시장 선택을 받던 시대는 지났다. 투자자들은 이제 기술적 실체와 지속 가능한 재무 기반을 냉정하게 살핀다. 상장을 추진하는 기업들은 거시경제 불확실성 속에 실적과 성과를 입증해야 하는 시험대에 섰다. 본지는 상장을 앞둔 기업의 기술 경쟁
서울시 “GTX 철근 누락 수차례 보고⋯보강 후 강도, 설계치 상회”

“시공 오류 은폐할 수 없는 체계” “국토부가 혼란ㆍ시민 불안 키워” 서울시가 수도권광역급행철도(GTX)-A 삼성역 구간 철근 누락 논란과 관련해 "구조적 안전에는 이상이 없다"고 재차 강조했다. 철근 누락을 지난해부터 국가철도공단 등에 여러 차례 전달해왔다며 일각에서 제기된 ‘은폐 의혹’에 대해서도 선을 그었다. 서울시는 25일 브리핑을
美·이란, 호르무즈·고농축 우라늄 문제 원칙 합의…“최종 승인까진 며칠 더”

미 당국자 발언…이란 전쟁 출구전략 가시화 미국과 이란이 중동 전쟁 종식을 위한 원칙적 합의에 도달했지만 최종 승인까지는 수일이 더 걸릴 수 있다고 미 고위 당국자가 24일(현지시간) 밝혔다. 합의안이 성사될 경우 호르무즈해협이 재개방되고 이란의 고농축 우라늄 폐기가 의무화된다. 뉴욕타임스(NYT)에 따르면 익명을 요구한 미국 당국자
"하루 최대 60% 손실 가능"… 금융당국, '개별종목 레버리지 상품' 투자주의 당부

삼성전자와 SK하이닉스를 기초자산으로 한 단일종목 레버리지 상장지수상품(ETF·ETN)이 오는 27일 상장되는 가운데 투자자들에게 각별한 투자 주의를 당부했다. 금융위원회와 금융감독원은 25일 “국내 주식의 가격제한폭이 ±30%라는 점을 고려하면 이론적으로 최대 60%까지 손실이 발생할 수 있다”면서 ‘투자 시 유의사항’을 공개했다. 삼성·미

많이 본 뉴스

최신 영상

주문 늘어날수록 적자? 벼랑 끝에 내몰린 100만 자영업자의 눈물 [T같은F]

산업 최신 뉴스

뉴스발전소

5월 셋째 주 유튜브 영상 순위 [이투PICK 순삭랭킹]

내가 저장한 뉴스 모아보기

내가 구독한 기자 전체보기

한 컷

초여름 날씨, 여의도 물빛광장 찾은 시민들 [포토로그]

마켓 뉴스

오늘의 상승종목
05.22 장종료

1.삼화콘덴서

23,500
2.미래산업

8,250
3.삼화전자

615
4.디아이씨

1,730
5.대양금속

279

실시간 암호화폐 시세

종목
현재가(원)
변동률

- 비트코인
- 115,604,000
- +0.49%
- 이더리움
- 3,155,000
- -0.54%
- 비트코인 캐시
- 523,500
- -0.95%
- 리플
- 2,027
- -0.64%
- 솔라나
- 128,100
- -0.85%
- 에이다
- 366
- -0.54%
- 트론
- 547
- +0.37%
- 스텔라루멘
- 227
- +1.79%
- 비트코인에스브이
- 21,940
- +0.97%
- 체인링크
- 14,190
- -1.18%
- 샌드박스
- 107
- +0%

* 24시간 변동률 기준