산업

마켓

공시

시황

시세

장외/IPO

특징주

투자전략

채권/펀드

환율

국제시황

일반
금융

금융정책

은행

보험

2금융

카드

가상자산/핀테크

일반
부동산

시장동향

업계

정책

분양

일반
산업

재계

전자/통신/IT

자동차

중화학

항공/물류

유통

의료/바이오

중기/벤처

일반
경제

경제정책

경제지표

생활경제

일반
국제

국제경제

국제일반

미국

중국

아시아

유럽/중동
정치

대통령실/총리실

국회/정당

국방/외교

정책

일반
사회

법조

교육

사건/사고

노동/취업

전국

인사/부음

동정

일반
오피니언

논현논단

논현광장

시론

AI 만평

데스크 시각

마감 후

칼럼

노트북 너머

'2026 수능' 최고 점수 받은 AI 정체는?

입력 2025-11-20 11:17

정지윤 인턴 기자

기자 이름을 클릭하면
더 자세한 정보를
확인할 수 있어요!

북마크 되었습니다.
마이페이지에서 확인하세요.

가장작게
작게
기본
크게
가장크게

(출처=Github 캡처)

(출처=Github 캡처)

구글의 신형 AI 모델 ‘제미나이(Gemini)3’가 최신 언어모델(LLM) 가운데 2026학년도 수능 성능 평가에서 1위를 차지한 것으로 나타났다.

'2026-CSAT' 프로젝트를 올린 한 사용자는 19일 깃허브(GitHub)에 여러 대형 LLM에게 실제 수능 전 과목을 풀게 한 뒤 성적을 비교한 결과를 공개했다.

해당 사용자가 공개한 분석에 따르면, 제미나이3는 국어·수학·영어·한국사·탐구 4과목까지 총 450점 만점 기준 440.2점으로 가장 높은 평균 점수를 기록했다. 이어 GPT-5.1이 435.5점, 클로드 소넷(Claude Sonnet) 4.5가 422점으로 뒤를 이었다.

영역별 편차도 뚜렷하다. 수학에서는 GPT-5.1과 클로드 소넷 4.5만 전 과목 만점을 달성했고, 제미나이3는 선택과목 평균 방식에 따라 98.7점으로 집계됐다.

탐구 영역 중 사회문화에서는 GPT-5.1이 46점(50점 만점)으로 최고점을 기록했으며 제미나이3는 45점으로 한 점 차로 뒤졌다.

반면 시각 자료가 많은 물리1에서는 전체 모델 정답률이 하락했음에도 제미나이3가 40점으로 해당 과목 최고점을 기록했다.

평가 방식은 최대한 모델의 순수한 문제 해결 능력을 검증하는 데 맞춰졌다. PDF 전체를 제공하지 않고 텍스트(OCR 후 수작업 검수본)와 문제에 포함된 이미지(그래프·도표 등)만 별도 캡처해 입력했다.

외부 검색이나 계산기 사용, 시스템 프롬프트 등은 모두 차단됐으며, 모든 문항은 지문+문항 단위로 개별 제시됐다. 수학 영역 단답형 문제는 숫자가 정확히 일치해야만 정답으로 인정됐다.

전체 데이터와 코드, 세부 점수는 깃허브 저장소 '2026-CSAT'에서 누구나 열람할 수 있다.

관련 뉴스

#AI #인공지능 #수능 #만점 #제미나이

정지윤 인턴 기자의 주요 뉴스

자세히보기

좋아요0
화나요0
슬퍼요0
추가취재 원해요0

주요 뉴스

신현송의 첫 금통위, 8연속 기준금리 동결⋯고물가 속 중동 변수 반영한 듯 [5월 금통위]

신현송 총재 취임 후 첫 금통위 주재⋯'7인의 현인' 중 2명 교체 고물가ㆍ고환율 속 성장세도 양호⋯중동 전쟁발 불확실성 여전 국내 기준금리가 올해 7월까지 현 2.5%를 지속하게 됐다. 중동 전쟁 장기화로 인한 고물가 흐름과 고환율, 여기에 반도체발 주식 등 자산가격이 일제히 오르고 있는 상황에서 전쟁 등 향후 불확실성이 여전해 본격적인
'삼전·닉스 2배 ETF' 전격 출시 속 '예적금 줄고 마통 늘어'…코스피 1만 돌파 기폭제 되나

삼성전자와 SK하이닉스의 단일종목 2배 레버리지 상장지수펀드(ETF)가 국내 증시에 전격 상장되면서 유동성 확대에 따른 코스피 시장의 도약 가능성에 시장의 이목이 집중되고 있다. 28일 금융투자업계 등에 따르면 삼성전자와 SK하이닉스를 기초자산으로 하는 단일종목 2배 레버리지 및 인버스 ETF 상품 16종이 전날 국내 증시에 일제히 상장했
뉴욕증시, 미국·이란 종전 기대감에 상승...3대지수 사상 최고치 [종합]

이란 국영방송 “미군, 이란서 철수하기로” 백악관 “완전 날조, 믿지 말라” 국제유가는 5%대 급락 뉴욕증시는 미국과 이란의 종전이 임박했다는 기대감에 상승했다. 27일(현지시간) 뉴욕증권거래소에서 다우지수는 전 거래일 대비 182.60포인트(0.36%) 상승한 5만644.28에 마감했다. S&P500지수는 1.24포인트(0.02%) 오른 7520.36에, 기술주 중심
카카오 노사 끝내 조정 결렬…창사 20년 만 첫 파업 위기

카카오 본사 노사가 노동위원회 2차 조정에서도 합의점을 찾지 못하며 창사 20년 만에 첫 파업 실행 가능성이 높아졌다. 27일 정보기술(IT) 업계에 따르면 경기지방노동위원회는 이날 오후 3시 카카오 노동쟁의 조정신청 사건에 대한 2차 조정 회의를 진행한 결과 조정 중지 결정을 내렸다. 카카오 노사 양측이 이날 임금 인상률과 성과 보상 체
단독 예보, 파산 저축은행 임원 퇴직연금 강제회수 성공

전직 임원 상대 90억 손배 확정 뒤 퇴직연금 추심 나서 퇴직연금 시효 소멸되자 ‘신탁재산 반환’ 논리로 대응 “회수 경로 다양해졌다”⋯공적자금 회수 실무 변화 주목 예금보험공사가 2011년 저축은행 사태로 파산한 삼화저축은행 전직 임원들의 미수령 퇴직연금을 강제 회수하는 데 성공했다. 퇴직연금 청구권 시효가 만료됐더라도 계좌에 남아
‘카톡 개편’ 주도 홍민택 CPO, 카카오 떠난다

지난해 카카오톡의 대규모 개편을 주도했던 홍민택 카카오 최고제품책임자(CPO)가 카카오에 합류한 지 1년 3개월 만에 카카오를 떠난다. 27일 업계에 따르면 홍 CPO는 최근 회사에 사의를 밝히고 퇴사 절차를 밟고 있다. 퇴사 절차는 다음 달 초 마무리될 것으로 보인다. 지난해 카카오톡 개편을 두고 전국민 논란이 일었던 점이 홍 CPO의 거취
병원에서 집으로…'홈뷰티' 시장 노리는 K-의료기기

피부과 시술에 사용되는 의료기기 전문 기업들이 가정에서 사용하는 ‘홈뷰티’ 디바이스 시장으로 영역을 확장하고 있다. 병·의원뿐 아니라 국내외 일반 소비자들을 공략할 신제품을 확보해 매출을 끌어올릴 수 있을지 주목된다. 27일 의료기기 업계에 따르면 최근 원텍과 클래시스 등 국내 미용 의료계 대표주자로 꼽히는 의료기업들이 일제히
“주가 안정되면 고환율 잡힌다”는 李 대통령 발언, 사실일까?

코스피 지수가 연일 사상 최고치를 경신하는 가운데 원·달러 환율은 8거래일 연속 1500원선을 웃돌고 있다. 이재명 대통령은 '외국인의 국내 주식 매도’를 고환율의 원인으로 지목했다. 전문가들은 외국인 매도세의 영향을 인정하면서도, 지정학적 리스크와 국내 투자자의 해외 투자 확대 등 구조적 요인도 함께 작용한 것으로 보고 있다. 28일

많이 본 뉴스

최신 영상

"3년 성과급으로 서울 아파트" 파업 사태 일단락이 됐지만…. 삼성전자에 남은 갈등과 문제점은

산업 최신 뉴스

뉴스발전소

SK하이닉스 이·퇴직률, 대기업 중 두 번째로 낮아…1위 기업은 [데이터클립]

내가 저장한 뉴스 모아보기

내가 구독한 기자 전체보기

한 컷

신현송 첫 금통위, 기준금리 향방은? [포토]

마켓 뉴스

오늘의 상승종목
05.28 12:47 실시간

1.아센디오

306
2.계양전기우

2,870
3.삼화전자

670
4.삼화콘덴서

21,300
5.삼성공조

2,530

실시간 암호화폐 시세

종목
현재가(원)
변동률

- 비트코인
- 108,415,000
- -3.2%
- 이더리움
- 2,934,000
- -4.27%
- 비트코인 캐시
- 493,100
- -3.12%
- 리플
- 1,898
- -3.51%
- 솔라나
- 119,700
- -3.31%
- 에이다
- 345
- -2.82%
- 트론
- 543
- -1.63%
- 스텔라루멘
- 255
- +16.97%
- 비트코인에스브이
- 20,300
- -3.38%
- 체인링크
- 13,270
- -4.67%
- 샌드박스
- 100
- -3.85%

* 24시간 변동률 기준