김종락 서강대 수학과 교수 인터뷰“국가대표 AI 자유롭게 검증해야”“AI 검증 위한 독립적 벤치마크 필요”수리적 추론 검증 ‘환각’ 줄여야국내 AI 모델들 성능 개선 뚜렷
지난해 11월 대학수학능력시험이 끝난 뒤 생성형 인공지능(AI)에 수능 문제를 풀게 하는 시도가 이어졌다. GPT와 제미나이, 딥시크 등 글로벌 모델들은 예상대로 높은 점수를 기록했다
김종락 교수팀 2차 검증 결과 발표LG ‘K-엑사원’ 46점 오른 70점업스테이지 ‘솔라’ 74점…14점 ↑글로벌 모델과 10~20점차로 좁혀연구팀 자체 문항서도 높은 점수
‘독자 인공지능(AI) 파운데이션 모델’ 프로젝트에 참여한 주관사의 AI 모델 성능이 정부의 대규모 투자 이후 개선된 것으로 나타났다. 수능 수학∙논술 문제를 풀렸을 때 70점대가 나