SWE벤치 검색결과 - 이투데이

검색결과 총3건

최신순 정확도순

프런티어급 성능에 고속·저비용…구글 '제미나이 3 플래시' 출시

구글이 지난달 공개한 차세대 생성형 인공지능(AI) 모델 '제미나이 3'의 경량·고속 버전인 '제미나이 3 플래시'(Gemini 3 Flash)를 선보이며 제품군을 확장했다. 프런티어급 성능을 유지하면서도 응답 속도와 비용 효율을 대폭 개선한 것이 특징으로, 생성형 AI 시장에서의 경쟁을 한층 끌어올렸다. 구글은 17일(현지시간) 답변 속도를 높이고

2025-12-18 11:16
챗GPT 따라잡아라…AI 경쟁 가속화되는데 성능 어떻게 알까

인공지능(AI)의 성능을 비교하기 위해 동일한 문제나 과제를 제시해 점수를 매기는 시험 도구를 ‘벤치마크’라고 한다. 모델의 지식, 추론, 코드 작성, 생산성 등 특정 능력을 평가하는 기준으로 활용된다. 최근 AI 경쟁이 치열해지면서 모델 간 성능 격차가 좁혀지고 AI가 상향 평준화됐다. 이에 따라 성능 평가 테스트 도구도 새롭게 개발되고 있다. 아직까

2025-10-06 09:00
앤스로픽, 최신 AI 모델 출시…오픈AI와 경쟁 가속

코딩·업무·전문 분야 등에서 성능 대폭 향상카플란 CSO “속임수·비위 맞추기 답변 감소”연말까지 1~2번의 추가 모델 출시 예고 인공지능(AI) 스타트업 앤스로픽이 새로운 AI 모델 ‘클로드 소네트 4.5’ 출시를 밝히며 오픈AI와의 경쟁을 가속화하고 있다. 29일(현지시간) 가디언에 따르면 앤스로픽이 이번에 출시한 모델은 지난달 내놓은 프리미엄

2025-09-30 12:54