link 세부 정보
정보 바로가기 : [Part Ⅰ] 인공지능 성능 평가 시험지 “어떤 AI가 가장 똑똑할까?”
[Part Ⅰ] 인공지능 성능 평가 시험지 “어떤 AI가 가장 똑똑할까?”[카테고리 설정이 아직되어 있지 않습니다.]
구글의 제미나이 2.5 프로, 오픈AI의 o3 미니도 정답률이 20%에 못 미칠 정도로 문제가 까다로운 것으로... 지난해 12월, 오픈AI는 새로운 추론 모델인 ‘o3’를 발표하면서 수학 특화 벤치마크인 ‘프론티어매스(FrontierMath)...