- 연세대학교 인공지능융합대 김시호 교수 연구팀 + 연합뉴스 팩트체크부 공동 실험.(다음)
- 대상 AI (모두 무료 버전 기준)
- 챗GPT(GPT-5 계열)
- 제미나이 2.5 플래시
- 딥시크(DeepSeek)
- 퍼플렉시티(Perplexity Sonar)(이비엔(EBN)뉴스센터)
- 시험 범위
- 2026학년도 수능 실제 시험지: 국어·수학·영어 전 영역
- 일부 과목(물리Ⅰ 등 선택과목)도 추가 실험 진행(다음)
- 진행 방식
- 사람이 시험지를 보고 문제–선지를 그대로 입력 → AI의 답을 OMR처럼 채점
- AI 4개 모델 모두 한 과목당 15분 내에 시험을 끝낼 정도로 초고속 풀이를 보였음.(다음)
- 챗GPT – “수학은 최상위, 국어는 약점” (종합 1위)
- (수학)입시 전문가 평: “서울 주요대 수학 상위권을 노릴 만한 실력”(다음)
- 종합평가
- 국어=약점, 수학·영어=강점
- 국어(화작) + 수학(확통) 조합 기준 총점 235점으로 4개 모델 중 1위(이비엔(EBN)뉴스센터)
- 그럼에도 “인서울 or 4년제 안정 합격” 수준에는 못 미친다는 입시 전문가 분석.(다음)
- 딥시크(DeepSeek) – “국어·영어 강하지만, 수학이 발목”
- 언어력(국·영)은 상당히 준수하지만, 수학 부진으로 총점은 챗GPT보다 낮아 2위로 정리됨.(네이트 뉴스)
- 제미나이 2.5 플래시 – “수학은 준수, 국어는 하위권”
- 수학은 잘하지만 국어에서 크게 깎여 중위권 수준의 총점으로 평가.(다음)
- 퍼플렉시티(Perplexity Sonar) – “성적도, 태도(?)도 최하위”

[1]: https://v.daum.net/v/20251115070121527 "[팩트체크] AI가 수능 문제 풀어보니…1등은 챗GPT"
[2]: https://www.ebn.co.kr/news/articleView.html?idxno=1686923 "\"2026 수능 AI 대결\"...챗GPT, 수학 한 문제만 틀리며 1위 < 기업일반 < 게임·IT < 전자ICT < 기사본문 - 이비엔(EBN)뉴스센터"
[3]: https://www.busan.com/view/busan/view.php?code=2025111512465863503 "AI 4개모델, 수능 얼만큼 풀까…챗GPT 1위지만 국어점수 ..."
[4]: https://www.ebn.co.kr/news/articleView.html?idxno=1686923 "\"2026 수능 AI 대결\"...챗GPT, 수학 한 문제만 틀리며 1위 - EBN"
[5]: https://news.nate.com/view/20251115n05413 "\"2026 수능 AI 대결\"…챗GPT, 수학 한 문제만 틀리며 1위"
[6]: https://www.jinhak.com/jh/high3/univ-entrance-info/ipsi-analysis/ipsi-strategy/824974 "챗GPT로 수능 국어 풀었더니 97점…만점 다가서는 AI"
[7]: https://www.sisain.co.kr/news/articleView.html?idxno=53525 "AI에게 한국 수능을 풀게 했다, 결과는?"
'인공지능 관련 뉴스@기사' 카테고리의 다른 글
| 한국지능정보사회진흥원, AI 이해도와 활용 경험에 따른 국민 인식 조사 결과 발표 (0) | 2025.11.16 |
|---|---|
| AI 기본법 시행령 입법예고, “AI가 개입된 서비스”와 “AI가 만든 결과물” 사람 눈에 보이게 표시해야... (0) | 2025.11.14 |
| OpenAI, 첫 한국 데브데이 개최 (0) | 2025.11.14 |
| 연·고·서울대 등에서 터진 ‘AI 커닝’, AI 일상화에 따른 현실 부적응의 결과 (0) | 2025.11.14 |
| 오늘의 뉴스 (25. 11. 14.) (0) | 2025.11.14 |