
제미나이가 세계 수학 영재들의 대회에서 금메달을 따고, 코딩 시험은 만점을 받았어요. 그런데 똑같은 AI에게 아날로그 시계를 보여주면 정확도가 50%예요. 스탠퍼드 AI 인덱스 2026이 밝힌 AI의 신기한 이중성, 쉽게 정리해드릴게요!
지난 2025년 여름, 전 세계 AI 업계에 충격적인 소식이 전해졌어요. 구글 딥마인드의 제미나이 딥씽크(Gemini Deep Think)가 국제수학올림피아드(IMO)에서 공식 금메달을 획득했어요.
IMO는 쉽게 말해 전 세계 수학 영재 고등학생들이 출전하는 가장 권위 있는 수학 대회예요. 42점 만점에 35점을 획득했고, 금메달 획득 비율이 참가자 630명 중 11%에 불과한 초고난도 대회예요. 이 대회에서 AI가 처음으로 공식 금메달을 딴 거예요.
그리고 2026년 4월, 스탠퍼드대학교 HAI(인간 중심 AI 연구소)가 'AI 인덱스 2026' 보고서를 발표하면서 이 성과를 포함한 AI의 능력 변화를 400페이지에 걸쳐 정리했어요. 그 안에 정말 놀라운 숫자들이 담겨 있었어요.
보고서의 핵심 메시지는 한 마디로 이거예요. "AI는 천재인데 바보다."
구글은 2025년 호주 퀸즐랜드에서 열린 제66회 IMO에서 6문제 중 5개를 맞추며 42점 만점에 35점을 획득했어요. 이 대회에서 금메달을 따는 비율은 참가자의 11%에 불과해요. 인류 최상위 수준의 수학 영재들과 같은 무대에서 경쟁해 공식 금메달을 딴 거예요.
IMO 회장인 그레고르 돌리나르 교수는 "딥마인드의 솔루션은 명확하고 정확하며 대부분 따라가기 쉽다"고 평가했어요.
이어 제미나이는 국제 대학생 프로그래밍 대회(ICPC) 세계 결선에서도 금메달 수준의 성과를 냈어요. ICPC는 IMO보다 한 단계 높은 대회예요. 2025년 2월에는 한국 수능 전 과목에서도 1위를 차지했어요.
이건 단순히 "AI가 계산을 잘한다"는 이야기가 아니에요. 인간도 어려워하는 창의적 논리 추론과 증명 능력을 AI가 갖추기 시작했다는 신호예요.
스탠퍼드 보고서에 포함된 '클록벤치(ClockBench)' 테스트 결과예요. 아날로그 시계 사진을 AI에게 보여주고 몇 시인지 물었더니, 현재 최고 성능 AI의 정확도가 50.1%밖에 안 됐어요. 사람의 정확도는 90.7%예요.
이게 왜 그럴까요? AI는 기본적으로 텍스트와 패턴 인식에 특화되어 있어요. 아날로그 시계는 바늘의 각도를 물리적으로 해석해야 하는 작업인데, 이런 시각적·공간적 판단이 아직 약한 거예요.
옷 개기, 설거지처럼 실제 물리 세계에서 손을 쓰는 로봇 작업 성공률도 12%에 불과해요. 박사 시험은 통과하는 AI가 유치원 수준의 일상 과업에서 실패하는 거예요.
"들쭉날쭉한 지능(Jagged Intelligence) — 어려운 일은 잘 하고, 쉬운 일에서 실패하는 AI의 독특한 특성이에요. 마치 박사 학위를 가진 사람이 신발끈을 못 묶는 것처럼요."
— AI에게 묻다 | 아침빛 정리 · 출처: 스탠퍼드 AI 인덱스 2026 · 테크42 (2026.04.13)SWE-벤치 베리파이드
2024년 60% → 1년 만에 만점 수준
아날로그 시계 판독
인간 90.7% vs AI 50.1%
자율 컴퓨터 작업 성공률
2025년 20% → 2026년 77.3%
그 외에도 사이버보안 문제 해결률은 2024년 15%에서 2026년 93%로 치솟았어요. AI가 스스로 보안 취약점을 분석하고 해결하는 능력이 1~2년 만에 완전히 달라진 거예요.
미국 소비자들이 생성형 AI 도구로부터 얻는 가치는 연간 1,720억 달러(약 240조원)에 이르며, 사용자 1인당 가치가 불과 1년 만에 세 배로 늘었어요. 많은 사람이 무료로 쓰는데도 이미 엄청난 가치가 만들어지고 있는 거예요.
"들쭉날쭉한 지능"을 이해하면 AI를 더 똑똑하게 활용할 수 있어요.
글쓰기·번역·요약·이메일 작성·아이디어 발산·코딩·분석은 AI가 인간 수준을 넘어섰어요. 이 작업들은 주저 없이 AI에게 맡기세요. 단 하루 수십 분의 절약이 쌓이면 엄청난 생산성 향상이 돼요.
수학 문제 풀기, 법률 조항 해석, 복잡한 계약서 분석, 데이터 분석 등 어렵고 복잡한 논리 추론이 필요한 일은 AI가 오히려 인간보다 정확할 수 있어요. 박사 시험도 통과하는 능력이에요.
사진 속 세밀한 정보나 물리적 공간 판단은 아직 약해요. AI가 이미지를 분석할 때는 반드시 결과를 직접 확인하세요. 특히 의료 이미지나 중요한 시각 정보는 전문가 확인이 필요해요.
AI가 틀릴 수 있는 영역을 알고 활용하면 실수를 막을 수 있어요. AI 출력을 맹신하지 말고, 중요한 결정은 내가 최종 확인하는 습관을 들이세요. AI + 내 판단력이 최강 조합이에요.
AI는 수학 금메달을 따는 천재지만 시계를 못 읽는 이중적인 존재예요. 이게 나쁜 소식이 아니에요. AI가 잘하는 것(글쓰기·코딩·분석·추론)에 집중해서 활용하고, 못하는 것(물리적 판단·세밀한 시각 해석)은 내가 직접 판단하면 돼요.
AI를 100% 믿는 것도, 전혀 안 쓰는 것도 아닌 — 강점을 파악하고 제대로 활용하는 사람이 이 시대의 진짜 승자예요!
📊 AI의 들쭉날쭉한 지능 — 잘하는 것 vs 못하는 것
| 제미나이에 '노트북' 기능이 생겼다! 대화가 프로젝트가 되는 AI (0) | 2026.04.19 |
|---|---|
| 한국이 AI 특허세계 1위 라고? 진짜인가요? (0) | 2026.04.18 |
| AI 구독료 이렇게 아끼세요! 제미나이 인당 5천원에 쓰는 법 (0) | 2026.04.16 |
| 클로드가 앱스토어 1위를 찍었다? 펜타곤 충돌 이후 무슨 일이? (0) | 2026.04.15 |
| 제미나이 요금제 완전히 바뀌었다! 무료로 이미지 하루 100개? (0) | 2026.04.14 |