지금 AI는 어디쯤 와 있을까…차트로 보는 AI의 현주소

스탠퍼드 대학의 ‘2026 AI 지수’에 따르면 우리는 AI의 빠른 발전 속도를 따라잡지 못하고 있다.

AI 뉴스를 주시하고 있다면 아마도 여러분은 혼란스럽게 느낄지 모른다. “AI는 골드러시다”, “AI는 거품이다”, “AI가 당신의 일자리를 빼앗는다”, “AI는 시계도 읽지 못한다”는 등 상반된 성격의 뉴스가 쏟아지고 있기 때문이다. 스탠퍼드대 인간 중심 인공지능 연구소가 발표한 AI의 연례 성적표 ‘2026 AI 지수’는 이러한 혼란을 말끔하게 정리해 준다.

AI 개발이 한계에 부딪힐 것이라는 예측에도 불구하고 이 보고서는 최상위 모델들이 계속해서 발전하고 있다는 걸 보여준다. 사람들은 개인용 컴퓨터나 인터넷보다 훨씬 빠르게 AI를 수용하고 있다. AI 기업들은 과거 어떤 기술 붐보다도 빠르게 수익을 창출하고 있지만, 동시에 데이터센터와 칩에 수천억 달러를 쏟아붓고 있다. AI를 측정하기 위해 고안된 벤치마크, 이를 규제하기 위한 정책, 그리고 고용 시장은 이 속도를 따라잡기 위해 고군분투하고 있다. AI는 전력 질주하고 있지만, 우리는 아직 이를 따라잡을 준비가 부족한 상황이다.

이처럼 급격한 발전은 상당한 비용과 부담을 수반한다. 전 세계 AI 데이터센터는 현재 29.6기가와트의 전력을 소비하는데, 이는 뉴욕주 전체 전력 최대 수요와 맞먹는 수준이다. 오픈AI의 GPT-4o를 가동하는 데만 연간 1,200만 명의 식수 수요를 넘어서는 물이 사용될 수 있다. 동시에 반도체 공급망은 매우 취약하다. 전 세계 AI 데이터센터 대부분이 미국에 위치해 있으며, 대만의 TSMC 한 기업이 거의 모든 최첨단 AI 칩을 생산하고 있다.

이러한 데이터는 우리가 감당할 수 있는 속도보다 훨씬 빠르게 진화하는 기술의 모습을 보여준다. 올해 보고서의 주요 내용을 살펴보자.

사실상 박빙인 미국과 중국

‘아레나(Arena)’에 따르면 거대한 지정학적 이해관계가 걸린 치열한 경쟁 속에서 미국과 중국은 AI 모델 성능 면에서 거의 박빙의 접전을 벌이고 있다. 아레나는 동일한 프롬프트에 대한 대형언어모델(LLM)의 출력을 비교할 수 있게 해주는 커뮤니티 기반 순위 플랫폼이다.

2023년 초에는 오픈AI가 챗GPT로 앞서 나갔지만, 2024년 구글과 앤트로픽이 자체 모델을 출시하면서 격차는 좁혀졌다. 2025년 2월에는 중국 연구소 딥시크가 개발한 R1 모델이 잠시 미국의 최상위 모델인 챗GPT와 동등한 수준에 도달했다. 2026년 3월 기준으로는 앤트로픽이 선두를 달리고 있으며, xAI, 구글, 오픈AI가 뒤를 바짝 추격하고 있다. 딥시크와 알리바바 등 중국 모델들도 큰 차이 없이 뒤따르고 있다. 최상위 모델 간 격차가 극히 좁아지면서 이제는 비용, 신뢰성, 실제 활용도가 경쟁의 핵심 요소가 되고 있다.

미국과 중국은 서로 다른 강점을 가지고 있는 것으로 분석된다. 미국은 더 강력한 모델과 풍부한 자본, 그리고 다른 국가 대비 10배 이상인 약 5,427개의 데이터센터를 보유하고 있다. 반면 중국은 AI 논문, 특허, 로봇 분야에서 앞서 있다.

경쟁이 심화되면서 오픈AI, 앤트로픽, 구글 등은 더 이상 학습 코드, 파라미터 수, 데이터세트 규모를 공개하지 않고 있다. 보고서 공동 저자인 욜란다 길(Yolanda Gil) 서던캘리포니아대학 컴퓨터 과학자는 “모델의 행동을 예측하는 데 있어 아직 모르는 것이 많다”고 말했다. 이러한 불투명성은 AI를 더 안전하게 만드는 연구를 어렵게 만든다.

초고속으로 발전 중인 AI 모델

AI 모델의 발전 속도가 정체될 것이라는 예상은 빗나갔다. AI 모델이 계속해서 성능을 끌어올리고 있기 때문이다. 일부 기준에서는 이미 박사 수준의 과학, 수학, 언어 이해 테스트에서 인간 전문가를 따라잡거나 능가하고 있다.

소프트웨어 엔지니어링 벤치마크인 SWE-벤치 베리파이드(SWE-bench Verified)의 최고 점수는 2024년 약 60%에서 2025년 거의 100%까지 상승했다. 2025년에는 한 AI 시스템이 스스로 일기 예보를 생성하기도 했다.

길은 “AI 기술이 전혀 정체되지 않고 계속 발전하고 있다는 사실에 놀랍다”고 인정했다.

그러나 AI는 여전히 여러 분야에서 한계를 드러내고 있다. 모델이 물리적 세계를 직접 경험하기보다 방대한 텍스트와 이미지를 처리하며 학습하기 때문에 이른바 ‘불균형한 지능(jagged intelligence)’을 보인다. 로봇 기술은 아직 초기 단계에 머물러 있으며, 가사 작업 수행 성공률도 12%에 그친다.

반면 자율주행 기술은 한 단계 더 앞서 있다. 웨이모 차량은 현재 미국 5개 도시에서 운행 중이며, 바이두의 아폴로 고(Apollo Go) 차량은 중국에서 승객을 실어 나르고 있다. AI는 법률과 금융 등 전문 영역으로도 빠르게 확장되고 있다. 단, 아직 특정 모델이 시장을 지배하는 단계에는 이르지 못했다.

AI 평가 방식의 한계

이러한 성과는 그대로 받아들이기 어렵다. 보고서에 따르면 AI 벤치마크는 모델 발전 속도를 따라가지 못하고 있다. 일부 벤치마크는 설계 자체가 부실하며, 특정 수학 테스트의 경우 오류율이 42%에 달한다. 또 일부는 ‘문제 유출’처럼 악용될 수 있어, 모델이 실제로 더 똑똑해지지 않고도 점수를 높일 수 있다.

AI는 실제 사용 방식과 테스트 환경이 크게 다르기 때문에 벤치마크 성적이 실제 성능으로 이어지지 않는 경우도 많다. 특히 AI 에이전트나 로봇처럼 상호작용이 중요한 기술은 아직 제대로 된 평가 기준조차 부족하다.

또한 AI 기업들은 점점 더 적은 정보를 공개하고 있으며, 독립적인 테스트 결과가 기업 발표와 다른 경우도 있다. 길은 “특히 책임 있는 AI 관련 벤치마크 결과를 공개하지 않는 경우가 많다”며 “공개되지 않는다는 사실 자체가 의미를 가질 수 있다”고 지적했다.

일자리에 영향을 미치기 시작하는 AI

AI는 대중화된 지 3년 만에 전 세계 인구의 절반 이상이 사용하는 기술이 됐다. 이는 PC나 인터넷보다 빠른 확산 속도다. 현재 약 88%의 조직이 AI를 활용하고 있으며, 대학생 5명 중 4명이 AI를 사용하고 있다.

아직 초기 단계라 고용에 미치는 영향은 명확하지 않다. 그러나 일부 연구는 변화의 조짐을 보여준다. 2025년 스탠퍼드대 연구에 따르면 22~25세 소프트웨어 개발자 고용은 2022년 이후 약 20% 감소했다. 거시경제 요인도 작용했겠지만, AI의 영향도 일부 있는 것으로 보인다.

기업들도 채용 축소를 예상한다. 컨설팅 회사 맥킨지 조사에 따르면 기업 3곳 중 1곳이 향후 1년 내 인력 감소를 전망했다. 특히 서비스, 공급망, 소프트웨어 분야에서 영향이 클 것으로 보인다. AI는 고객 서비스 생산성을 14%, 소프트웨어 개발을 26% 향상시키고 있지만, 고도의 판단이 필요한 업무에서는 아직 효과가 제한적이다. 전체적인 경제 영향은 아직 판단하기 이르다.

AI를 바라보는 복잡한 시선

AI에 대한 인식은 낙관과 불안이 공존한다. 입소스(Ipsos) 조사에 따르면 응답자의 59%는 AI가 더 많은 이점을 가져올 것으로 보지만, 52%는 불안을 느낀다고 답했다.

전문가와 대중의 시각 차이도 크다. 퓨(Pew) 조사에서 전문가의 73%는 AI가 업무에 긍정적 영향을 줄 것이라 보는 반면, 미국 일반 대중은 23%만 그렇게 생각하고 있는 것으로 확인됐다. 교육과 의료에 대해서도 전문가가 더 낙관적이지만, 선거와 인간관계에는 부정적 영향을 줄 것이라는 점에서는 의견이 일치했다.

또 다른 조사에서는 미국인이 정부의 AI 규제 능력을 가장 신뢰하지 않는 것으로 나타났다. 규제가 지나칠 것을 우려하는 사람보다 부족할 것을 걱정하는 사람이 더 많다.

기술 발전 속도에 뒤처지는 규제

전 세계 정부는 AI 규제에 어려움을 겪고 있지만 일부 진전도 있었다. 유럽연합(EU)은 예측 치안과 감정 인식에 AI를 사용하는 것을 금지하는 법안을 시행했다. 한국, 일본, 이탈리아도 국가 차원의 법안을 통과시켰다. 반면 미국 연방정부는 규제 완화 방향으로 움직이며, 주 정부의 규제를 제한하려는 행정명령을 내렸다.

그럼에도 미국 각 주에서는 역대 최대인 150건의 AI 관련 법안이 통과됐다. 캘리포니아는 안전성 공개와 내부고발자 보호를 의무화했고, 뉴욕은 안전 프로토콜 공개와 사고 보고를 요구하는 법안을 도입했다.

하지만 이러한 입법 노력에도 불구하고 규제는 기술 발전 속도를 따라가지 못하고 있다. 길은 “우리가 AI를 충분히 이해하지 못하기 때문에 정부도 규제에 신중할 수밖에 없다”며 “이 시스템에 대한 이해 자체가 부족하다”고 지적했다.

The post 지금 AI는 어디쯤 와 있을까…차트로 보는 AI의 현주소 appeared first on MIT 테크놀로지 리뷰 | MIT Technology Review Korea.