[OPINION] “AI 발전의 ‘한계’는 없다”- 무스타파 술레이만 MS AI CEO

연산 능력의 급격한 확장에 힘입어 AI가 단순 응답 도구를 넘어 자율적으로 사고하고 실행하는 에이전트 시대로 빠르게 진입하고 있다.

인류는 노력이나 시간이 늘어나면 결과도 그만큼 늘어나는 ‘선형적(linear)’ 세상에 익숙해져 왔다. 한 시간을 걸으면 일정 거리를 이동하고, 두 시간을 걸으면 그 두 배를 이동한다는 식이다. 그러나 이러한 직관은 사바나에서 살아가던 과거에는 유효했지만, 인공지능(AI)처럼 시간이 갈수록 증가 속도가 빨라지는 ‘지수적(exponential)’ 기술을 이해하기에는 더 이상 충분하지 않다.

필자가 2010년 AI 연구를 시작했을 때와 비교하면 현재 최첨단 모델 학습에 투입되는 연산량은 무려 1조 배 증가했다. 초기 시스템이 약 10¹⁴플롭스(연산의 기본 단위인 부동소수점 연산) 수준이었다면 오늘날 가장 큰 모델은 10²⁶ 플롭스를 상회한다. 이는 그야말로 폭발적인 증가다. 오늘날 AI의 모든 변화는 모두 이 사실에서 비롯된다.

그럼에도 회의론은 여전하다. 반도체 성능이 주기적으로 두 배씩 증가한다는 무어의 법칙이 둔화되고 있고, 데이터는 부족하며, 에너지에도 한계가 있다는 지적이다.

그러나 여러 흐름을 함께 놓고 보면 상황은 전혀 다르게 보인다. 지수적 성장은 이미 분명한 방향성을 드러내고 있으며 그 흐름 역시 충분히 설명 가능하다. 이를 이해하려면 실제로 어떤 변화가 빠르게 진행되고 있는지 그 내부를 들여다볼 필요가 있다.

AI 학습을 계산기를 들고 일하는 사람들로 가득한 방에 비유해 보자. 과거에는 계산 능력을 높이기 위해 사람 수를 늘리는 방식이 일반적이었다. 그러나 이들 가운데 상당수는 다음 계산에 필요한 숫자를 기다리며 손을 놓고 있는 시간이 적지 않았다. 그만큼 성능은 낭비됐다.

지금의 변화는 단순히 계산기를 더 많이, 더 좋게 만드는 데서 그치지 않는다. 모든 계산이 멈추지 않도록 하고 각각의 작업이 끊김 없이 하나처럼 이어지도록 만드는 데 핵심이 있다.

이 같은 변화를 가능하게 한 흐름은 크게 세 가지다. 먼저 연산을 담당하는 칩 자체의 성능이 비약적으로 향상됐다. 엔비디아 칩은 2020년 312테라플롭스 수준에서 현재 2,250테라플롭스로, 불과 6년 만에 7배 이상 성능이 뛰었다. 올해 1월 공개된 마이크로소프트(MS)의 마이아 200 칩(Maia 200) 역시 동일한 비용 기준에서 기존 장비보다 30% 높은 성능을 낸다.

두 번째는 데이터 공급 속도의 혁신이다. 고대역폭 메모리는 칩을 초소형 빌딩처럼 수직으로 쌓는 구조로 설계되며 최신 HBM3는 이전 세대보다 세 배 넓은 대역폭을 제공한다. 그 결과 프로세서는 데이터를 기다리는 시간 없이 연산을 이어갈 수 있게 됐다.

세 번째는 연결 규모의 확장이다. 과거 계산기를 들고 있던 사람들로 가득했던 ‘방’은 이제 사무실을 넘어 캠퍼스, 더 나아가 도시 규모로 확장됐다. NVLink와 인피니밴드(InfiniBand) 같은 기술은 수십만 개의 GPU를 하나로 연결해 창고 규모의 슈퍼컴퓨터를 구성하고 이를 단일한 지능처럼 작동하게 만든다. 불과 몇 년 전만 해도 상상하기 어려웠던 변화다.

이 세 가지 흐름이 맞물리면서 연산 성능은 폭발적으로 증가했다. 2020년에는 GPU 8개로 언어 모델을 학습하는 데 167분이 걸렸지만 지금은 같은 작업이 4분도 채 걸리지 않는다. 무어의 법칙에 따르면 이 기간 동안 약 5배 개선이 예상되지만 실제 성능은 50배 가까이 향상됐다. 2012년 딥러닝 붐을 이끈 이미지 인식 모델 알렉스넷(AlexNet)은 GPU 두 개로 학습됐지만 현재는 10만 개 이상의 GPU가 투입된다. 각 GPU의 성능 역시 과거와는 비교하기 어려운 수준이다.

소프트웨어 측면에서도 혁신은 이어지고 있다. 에포크 AI(Epoch AI)에 따르면 일정한 성능에 도달하는 데 필요한 연산량은 약 8개월마다 절반으로 줄어드는 추세다. 이는 무어의 법칙이 제시해 온 18~24개월 주기의 성능 두 배 증가보다 훨씬 빠른 속도다. 일부 최신 모델의 서비스 비용은 연간 기준 최대 900분의 1 수준까지 떨어졌다. AI는 이제 배포와 운영 비용 자체가 급격히 낮아지는 단계에 들어선 것이다.

가까운 미래를 보여주는 수치도 압도적이다. 선도 연구소들은 컴퓨팅 역량을 매년 약 4배씩 끌어올리고 있다. 2020년 이후 최첨단 모델 학습에 투입되는 연산량은 해마다 5배씩 늘어났다. 전 세계 AI 관련 연산 자원은 2027년까지 H100 기준 약 1억 개 수준에 이를 것으로 전망되며, 이는 불과 3년 만에 10배로 확대되는 규모다. 이런 흐름을 종합하면 2028년 말에는 유효 연산량이 지금보다 약 1,000배 더 늘어날 것으로 보인다. 2030년경에는 매년 200기가와트 규모의 컴퓨팅 전력이 새로 투입될 가능성도 있다. 이는 영국과 프랑스, 독일, 이탈리아의 최대 전력 사용량을 모두 합친 수준과 맞먹는다.

그렇다면 이런 변화는 무엇을 의미할까. 챗봇 중심의 시대는 빠르게 저물고 인간에 가까운 수준의 에이전트로의 전환이 본격화될 것이다. 이들은 며칠씩 코드를 작성하고, 수주에서 수개월에 걸친 프로젝트를 수행하며, 전화를 걸고, 계약을 협상하고, 물류까지 관리하는 반자율 시스템이다. 단순히 질문에 답하는 보조 도구를 넘어 숙고하고 협업하며 실행까지 맡는 ‘AI 팀’이 등장하는 것이다. 우리는 아직 이 전환의 초입에 서 있을 뿐이며, 그 영향은 기술 산업을 넘어 인지 노동을 기반으로 한 거의 모든 분야로 확산될 가능성이 크다.

물론 가장 큰 제약 요인은 에너지다. 냉장고 크기의 AI 랙 하나가 약 120킬로와트를 소비하는데 이는 100가구가 쓰는 전력과 맞먹는 수준이다. 그러나 에너지 분야에서도 변화가 동시에 진행되고 있다. 지난 50년간 태양광 발전 비용은 약 100분의 1로 낮아졌고, 배터리 가격 역시 30년 동안 97% 하락했다. 청정에너지를 기반으로 한 확장이 현실적인 선택지로 떠오르고 있는 셈이다.

이미 막대한 자본이 투입됐고 기술은 빠르게 현실이 되고 있다. 1,000억 달러 규모의 클러스터와 10기가와트급 전력 사용, 창고 규모의 슈퍼컴퓨터는 더 이상 공상과학의 영역이 아니다. 이런 프로젝트는 현재 미국을 비롯해 전 세계 곳곳에서 실제로 추진되고 있다. 그 결과 우리는 이른바 ‘지적 풍요’의 시대를 향해 나아가고 있다. 마이크로소프트 역시 이러한 미래를 전제로 초지능 연구를 설계하고 구축하고 있다.

선형적 사고에 익숙한 시각은 앞으로도 한계를 지적할 것이다. 그러나 그 예측은 번번이 빗나갈 가능성이 크다. 컴퓨팅의 폭발적 성장은 지금 이 시대를 규정하는 핵심 흐름이며, 이 변화는 이제 막 시작 단계에 들어섰다.

이 글을 쓴 무스타파 술레이만 Mustafa Suleyman)은 마이크로소프트 AI 최고경영자(CEO)로 재직 중이다.

The post [OPINION] “AI 발전의 ‘한계’는 없다”- 무스타파 술레이만 MS AI CEO appeared first on MIT 테크놀로지 리뷰 | MIT Technology Review Korea.