탈(脫) 엔비디아 나선 중국 딥시크…새 모델 V4 전격 공개

중국 AI 기업 딥시크가 차세대 모델 V4를 선보이며 긴 텍스트 처리 능력과 높은 비용 효율성을 앞세워 기술 경쟁에 다시 불을 지폈다. 동시에 중국산 칩 최적화를 통해 글로벌 AI 패권 구도에도 변화를 예고하고 있다.

중국 AI 기업 딥시크가 24일(현지시간) 오랫동안 기대를 모았던 새로운 플래그십 모델 V4의 프리뷰 버전을 공개했다. 특히 이 모델은 긴 텍스트를 더욱 효율적으로 처리할 수 있도록 돕는 새로운 설계 덕분에 이전 세대보다 훨씬 긴 프롬프트를 처리할 수 있는 것이 특징이다. 딥시크의 이전 모델들과 마찬가지로 V4 역시 오픈소스로 제공되어 누구나 자유롭게 다운로드해 사용하고 수정할 수 있다.

V4는 2025년 1월 출시된 추론 모델 R1 이후 딥시크가 내놓은 가장 중요한 모델이다. 제한된 컴퓨팅 자원으로 훈련된 R1은 뛰어난 성능과 효율성으로 전 세계 AI 업계를 놀라게 하며 딥시크를 하룻밤 사이에 무명 연구팀에서 중국을 대표하는 AI 기업으로 자리매김하게 했다. 이는 다른 중국 AI 기업들의 오픈웨이트(open-weight) 모델 출시 열풍을 촉발하는 계기가 되기도 했다(오픈웨이트는 AI 모델이 학습을 통해 얻은 핵심 수치(파라미터)를 누구나 내려받아 사용할 수 있도록 공개하는 방식이다. 요리에 비유하면 레시피뿐 아니라 맛을 결정하는 핵심 배합까지 함께 제공받아 바로 재현하거나 일부를 수정해 활용할 수 있는 것과 비슷하다. 덕분에 개발자들은 처음부터 모델을 만들 필요 없이 이를 기반으로 다양한 응용을 할 수 있다).

이후 딥시크는 비교적 조용한 행보를 이어왔으나, 4월 초 온라인 모델 버전에 ‘전문가(expert)’ 및 ‘플래시(flash)’ 모드를 추가하며 사실상 V4 출시를 예고했고, 이는 곧 있을 대규모 출시와 관련이 있다는 추측을 불러일으켰다.

딥시크는 중국의 AI 야망을 상징하는 강력한 아이콘이 되었지만, 최첨단 프런티어 모델 시장으로의 복귀는 수개월간의 면밀한 검토 끝에 이루어졌다. 여기에는 주요 인사의 이탈, 이전 모델 출시 지연, 그리고 미국과 중국 정부 양측의 점점 더 강화되는 감시 등이 포함된다.

그렇다면 V4가 R1처럼 AI 분야를 뒤흔들 수 있을까? 그렇게 되기는 쉽지 않겠지만, 이번 출시가 중요한 이유를 크게 세 가지로 정리할 수 있겠다.

1. 오픈소스 모델의 새로운 지평

R1과 마찬가지로 딥시크는 V4의 성능이 시중 최고 모델들과 견줄 만하면서도 비용은 훨씬 저렴하다고 주장한다. 이는 개발자와 기업 모두에게 중요한 의미를 갖는다. 비용 급등에 대한 부담 없이 최첨단 AI 기능을 원하는 방식으로 활용할 수 있기 때문이다.

새 모델은 두 가지 버전으로 제공된다. 모두 딥시크 웹사이트와 앱에서 사용할 수 있고 API도 개발자들에게 개방되어 있다. V4-프로는 코딩과 복잡한 에이전트 작업을 위한 대형 모델이며, V4-플래시는 더 빠르고 저렴하게 사용할 수 있도록 설계된 소형 모델이다. 두 모델 모두 추론 모드를 제공해 사용자의 프롬프트를 단계적으로 분석하고 해결 과정을 보여준다.

V4-프로의 경우 딥시크는 입력 토큰 100만 개당 1.74달러(약 2,570원), 출력 토큰 100만 개당 3.48달러(약 5,140원)를 부과한다. 이는 오픈AI와 앤트로픽의 유사 모델보다 훨씬 낮은 수준이다. V4-플래시는 더욱 저렴해 입력 토큰 100만 개당 약 14센트(약 207원), 출력 토큰 100만 개당 약 28센트에 불과하다. 이는 현재 시장에서 가장 저렴한 고성능 모델 중 하나다.

성능 면에서도 V4는 R1 대비 큰 도약을 이뤘다. 한 마디로 최신 주요 AI 모델들과 경쟁 가능한 수준이다. 딥시크가 공개한 벤치마크에 따르면 V4-프로는 앤트로픽의 클로드 오퍼스 4.6, 오픈AI의 GPT-5.4, 구글의 제미나이 3.1과 동등한 성능을 보인다. 또한 알리바바의 큐원 3.5, Z.ai의 GLM-5.1 등 다른 오픈소스 모델을 코딩, 수학, STEM(과학·기술·공학·수학) 분야에서 모두 앞서는 것으로 나타났다.

딥시크는 V4-프로가 에이전트 기반 코딩 작업 벤치마크에서도 최상위권이며, 복합 단계 문제 해결 능력에서도 뛰어난 성능을 보인다고 밝혔다. 숙련된 개발자 85명을 대상으로 실시한 내부 설문조사에서는 개발자의 90% 이상이 코딩 작업용 최우선 모델로 V4-프로를 선택했다.

또한 딥시크는 V4를 클로드 코드, 오픈클로, 코드버디 등 주요 에이전트 프레임워크에 맞게 최적화했다고 밝혔다.

2. 메모리 효율성 높이는 새로운 접근법 제시

V4의 주요 혁신 중 하나는 긴 컨텍스트 윈도우(context window), 즉 대형언어모델(LLM)이 한 번에 읽고 처리할 수 있는 텍스트 범위다. 두 버전 모두 최대 100만 토큰을 처리할 수 있으며, 이는 《반지의 제왕》 3부작과 《호빗》 전체를 합친 분량에 해당한다. 회사 측은 이 컨텍스트 윈도우 크기가 현재 모든 딥시크 서비스의 기본값으로 적용되고 있으며, 제미나이와 클로드 같은 최신 모델 버전이 제공하는 수준과 맞먹는다고 밝혔다.

하지만 딥시크가 이러한 도약을 이뤄냈다는 사실뿐 아니라 그것을 어떻게 가능하게 했는지를 이해하는 것도 중요하다. V4는 기존 모델 구조에 상당한 변화를 도입했으며, 특히 프롬프트의 각 부분을 다른 부분과의 관계 속에서 이해하도록 돕는 핵심 기능인 ‘어텐션 메커니즘(attention mechanism)’을 대폭 개선했다. 프롬프트 텍스트가 길어질수록 각 부분 간의 관계를 비교하는 연산 비용이 급격히 증가한다. 이 때문에 입력된 텍스트 중 어떤 부분이 중요한지를 가려내는 어텐션 메커니즘은 긴 텍스트 모델에서 주요한 병목 요소로 작용한다.

딥시크의 혁신은 모델이 무엇에 주목할지를 보다 선별적으로 결정하도록 한 데 있다. V4는 이전 텍스트를 모두 동일하게 중요하게 취급하는 대신 오래된 정보는 압축하고 현재 시점에서 중요할 가능성이 높은 부분에 집중한다. 동시에 중요한 세부 사항을 놓치지 않도록 인접한 텍스트는 그대로 유지한다.

딥시크는 이러한 방식이 긴 컨텍스트를 사용하는 데 드는 비용을 크게 줄여준다고 설명한다. 회사 측에 따르면 100만 토큰 규모의 컨텍스트에서 V4-프로는 이전 모델인 V3.2 대비 연산량을 27% 수준으로 낮추고, 메모리 사용량도 10%로 줄였다. V4-플래시는 절감 폭이 더욱 커 연산량의 10%, 메모리의 7%만 사용한다. 실제로 이는 방대한 자료를 처리해야 하는 도구를 더 저렴하게 구축할 수 있게 해준다. 예를 들어 전체 코드베이스를 읽을 수 있는 AI 코딩 보조 도구나 이전 내용을 잊지 않고 대규모 문서 아카이브를 분석할 수 있는 연구용 에이전트 등에 활용될 수 있다.

긴 컨텍스트 윈도우에 대한 딥시크의 관심은 V4에서 갑자기 시작된 게 아니다. 지난 1년 반 동안 회사는 AI 모델이 정보를 어떻게 ‘기억’하는지에 관한 논문을 꾸준히 발표해 왔다. 동시에 압축 기법과 수학적 접근을 통해 AI 모델이 실제로 처리할 수 있는 범위를 확장하는 실험을 이어왔다.

3. 엔비디아 의존에서 벗어나려는 험난한 여정의 첫걸음

V4는 화웨이의 어센드와 같은 중국산 칩에 최적화된 딥시크의 첫 모델로, 이번 출시를 계기로 중국 AI 산업이 미국 반도체 기업 엔비디아에 대한 의존도를 줄일 수 있을지 가늠하는 시험대가 될 전망이다.

이는 어느 정도 예상된 일이었다. 미국 IT 전문매체 ‘더 인포메이션’은 4월 초 딥시크가 엔비디아나 AMD 등 미국 반도체 기업에 V4 사전 접근 권한을 제공하지 않았다고 보도했다. 통상 신모델 출시 전에는 칩 제조사들이 지원을 최적화할 수 있도록 사전 접근 권한을 부여하는 것이 관행이지만 딥시크는 이를 중국 업체들에만 제공한 것으로 알려졌다.

지난 17일 화웨이는 자사의 어센드 950 시리즈 기반 슈퍼노드 제품이 딥시크 V4를 지원한다고 밝혔다. 이에 따라 V4를 수정해 자체적으로 운용하려는 기업과 개인은 화웨이 칩을 보다 쉽게 활용할 수 있게 된다는 것이다. 이보다 앞서 로이터는 “중국 정부 관계자들이 딥시크에 훈련 과정에서 화웨이 칩을 활용할 것을 권고했다”고 보도했다. 이러한 흐름은 중국 산업 정책의 전반적인 방향과 맞닿아 있다. 전략 산업은 국가 자립 목표에 맞추도록 장려되거나 사실상 요구되는 경우가 많기 때문이다.

특히 AI 분야에서는 이러한 움직임이 더욱 시급하다. 2022년 이후 미국의 수출 규제로 중국 기업들은 엔비디아의 최첨단 칩에 접근할 수 없게 됐고, 이후 성능을 낮춘 중국 시장용 제품까지 제한이 확대됐다. 이에 대응해 중국은 칩, 소프트웨어 프레임워크, 데이터센터를 아우르는 ‘자국 중심 AI 생태계’ 구축을 가속화하고 있다.

보도에 따르면 중국 당국은 외국산 칩 사용 제한, 조달 비율 규정, 엔비디아 칩과 화웨이·캄브리콘 등 중국산 칩의 병행 사용 요구 등을 통해 데이터센터와 공공 컴퓨팅 사업에서 국산 칩 비중 확대를 추진해 왔다.

다만 엔비디아를 대체하는 일은 단순히 칩을 바꾸는 문제에 그치지 않는다. 엔비디아의 경쟁력은 하드웨어뿐 아니라 개발자들이 수년간 구축해 온 소프트웨어 생태계에 있기 때문이다. 화웨이 어센드 칩으로 전환하려면 모델 코드 수정, 도구 재구성, 그리고 해당 환경의 안정성 검증이 필요하다.

현재로서는 딥시크가 엔비디아를 완전히 대체한 것으로 보이지는 않는다. 공개된 기술 보고서에 따르면 딥시크는 추론 단계, 즉 사용자의 요청에 응답을 생성할 때에는 중국산 칩을 사용하고 있다. 그러나 류즈위안(Liu Zhiyuan) 칭화대 컴퓨터공학과 교수는 MIT 테크놀로지 리뷰와의 인터뷰에서 “V4의 훈련 과정은 일부만 중국 칩에 맞게 조정된 것으로 보인다”고 말했다. 보고서에는 긴 컨텍스트 기능이 국산 칩에 최적화됐는지 명시돼 있지 않아, V4가 여전히 주로 엔비디아 칩에서 학습됐을 가능성도 제기된다. 익명을 요구한 복수의 소식통 역시 중국산 칩이 아직 성능 면에서는 엔비디아에 못 미치지만, 훈련보다는 추론에 더 적합하다고 전했다.

딥시크는 향후 V4의 비용 구조도 이러한 하드웨어 전환과 연계하고 있다. 회사 측은 화웨이 어센드 950 슈퍼노드가 올해 하반기부터 본격 출하되면 V4-프로 가격이 크게 낮아질 수 있다고 전망했다.

이 전략이 성공한다면 V4는 중국이 독자적인 AI 인프라를 성공적으로 구축해 나가고 있음을 보여주는 초기 신호가 될 수 있다.

The post 탈(脫) 엔비디아 나선 중국 딥시크…새 모델 V4 전격 공개 appeared first on MIT 테크놀로지 리뷰 | MIT Technology Review Korea.