구글 제미니, 오픈AI GPT-4와 대등한 성능 입증
적은 데이터·컴퓨팅 파워로 고성능 구현해 주목
적은 데이터·컴퓨팅 파워로 고성능 구현해 주목

월스트리트저널(WSJ)은 지난 16일(현지시간) 중국 기업 딥시크(DeepSeek)가 혁신적인 저전력·저비용 AI 모델로, 구글과 오픈AI 등 미국 기업들이 주도하던 시장에 충격을 던졌다고 보도했다.
WSJ에 따르면, AI 모델의 발전은 매개변수(파라미터) 규모의 확대로 이어져왔다. 오픈AI의 경우 GPT-1의 1억1700만 개에서 시작해 GPT-2는 15억 개, GPT-3는 1750억 개로 늘렸고, GPT-4는 1조8000억 개까지 확대했다. 매개변수는 AI 모델의 크기를 나타내는 지표로, 정보 처리와 의사결정에 필요한 기본 설정을 의미한다.
딥시크가 지난달 공개한 'R1'은 이러한 흐름을 뒤집었다. R1은 6710억 개의 매개변수를 보유하고 있지만, 실제 작업에는 이 중 370억 개만을 활용한다. GPT-4 대비 37분의 1 수준의 연산으로 동등한 성능을 구현한 것이다.
혁신의 핵심은 '전문가 혼합(mixture of experts)' 기술이다. R1은 모델을 여러 전문 네트워크로 분할하고, 입력된 질문이나 작업의 특성에 따라 가장 관련성 높은 네트워크만을 선택적으로 활성화한다. 이를 통해 처리에 필요한 전력과 컴퓨팅 자원을 대폭 절감하면서도 높은 성능을 달성했다.
캘리포니아대학교 버클리 캠퍼스가 운영하는 AI 모델 평가 플랫폼 '챗봇 아레나(Chatbot Arena)'의 분석 결과가 이를 입증한다. R1은 1325-1425점 범위의 평가에서 구글의 제미나이 2.0 플래시 씽킹 익스페리멘털, 오픈AI의 GPT-4와 대등한 수준을 기록했다. 특히 창의적 글쓰기에서는 GPT-4에 이어 2위, 코딩과 수학 분야에서도 최상위권에 진입했다. 챗봇 아레나는 웹사이트 방문자들이 동일 질문에 대한 두 개 AI 모델의 답변을 비교 평가하는 방식으로, 현재까지 약 200개 모델에 대해 250만 건 이상의 평가를 축적했다.
가격 경쟁력은 더욱 돋보인다. AI 모델 개발사들은 기업 등 사용자에게 주고받는 데이터량인 '토큰' 수를 기준으로 비용을 청구한다. AI 벤치마킹 기업 아티피셜 애널리시스(Artificial Analysis)에 따르면, R1은 백만 토큰당 약 5달러의 비용으로 지능 지수 60점대를 기록했다. 이는 백만 토큰당 30달러를 부과하는 오픈AI의 o1 모델과 비교해 6분의 1 수준의 가격으로 동등한 성능을 제공하는 것이다. 시장에서 대부분의 경쟁 모델들이 백만 토큰당 0-5달러 구간에서 지능 지수 20-50점대를 기록한 것과 비교해도 월등한 효율성을 보여준다.
R1의 또 다른 강점은 강화 학습 중심의 접근법이다. 기존 AI 모델들이 사람이 직접 데이터에 레이블을 지정하는 비용과 시간이 많이 소요되는 지도 학습 방식에 의존했다면, R1은 강화 학습을 통해 더 적은 데이터로도 우수한 성능을 구현했다. 딥시크는 이 모델을 오픈소스로 공개해 외부 개발자들의 접근성도 높였다.
박정한 글로벌이코노믹 기자 park@g-enews.com