[AI 추론 칩 전쟁] 삼성 파운드리, 그록(Groq) 웨이퍼 67% 증산… 엔비디아 'SRAM 추론 칩' 공개 임박에 전략적 가치 급등

김주원 기자 / 입력 : 2026-03-11 07:38

그록, 삼성전자 4나노 웨이퍼 주문 9000장→1만5000장 확대… 엔비디아 GTC 2026서 'LPX' 추론 랙 공개 전망에 삼성 파운드리 수혜 기대감 확산

미국 AI 반도체 설계 전문기업 그록(Groq)이 삼성전자 파운드리 사업부에 2025년 AI 추론 칩 웨이퍼 주문량을 기존 9000장에서 1만5000장으로 약 67% 확대해 달라고 요청했다. 이미지=제미나이3

한국 반도체 수출의 미래가 '학습(Training)'이 아닌 '추론(Inference)'에 달려 있다면, 그 첫 번째 시험대가 지금 삼성전자 파운드리 앞에 놓였다.

미국 AI 반도체 설계 전문기업 그록(Groq)이 삼성전자 파운드리 사업부에 2025년 AI 추론 칩 웨이퍼 주문량을 기존 9000장에서 1만5000장으로 약 67% 확대해 달라고 요청한 사실이 확인됐다. 10일(현지시각) 대만 디지타임스(Digitimes)가 인용한 업계 소식에 따르면, 이번 증산은 삼성전자의 4세대 4나노(nm) 공정 'SF4X'의 수율과 성능이 안정 궤도에 진입했음을 보여주는 실질적 신호로 읽힌다.

단순한 물량 확대 이상으로 시장의 시선을 잡아끄는 것은 엔비디아(NVIDIA)와 그록 사이에 형성된 전례 없는 기술적 연대다. 엔비디아는 지난해 12월 약 200억 달러(약 29조4900억 원) 규모의 비독점적 기술 라이선싱 계약을 통해 그록의 추론 기술 자산과 핵심 인력을 사실상 흡수했다. 그록의 창업자 조너선 로스(Jonathan Ross)와 사장 서니 마드라(Sunny Madra) 등 경영진 다수가 엔비디아에 합류했으며, 직원의 약 90%가 엔비디아로 이동한 것으로 알려졌다. 이 거래는 엔비디아 역사상 최대 규모로, 2019년 이스라엘 칩 설계사 멜라녹스(Mellanox)를 약 69억 달러(약 10조1700억 원)에 인수한 기록을 세 배 가까이 뛰어넘는다.

삼성 파운드리 vs TSMC: AI 추론 칩 공정 경쟁력 비교. 도표=글로벌이코노믹/출처=트렌드포스(TrendForce), 국내 주요 증권사 반도체 분석 보고서 종합 (2026.03)

9000장에서 1만5000장으로… 2026년 본격 양산 체제 진입 전망

그록의 증산 요청은 AI 산업의 무게 중심이 모델 학습에서 실시간 추론 서비스로 빠르게 이동하고 있는 구조적 전환을 반영한다. 2025년에 공급되는 1만5000장의 웨이퍼는 대부분 실제 서비스 적용 전 검증용 칩 생산에 투입된다. 반도체 업계는 이 검증 과정이 마무리되는 2026년부터 대규모 양산 체제가 본격 가동될 것으로 내다보고 있다.

삼성전자는 현재 SF4X 공정으로 그록뿐 아니라 국내 AI 반도체 설계 기업 하이퍼엑셀(HyperExcel)의 칩도 전량 위탁 생산하고 있다. SF4X는 후공정 배선(BEOL) 기술을 개선해 칩 성능을 끌어올리는 동시에 고속 트랜지스터와 2.5D·3D 패키징을 지원하는 공정이다. 삼성전자 사업보고서에 따르면 SF4X의 양산은 2023년 11월에 시작됐으며, 감가상각이 상당 부분 진행된 상태여서 수율만 안정적으로 유지된다면 높은 수익성을 확보할 수 있는 이른바 '효자 노드'로 평가받는다.

트렌드포스(TrendForce) 자료에 따르면 글로벌 파운드리 시장에서 TSMC의 매출 점유율은2025년 3분기 71.0%, 삼성전자는 6.8%에 머물렀다. 삼성전자가 TSMC가 장악한 3~5나노 시장에서 정면 승부를 걸기보다 '추론 전용 칩'이라는 틈새 영역에서 실질적 수익 기반을 다지려는 전략적 선택이 이번 증산의 배경이다.

엔비디아, GTC 2026서 'LPX' 추론 랙 공개 전망… 삼성 파운드리에 기회인가

시장이 가장 주목하는 대목은 오는 3월 16일 개막하는 GTC 2026에서 엔비디아가 공개할 것으로 예상되는 신규 추론 전용 하드웨어다. 엔비디아 최고경영자(CEO) 젠슨 황(Jensen Huang)은 올해 4분기 실적 발표에서 "그록의 저지연 디코더를 활용해 GTC에서 공유할 아이디어가 있다"고 밝혔으며, 그록 인수를 2019년 멜라녹스 인수에 비유하면서 "당시 멜라녹스가 네트워킹 문제를 해결했듯, 그록이 추론 아키텍처를 확장할 것"이라고 언급했다.

업계와 증권가에서는 엔비디아가 그록의 LPU(언어 처리 장치) 기술을 기반으로 한 'LPX' 추론 랙을 공개할 것으로 전망한다. 이 시스템의 핵심은 메모리 구성의 근본적 전환이다.

기존 AI 가속기는 칩 외부에 적층된 고대역폭메모리(HBM)를 주기억장치로 사용한다. 반면 그록의 LPU는 칩 내부에 수백 메가바이트(MB) 규모의 정적랜덤액세스메모리(SRAM)를 탑재해, 모델 가중치를 온칩(on-chip)에서 직접 처리한다. 그록 측 공개 자료에 따르면 단일 LPU 칩의 내부 메모리 대역폭은 약 80TB/s에 달하며, 이는 엔비디아 H100 GPU의 HBM 대역폭(3.35TB/s)보다 수십 배 높은 수치다.

다만 이를 'SRAM이 HBM을 대체한다'고 해석하면 본질을 놓친다. 최근 국내 증권사 분석에 따르면 저비용 SRAM 추론 칩의 등장이 기존 HBM 수요를 줄일 것이라는 시각은 메모리 기술에 대한 이해 부족에서 비롯된 것이라고 지적했다. SRAM은 셀 크기가 DRAM보다 물리적으로 커서 용량 단가가 훨씬 높다. 따라서 SRAM 기반 아키텍처는 초저지연이 필수인 실시간 디코딩, 로봇공학, 자율주행 같은 특수 추론 워크로드에 최적화된 '보완재'로 봐야 한다. 방대한 데이터를 학습하거나 긴 문맥을 처리하는 작업에서는 여전히 HBM이 필수적이다.

증권가에서는 엔비디아가 그록의 LPU를 자사 GPU 기반 시스템과 병행 운용하는 '분리형 추론 아키텍처(Disaggregated Inference Architecture)'를 구축할 것으로 본다. 대규모 문맥 처리(프리필)는 HBM 또는 GDDR7 기반의 루빈(Rubin) GPU가 담당하고, 실시간 토큰 생성(디코딩)은 SRAM 기반 LPU가 맡는 구조다. 이 하이브리드 설계가 현실화될 경우, 삼성전자가 LPU 칩의 위탁 생산을 지속 수주할 수 있는 전략적 위치를 확보하게 된다. 트렌드포스는 "그록의 삼성 파운드리와의 긴밀한 협력 관계를 고려하면, 엔비디아가 TSMC 일변도의 공급망에서 벗어나 삼성전자를 제2의 파운드리 공급처로 탐색하고 있을 가능성이 있다"고 분석했다.

한국 반도체 생태계에 미치는 파급… 기회와 과제 동시에

삼성전자에 그록과의 협력은 단일 고객 확보를 넘어서는 산업 구조적 의미를 지닌다. TSMC가 엔비디아의 주력 GPU 물량을 사실상 독점하고 있는 상황에서, 삼성전자는 가격 경쟁력과 전력 효율을 앞세운 추론 칩 시장에서 차별화된 입지를 구축해야 한다.

반도체 업계 관계자는 "4나노 SF4X 공정은 전력 효율과 칩 면적 면에서 충분한 경쟁력을 갖춘 것으로 평가받고 있다"며 "그록의 주문 확대는 삼성 파운드리가 미세 공정 경쟁에서 여전히 유효한 선택지임을 시장에 입증하는 사례"라고 말했다.

그러나 넘어야 할 고비도 만만치 않다. 그록은 2025년 매출 전망을 당초 20억 달러(약 2조9400억 원)에서 5억 달러(약 7300억 원)로 대폭 하향 조정한 바 있다. 데이터센터 인프라 확충 지연이 원인으로 지목됐으며, 이는 삼성전자 파운드리의 수주 안정성에도 변수로 작용할 수 있다. 또한 TSMC가 추론 칩 시장으로 본격 영역을 넓히기 전에 확고한 점유율을 굳혀야 하며, 2026년 텍사스 테일러 공장의 가동 개시와 맞물려 안정적인 수율을 유지하는 것이 관건이다.

2008년 글로벌 금융위기 당시 반도체 업계는 '수요 절벽'에 직면했지만, 위기 이후 새로운 수요 축이 열리며 판도가 재편됐다. 지금 AI 추론 칩 시장이 그와 유사한 구조적 전환점에 서 있다. 삼성전자가 그록의 증산 요청을 발판 삼아 파운드리 사업의 만성 적자 고리를 끊고, AI 추론 생태계의 핵심 생산 거점으로 올라설 수 있을지—GTC 2026의 막이 오르는 3월 16일, 그 답의 윤곽이 드러날 것이다.

김주원 글로벌이코노믹 기자 park@g-enews.com