Groq 기업 분석

Deep Dive · AI Semiconductor / Inference Infrastructure Analysis

Groq, Inc.

Google TPU의 설계자가 만든 결정론적 추론 반도체 기업 — Nvidia와의 $200억 규모 라이선싱·인재 이전 거래를 거쳐, 창업자 없는 AI 추론 클라우드 기업으로 재편되다

$650M 2026.06 신규 성장자금

$20B Nvidia 라이선싱 거래가치

13개 글로벌 데이터센터

2016 설립연도

👤

Section 01

창업자 및 핵심 팀 배경

Groq, Inc.는 2016년 미국 캘리포니아주 마운틴뷰(현재 본사 산호세)에서 설립된 AI 추론 전용 반도체 기업입니다. 창업자 Jonathan Ross는 Google에서 2011년부터 2016년까지 근무하며, 사내 20% 프로젝트로 시작해 이후 Google 컴퓨팅 인프라의 절반 이상을 구동하게 된 TPU(Tensor Processing Unit)의 핵심 설계를 직접 주도한 엔지니어입니다. TPU 프로젝트 완료 후 그는 Google X의 Rapid Eval Team(이른바 “문샷 팩토리”의 초기 단계)에 합류해 Alphabet의 신규 사업 발굴 과정에 참여했습니다.

TPU의 성능이 업계에 알려지자 Amazon, Microsoft, Facebook 등 주요 빅테크가 Ross에게 자사용 맞춤 칩 설계를 제안하며 영입을 시도했습니다. 한 기업은 “Google과 중국만이 세계 최고 수준의 AI 컴퓨팅을 보유하는 것은 세계에 좋지 않다”는 논리로 그를 설득하려 했습니다. Ross는 이 문제의식에는 공감했지만 결론은 달랐습니다. “셋이 둘보다 그렇게 나은 건 아니다(Three’s not that much better than two). 하지만 그 제안 자체는 마음에 든다 — 나는 이것을 모두에게 개방된 형태로 만들겠다”는 것이 그의 답이었습니다. 이 원칙 — 소수의 빅테크에 갇혀 있던 첨단 AI 컴퓨팅 접근권을 민주화한다는 사명 — 이 2016년 Groq 창업의 직접적 동기가 되었습니다.

Jonathan Ross

Founder · 前 CEO (~2025.12)

NYU 쿠란트 수학연구소(Courant Institute)에서 수학·컴퓨터과학 전공, 2학년 때 박사과정 전용 과목을 이수한 최초의 학부생. Google에서 TPU의 시스톨릭 어레이(systolic array) 아키텍처와 저정밀도 연산 명령어 집합을 직접 설계·구현. 2016년 Groq를 창업해 결정론적(deterministic) 추론 전용 아키텍처인 LPU(Language Processing Unit)를 발명. 2025년 12월 Nvidia와의 라이선싱 거래에 따라 Nvidia로 이동, Chief Software Architect로 재직 중.

Douglas Wightman

Co-Founder · 초대 CEO

Google X(X Development)의 엔지니어 출신 기업가. Ross와 함께 Groq를 공동 창업해 초기 회사의 첫 CEO로 재직하며 조직 구조와 초기 사업 방향을 설계했습니다. 이후 Ross가 CEO 직책을 맡으며 회사를 이끌었습니다.

2025년 12월 — 창업자 이동과 거버넌스 전환: Nvidia와의 비독점적 라이선싱 계약 체결에 따라 Jonathan Ross와 사장 Sunny Madra 등 핵심 엔지니어링 인력 약 90%가 Nvidia로 이동했습니다. 회사는 創업자 없는 독립 법인으로 존속하게 되었으며, 前 CFO Simon Edwards가 신임 CEO로 취임한 뒤, 2026년 6월 기준으로는 Adam Winter(CEO)·Matt Eng(CFO) 체제 하에 완전히 새로운 사업 전략(AI 추론 클라우드 사업자로의 전환)을 추진하고 있습니다.

2026년 신규 경영진 — 인프라·엔터프라이즈 소프트웨어 전문가 영입: $650M 신규 투자와 함께 회사는 하이퍼스케일 인프라 운영과 엔터프라이즈 소프트웨어 경력을 겸비한 새 리더십을 구성했습니다.

Alan Rice

Chief Operating Officer

前 xAI(현 SpaceXAI), Meta Datacenters 출신. 美 해군 핵잠수함 운용 경력에서 출발해 하이퍼스케일 데이터센터 운영 전문가로 성장.

Sinclair Schuller

Chief Technology Officer (2026.07~)

엔터프라이즈 클라우드 플랫폼 Apprenda 창업자(Atos에 매각). 이후 Nuvalence(EY가 2024년 인수) 공동창업.

Rakesh Malhotra

Chief Product Officer (2026.07~)

Schuller의 Apprenda·Nuvalence 동업자. Microsoft에서 약 10년간 클라우드·데이터센터 관리·엔터프라이즈 스토리지 제품을 총괄.

이사회 의장은 성장투자사 Disruptive의 창업자 겸 CEO Alex Davis가 맡고 있으며, 이사회에는 전략투자사 Infinitum의 창업자 겸 CIO John Yetimoglu도 참여하고 있습니다. Disruptive는 Airbnb·Databricks·Palantir·Spotify 등에 투자한 댈러스 기반 후기 단계 투자사로, Groq에 누적 약 $3.5억를 투자한 최대 기관 투자자입니다.

⚡

Section 02

사업 현황 및 LPU 플랫폼

Groq의 핵심 기술은 LPU(Language Processing Unit)로, GPU·TPU와는 근본적으로 다른 아키텍처 철학을 취합니다. GPU가 수천 개의 단순 코어를 통한 병렬 처리량 극대화를, TPU가 학습과 추론의 균형을 추구하는 반면, LPU는 단일 코어 설계와 수백 MB 규모의 온칩 SRAM을 결합해 “결정론적(deterministic) 추론”이라는 단일 목표에 특화되어 있습니다. 컴파일러가 모든 연산을 사전에 정적으로 스케줄링함으로써 GPU 특유의 동적 스케줄링 지연과 메모리 대기 시간을 원천적으로 제거하는 방식입니다.

500만+ 글로벌 개발자 수

13개 데이터센터 (북미·유럽·중동·APAC)

주당 수조 토큰 처리 규모

200MW 2027년 목표 전력 용량

핵심 제품 포트폴리오:

🧩

LPU (Language Processing Unit)

시스톨릭 어레이 기반 결정론적 추론 칩. 정적 스케줄링으로 모든 연산 사이클을 사전 확정해 변동성 없는 지연 시간을 제공하며, GPU 대비 최대 10배 이상의 전력 효율을 표방합니다. 칩당 약 230MB의 온칩 SRAM을 탑재해 외부 HBM 메모리 의존도를 낮췄으나, 이로 인해 대형 모델은 다수의 LPU에 분산 배치해야 하는 구조적 제약도 동반합니다.

☁️

GroqCloud

OpenAI 호환 REST API를 제공하는 완전관리형 추론 플랫폼. API 키·base URL·모델명 등 단 세 줄의 코드 변경만으로 전환이 가능하며, Llama·Qwen·Mixtral 등 오픈소스 모델을 초당 수백~수천 토큰의 속도로 서빙합니다. 회사의 사업 모델을 칩 판매에서 추론 서비스 구독·사용량 기반 클라우드로 전환시키는 핵심 채널입니다.

🖥️

GroqRack

온프레미스·코로케이션 배치를 위한 랙 단위 LPU 클러스터로, 랙당 64~576개 이상의 LPU를 수용합니다. 국가 단위 주권 AI 인프라(사우디아라비아 등)와 규제 산업의 온프레미스 요구를 충족하는 핵심 하드웨어 제품입니다.

2025년 12월 24일 Groq는 Nvidia와 비독점적 기술 라이선싱 계약을 체결했습니다. Nvidia는 Groq의 LPU 아키텍처 전반에 대한 영구 라이선스를 확보하고, 차세대 LPX(Low-latency Processing) 플랫폼에 Groq의 추론 기술을 통합해 2026년 GTC에서 공식 발표했습니다. LPX는 Nvidia Vera Rubin NVL72 플랫폼과 공동 설계되어, Vera Rubin이 대규모 학습·처리량을 담당하고 LPX가 저지연 토큰 생성을 가속하는 이종(heterogeneous) 추론 구조를 구현합니다. 이 거래를 통해 Groq의 LPU 기술은 업계 표준 인프라의 일부로 편입되었으며, Groq 자체는 칩 설계 기업에서 추론 클라우드 운영 기업으로 사업 모델을 전환하게 되었습니다.

국가 단위 주권 AI 인프라 — 사우디아라비아 파트너십: Groq는 Aramco Digital과의 협력으로 사우디 담맘(Dammam)에 중동 최대 규모의 추론 클러스터를 단 8일 만에 구축했으며, 2025년 2월에는 사우디 왕국으로부터 $15억 규모의 확장 투자 약정을 확보했습니다. 이 인프라는 SDAIA의 아랍어 LLM ALLaM 서비스를 지원하며, GroqCloud의 사우디 리전은 중동·아시아 권역 트래픽까지 처리하는 글로벌 거점으로 발전했습니다.

💰

Section 03

투자 유치 히스토리

Groq는 2017년 첫 시드 투자 이후 2025년까지 총 누적 약 $17.5억의 민간 자본을 조달하며 단계적으로 기업가치를 키워왔습니다. 그러나 2025년 12월 Nvidia와의 $200억 규모 라이선싱·인재 이전 거래는 전형적인 벤처 투자 라운드의 연장선이 아닌, 사업의 정체성 자체를 재편하는 변곡점이었습니다. 이 거래로 기존 주주들에게 대규모 현금이 분배된 직후, 2026년 6월 회사는 잔존 사업(GroqCloud)을 기반으로 한 신규 성장자금 $6.5억를 다시 조달하며 “AI 추론 네오클라우드” 기업으로 재출발했습니다.

2017

시드 투자 — Social Capital(Chamath Palihapitiya) 리드

$10M

Jonathan Ross와 Douglas Wightman의 창업 직후 Social Capital의 Chamath Palihapitiya가 리드한 첫 외부 투자. 이후 누적 $5억 이상을 투자하며 Groq의 가장 이른 시기부터의 핵심 후원자로 자리매김했습니다.

Social Capital / Chamath Palihapitiya (리드)

2018~2020

Series A·B — TSP 아키텍처 개발 및 초기 고객 확보

비공개

Tensor Streaming Processor(TSP, 코드명 “Alan”) 아키텍처의 연구개발 자금을 조달한 초기 라운드. 2020년 ISCA 학회에서 펑셔널 슬라이스(functionally sliced) 마이크로아키텍처를 공식 발표하며 학계·산업계의 주목을 받기 시작했습니다.

April 2021

Series C — Tiger Global·D1 Capital 공동 리드, BlackRock 합류

$300M (누적 ~$363M)

Tiger Global Management와 D1 Capital Partners가 공동 리드한 $3억 라운드로 글로벌 테크 투자자들이 본격 합류했습니다. BlackRock도 이 시점 최초 투자자로 참여했습니다. ChatGPT 출현 이전 시점으로, 이 자금은 TSP를 “Language Processing Unit(LPU)”으로 리브랜딩하고 대규모 언어모델 추론에 특화된 전략으로 사업 방향을 전환하는 데 활용되었습니다.

Tiger Global Management (공동 리드) D1 Capital Partners (공동 리드) BlackRock (신규)

August 2024

Series D — Cisco·Samsung·BlackRock PE 공동 리드, 기업가치 $28억

$640M (누적 ~$1B)

Cisco Investments, Samsung Catalyst Fund, BlackRock Private Equity Partners가 공동 리드한 $6.4억 라운드. GroqCloud의 빠른 개발자 채택(2024년 7월 기준 역사상 가장 빠른 하드웨어 플랫폼 채택 속도를 주장)과 맞물려 기업가치가 $28억으로 상승했습니다. 이 자금은 데이터센터 인프라 확장과 GroqCloud 상용화 가속에 투입되었습니다.

Cisco Investments (공동 리드) Samsung Catalyst Fund (공동 리드) BlackRock Private Equity Partners (공동 리드)

February 2025

사우디아라비아 — $15억 인프라 확장 투자 약정

$1.5B (전략적 인프라 투자)

LEAP 2025에서 발표된 사우디 왕국·Aramco Digital의 $15억 규모 약정으로, 담맘 데이터센터 확장과 SDAIA의 아랍어 LLM 인프라 지원에 사용되었습니다. 이는 지분 투자가 아닌 인프라·매출 계약 성격이 강하지만, Groq의 글로벌 사업 확장 자금에서 가장 큰 단일 자금원으로 기능했습니다.

Kingdom of Saudi Arabia / Aramco Digital

September 2025

Series E — Disruptive 리드, 기업가치 $69억으로 13개월 내 2배 이상 상승

$750M (누적 ~$1.75B)

Disruptive가 리드하고 BlackRock·Neuberger Berman·DTCP 등이 참여한 $7.5억 라운드로, 기업가치가 $69억으로 상승했습니다. Samsung·Cisco·D1·Altimeter·1789 Capital·Infinitum 등 기존 투자자도 후속 투자로 참여했습니다. 백악관의 미국산 AI 기술 스택 수출 촉진 행정명령과 맞물려 “미국산 AI 인프라” 포지셔닝이 강조된 라운드였습니다.

Disruptive (리드) BlackRock · Neuberger Berman · DTCP Samsung · Cisco · D1 · Altimeter · 1789 Capital · Infinitum (재참여)

December 24, 2025

Nvidia 비독점 라이선싱 계약 — 거래가치 $200억, 창업자 등 핵심 인력 이동

$20B (라이선싱 + 인재 이전)

불과 3개월 전 $69억으로 평가됐던 Groq를 약 2.9배 프리미엄으로 평가한 거래로, Nvidia 역사상 최대 규모입니다. 전통적 인수가 아닌 비독점 라이선싱 계약 형태를 취해 지분 자체는 이전되지 않았으나, 창업자 Jonathan Ross와 사장 Sunny Madra를 비롯해 직원의 약 90%가 Nvidia로 이동하는 등 실질적으로 인수에 준하는 구조였습니다. 美 상원과 FTC가 반독점 검토 회피 목적의 구조화 여부를 조사하는 등 규제 당국의 주목을 받았습니다.

NVIDIA Corporation

June 22, 2026

$650M 신규 성장자금 — Disruptive·Infinitum 리드, AI 추론 클라우드로 재출발

$650M (재구성된 법인 대상 신규 투자)

기존 주주들이 Nvidia 거래에 따른 최종 현금 분배를 받은 후, 재구성된 법인에 대한 풀-로 라타(pro-rata) 방식의 재투자 기회로 구조화된 라운드입니다. Disruptive와 Infinitum이 백스톱(backstop) 투자자로서 리드했습니다. 이 자금은 기존 13개 데이터센터에 Nvidia의 신형 LPX 시스템을 포함한 최신 추론 기술을 탑재하는 데 사용되며, 2027년 말까지 200MW 규모로 확장하는 것이 목표입니다.

Disruptive (리드) Infinitum (리드) 기존 투자자 재투자 참여

📋 Nvidia-Groq 거래 구조 요약 (2025.12.24)

• 거래 형태: 비독점적(non-exclusive) 기술 라이선싱 계약 — 지분 인수가 아닌 영구 특허·소프트웨어 라이선스 부여

• 대가 지급: 약 $170억 규모의 현금이 3차에 걸쳐 지급(약 85% 선지급, 10% 2026년 중반, 잔여분 2026년 말) — 일부 분석에서는 총 거래가치를 약 $200억으로 평가

• 인력 이동: 창업자 Jonathan Ross(Nvidia Chief Software Architect로 합류), 사장 Sunny Madra를 포함해 직원의 약 90%가 Nvidia로 이동

• 존속 법인: GroqCloud 사업은 별도 독립 법인으로 존속, 잔류 직원은 베스팅 주식 현금화 및 신설 법인 경제적 참여권 부여

• 규제 이슈: 美 상원 및 FTC가 반독점 신고 기준 회피를 위한 거래 구조화 여부를 조사 중

🏆

Section 04

핵심 경쟁우위 및 리스크 요인

Groq의 경쟁 지위는 이례적인 양면성을 갖습니다. 기술적으로는 결정론적 LPU 아키텍처가 여전히 차별화된 강점이지만, 사업적으로는 창업자와 핵심 엔지니어링 인력이 경쟁사(Nvidia)로 이동한 직후 신규 경영진 체제로 재편된 전환기에 있습니다. 경쟁 환경은 Nvidia(GPU·이제는 LPX까지), Cerebras(웨이퍼 스케일 엔진), SambaNova(재구성형 데이터플로 유닛), 그리고 Google·AWS·Intel 등 하이퍼스케일러의 자체 칩까지 포괄하는 다층 구도입니다.

⚙️

결정론적 아키텍처 — 예측 가능한 초저지연 추론

컴파일 시점에 모든 연산을 정적으로 스케줄링하는 LPU는 GPU의 동적 스케줄링 특유의 지연 변동성을 근본적으로 제거합니다. 온칩 SRAM 기반의 약 80TB/s 대역폭은 Nvidia H100의 약 3.3TB/s 대비 약 24배에 달하며, 이는 순차적 토큰 생성이 핵심인 LLM 추론에서 구조적 우위로 작동합니다. 동일한 입력에 대해 항상 동일한 처리 시간을 보장하는 특성은 SLA 설계가 중요한 엔터프라이즈 추론 서비스에 특히 유효합니다.

🤝

Nvidia 생태계 편입 — 경쟁자에서 표준 기술 공급자로

Nvidia가 자사 차세대 LPX 플랫폼에 Groq의 LPU 기술을 채택했다는 사실 자체가 업계 최대 기업으로부터의 기술적 검증입니다. Vera Rubin NVL72(학습·고처리량)와 LPX(저지연 토큰 생성)의 이종 결합 전략은, Groq의 핵심 기술이 더 이상 “대안적 도전자”가 아니라 업계 표준 인프라의 구성 요소로 자리매김했음을 시사합니다. 이는 GroqCloud 입장에서도 향후 LPX 기반 인프라를 자사 데이터센터에 직접 도입할 수 있는 기술적 경로를 제공합니다.

🌍

글로벌 추론 인프라 규모 — 13개 데이터센터와 주권 AI 파트너십

북미·유럽·중동·APAC에 걸친 13개 데이터센터와 500만 명 이상의 개발자 기반은 신규 추론 클라우드 진입자가 단기간에 복제하기 어려운 운영 자산입니다. 특히 사우디아라비아와의 주권 AI 인프라 파트너십(담맘 데이터센터, $15억 약정)은 국가 단위 AI 자립 수요라는 구조적 성장 동력에 직접 연결된 독자적 채널입니다.

🧑‍💼

하이퍼스케일 운영·엔터프라이즈 소프트웨어 신규 경영진

xAI·Meta 데이터센터 출신 COO Alan Rice, Microsoft 클라우드·스토리지 사업 경력의 CPO Rakesh Malhotra, 엔터프라이즈 소프트웨어 기업가 CTO Sinclair Schuller 등 신규 경영진은 “세계 유일의 LPU 실전 운영 경험을 가진 엔지니어링 팀”이라는 회사 측 주장을 뒷받침하는 운영 역량을 보강합니다. 칩 설계 중심에서 클라우드 서비스 운영 중심으로의 사업 전환에 필요한 역량 공백을 메우는 인선으로 평가됩니다.

⚠️ 투자자 관점에서의 핵심 리스크 요인

창업자·핵심 인력 이탈에 따른 기술 리더십 공백: LPU를 직접 발명한 Jonathan Ross를 포함해 엔지니어링 인력의 약 90%가 Nvidia로 이동한 상황에서, 신설 법인이 독자적인 차세대 기술 혁신을 지속할 수 있을지는 검증되지 않았습니다.

메모리 용량의 구조적 제약: LPU의 온칩 SRAM 용량(칩당 약 230MB)은 대형 모델 서빙에 다수의 칩을 필요로 합니다(예: 700억 파라미터 모델에 약 600개 LPU 추정). 이는 Cerebras·SambaNova 등 경쟁사 대비 일부 워크로드에서 비용·복잡성 측면의 약점으로 지적됩니다.

규제 리스크: Nvidia-Groq 거래의 반독점 회피 구조화 여부에 대한 美 상원·FTC 조사가 진행 중이며, 결과에 따라 거래 구조나 사업 운영에 영향을 받을 가능성이 있습니다.

사업 모델 전환의 실행 리스크: 칩 설계·판매 중심에서 추론 클라우드 운영 중심으로의 전환은 검증된 기존 트랙 레코드가 제한적인 새로운 경영진 하에서 추진되고 있어, 상업적 실행 성과를 단기간에 확인하기 어렵습니다.

본 자료는 Groq 공식 뉴스룸(groq.com/newsroom, 2026년 6월 22일 보도자료 등), Wikipedia, Axios, Reuters, SiliconANGLE, TechCrunch, PitchBook·Tracxn·Forge 등 공개 투자 데이터베이스, 및 관련 언론 보도를 기반으로 작성되었습니다.
투자 참고용 자료이며, 투자 권유를 목적으로 하지 않습니다. 거래 구조 관련 세부 수치는 보도 시점·매체에 따라 차이가 있을 수 있습니다. · 최종 업데이트: 2026년 6월

Groq, Growth $650M

Groq, Inc.

이 글 공유하기:

이것이 좋아요:

댓글 남기기응답 취소

글로벌 VC 메가딜 브리핑에서 더 알아보기