Baseten, Series F $1,500M


Baseten 기업 분석
Deep Dive · AI Infrastructure Analysis

Baseten

AI 추론(Inference) 인프라의 표준을 정립하다 — 샌프란시스코發 추론 전문 플랫폼, 18개월 4연속 투자 유치로 기업가치 $130억 달성

$13B 최신 기업가치 (2026.06)
$1.5B Series F 조달액
20배 최근 1년 매출 성장률
2019 설립연도
👤
Section 01
창업자 배경 및 설립 스토리

Baseten은 2019년 미국 샌프란시스코에서 Tuhin Srivastava(CEO), Amir Haghighat(CTO), Philip Howes(Chief Scientist), Pankaj Gupta 4인이 공동 창업한 AI 인프라 기업입니다. 창업팀의 핵심 인연은 크리에이터 마켓플레이스 Gumroad에서 시작되었습니다. Srivastava와 Howes는 호주에서 함께 성장한 오랜 친구로, Gumroad에서 데이터 과학자로 근무하며 머신러닝 모델을 자체적으로 풀스택 엔지니어링까지 수행해야 하는 구조적 비효율을 직접 경험했습니다. Haghighat은 당시 Gumroad의 엔지니어링 총괄(Head of Engineering)로 재직했으며, 이후 Clover Health에서 엔지니어링 매니저를 역임했습니다. Gupta는 Uber와 Twitter에서 대규모 백엔드·빅데이터 인프라 엔지니어로 경력을 쌓았습니다.

Tuhin Srivastava
Co-Founder · CEO

서던캘리포니아대학교(USC) 졸업 후 Macquarie Bank·Skulpt를 거쳐 Gumroad에서 데이터 과학자로 근무. Philip Howes와 함께 HR 분석 스타트업 Shape를 공동 창업해 2018년 Reflektive에 매각한 이력을 보유한 연쇄 창업가. “Base Ten”이라는 사명은 호주 초등교육에서 사용하는 수 개념 학습 교구 ‘Base Ten Blocks’에서 착안했으며, AI 애플리케이션의 가장 근본적인 building block을 제공한다는 회사의 정체성을 함축합니다.

Amir Haghighat
Co-Founder · CTO

Gumroad 엔지니어링 총괄, Clover Health 데이터 플랫폼 엔지니어링 매니저 경력. 추론 우선(inference-first) 아키텍처 철학을 설계한 기술 리더로, 인재 영입 시 “기관의 명성보다 함께할 사람 자체”를 최우선 기준으로 삼는 채용 철학을 공개적으로 밝힌 바 있습니다.

Philip Howes
Co-Founder · Chief Scientist

시드니대학교(University of Sydney) 수학 박사(PhD). Gumroad에서 머신러닝 엔지니어로 재직했으며, Srivastava와 함께 Shape를 공동 창업·매각. 모델 성능 연구와 추론 최적화 알고리즘 설계를 총괄합니다.

Pankaj Gupta
Co-Founder

Uber·Twitter에서 대규모 백엔드 인프라 및 빅데이터 시스템 엔지니어로 근무. 멀티클라우드 용량 관리, GPU 오케스트레이션 등 Baseten의 핵심 인프라 시스템 설계를 주도합니다.

2021년부터 비공개 베타로 첫 고객들(사기 탐지 모델을 운영하는 핀테크 기업, 디지털 치료제 스타트업 등)과 함께 제품을 검증했고, 2022년 4월 Greylock·South Park Commons Fund 공동 리드의 시드 투자와 Greylock 리드의 Series A를 동시에 공식 발표하며 정식 출범했습니다. 초기에는 데이터 과학팀이 별도의 백엔드·프런트엔드 엔지니어 없이도 머신러닝 모델을 프로덕션급 애플리케이션으로 전환할 수 있도록 돕는 로우코드형 ML 플랫폼으로 시작했으나, 2023년 이후 생성형 AI·LLM의 폭발적 확산에 대응해 사업 전략을 추론(inference) 전문 인프라 기업으로 전면 피벗했습니다. 이 피벗이 이후 Baseten의 폭발적 성장을 견인한 핵심 전환점으로 평가됩니다.

⚙️
Section 02
사업 현황 및 플랫폼 구조

Baseten은 AI 모델의 학습이 아닌 ‘추론(Inference)’ — 학습된 모델이 실제 운영 환경에서 결과를 산출하는 단계 — 에 특화된 인프라 기업입니다. 오픈소스·커스텀·파인튜닝 모델을 프로덕션급 API로 전환해 기업이 GPU 관리, 오토스케일링, 옵저버빌리티, 과금까지 신경 쓰지 않고 모델과 사용자 경험에만 집중할 수 있도록 합니다. 2025년 한 해 매출은 약 20배, 추론 처리량은 약 40배 성장했으며, 현재 전 세계 87개 클러스터·18개 클라우드에 걸쳐 일일 10억 건 이상의 추론 호출을 처리하고 있습니다.

20배 최근 1년 매출 성장률
40배 추론 처리량 성장률
10억+ 일일 추론 호출 건수
18개 멀티클라우드 제공사 수

핵심 제품 포트폴리오 — 추론에서 학습·후속학습까지의 풀스택 확장:

🚀
Dedicated Inference & Model APIs

Firecracker 기반 마이크로VM으로 모델을 패키징해 20GB급 모델도 10초 이내 콜드스타트를 구현. Llama·DeepSeek·GLM·Kimi K2 등 주요 오픈소스 모델을 OpenAI 호환 API로 즉시 호출 가능한 Model APIs와, 고객이 직접 GPU 인스턴스·오토스케일링을 설정하는 Dedicated Inference로 구성됩니다.

🧪
Training & Frontier Gateway

멀티노드 파인튜닝을 지원하는 Training 제품과, 프런티어 모델·오픈소스 모델을 함께 운용하는 멀티모델 전략을 위한 Frontier Gateway를 제공. 2025년 12월 강화학습(RL) 기반 사후학습 전문 스타트업 Parsed를 인수하며 추론 중심에서 학습-평가-배포 전 영역을 포괄하는 수직 통합 플랫폼으로 진화했습니다.

🌐
Multi-Cloud Capacity Management

자체 GPU를 보유하지 않는 자산 경량(asset-light) 구조로 15개 이상(현재 18개)의 클라우드 제공사에 걸쳐 워크로드를 동적으로 배분. GPU 공급 부족 국면에서도 가용성을 확보하고 특정 클라우드 종속(Lock-in) 위험을 제거하는 멀티클라우드 아키텍처 자체가 고객이 구매하는 핵심 가치로 평가됩니다.

오픈소스 기여 — Truss: Baseten은 모델 패키징 프레임워크 Truss를 오픈소스로 공개해, 개발자가 truss init 명령으로 모델 코드를 표준화된 컨테이너 형태로 손쉽게 패키징·배포할 수 있도록 지원합니다. 이는 개발자 생태계 내 진입 채널이자 신규 고객 확보의 입구로 기능합니다.

2025년 12월 전략적 행보: AWS와 전략적 협력 계약을 체결해, 고객이 Baseten의 추론 스택과 AWS의 글로벌 인프라를 결합해 데이터 통제권을 유지하면서 기존 AWS 투자를 그대로 활용할 수 있는 구조를 마련했습니다. 같은 달 단행한 Parsed 인수는 고객이 자체 데이터·평가 기준·도메인 특화 환경으로 모델을 지속적으로 개선하는 사후학습(post-training) 역량을 플랫폼에 내재화하는 결정적 포석이었습니다.

대표 고객사:

Cursor Notion Lovable Harvey HubSpot OpenEvidence Abridge Decagon Parallel Clay Mercor Writer

코딩 도구·생산성·법률·헬스케어·B2B SaaS 등 업종을 가로지르는 고객 포트폴리오는, 지능(intelligence)을 핵심 제품 경험으로 삼는 차세대 AI 네이티브 기업들이 Baseten을 추론 인프라의 표준으로 선택하고 있음을 보여줍니다.

💰
Section 03
투자 유치 히스토리

Baseten은 2022년 정식 출범 이후 약 4년간 누적 $20억 이상을 조달했으며, 특히 2025년 2월부터 2026년 6월까지 18개월 동안 Series C·D·E·F 네 차례의 라운드를 연속으로 클로징하는 이례적인 속도로 기업가치를 $8.25억에서 $130억까지 약 16배 끌어올렸습니다. 이는 추론 인프라 시장에 대한 투자자들의 강한 확신과, 매출·추론량의 폭발적 성장이 뒷받침된 결과입니다.

$13B2026.06 기준 기업가치
$2B+누적 총 조달액
18개월Series C~F 연속 클로징 기간
April 2022 — Seed + Series A
Greylock·South Park Commons 리드 — 정식 출범과 동시 발표
$20M (Seed $8M + Series A $12M)

2021년 비공개 베타를 거쳐 2022년 4월 정식 공개와 동시에 발표된 초기 라운드. Greylock과 South Park Commons Fund가 공동 리드한 $800만 시드와 Greylock이 리드한 $1,200만 Series A로 구성되었습니다. 당시 제품은 데이터 과학팀이 별도의 백엔드·프런트엔드 엔지니어 없이 머신러닝 모델을 프로덕션 애플리케이션으로 전환할 수 있도록 지원하는 로우코드 플랫폼이었습니다.

Greylock Partners (리드) South Park Commons Fund
March 2024 — Series B
IVP·Spark Capital 리드 — 생성형 AI 피벗 이후 첫 본격 성장 자금
$40M

IVP와 Spark Capital이 리드한 $4,000만 Series B. 생성형 AI·LLM 추론으로 사업 방향을 전환한 이후 처음으로 유치한 본격적인 성장 자금으로, 추론 스택 고도화와 초기 LLM 고객 기반 확보에 집중 투입되었습니다.

IVP (리드) Spark Capital (리드)
February 19, 2025 — Series C
IVP·Spark Capital 공동 리드, 기업가치 $8.25억 — 4배 이상 점프
$75M · Valuation $825M

기존 투자자 IVP·Spark Capital이 공동 리드하고, 01a(전 Twitter CEO Dick Costolo·전 Twitter COO Adam Bain이 설립한 펀드)가 신규 투자자로 참여한 라운드. 직전 라운드 대비 기업가치가 4배 이상 상승하며 추론 인프라 시장에 대한 투자 심리가 본격적으로 가속화되는 신호탄이 되었습니다.

IVP·Spark Capital (공동 리드) 01a (Dick Costolo·Adam Bain, 신규) Conviction · Greylock (기존)
September 5, 2025 — Series D
BOND 리드, 기업가치 $21.5억 — 6개월 만에 약 2.6배 증가
$150M · Valuation $2.15B

성장 단계 전문 투자사 BOND가 리드하고 CapitalG(Alphabet의 성장투자 부문)·Premji Invest·Scribble(전 Twitter CTO 출신 Kevin Weil·Elizabeth Weil 부부 펀드)가 신규 참여했습니다. 직전 Series C 대비 6개월 만에 기업가치가 약 2.6배 상승했으며, Abridge·Captions·Clay·OpenEvidence·Writer 등 대형 AI 네이티브 고객사의 매출 기여가 본격화된 시점입니다.

BOND (리드) CapitalG · Premji Invest · Scribble (신규) Conviction · 01a · IVP · Spark · Greylock (기존)
January 20, 2026 — Series E
IVP·CapitalG 공동 리드, NVIDIA 전략 투자 — 기업가치 $50억으로 4개월 내 2배 이상 급등
$300M · Valuation $5B

IVP와 CapitalG가 공동 리드한 라운드에 NVIDIA가 $1.5억을 투입하며 전략적 투자자로 참여했습니다. 직전 Series D 대비 단 4개월 만에 기업가치가 2배 이상 상승한 것으로, GPU 인프라 핵심 파트너인 NVIDIA의 직접 투자는 Baseten의 멀티클라우드·고성능 추론 최적화 역량에 대한 업계 최상위 기술 신뢰를 의미합니다. 같은 해 12월에는 Parsed 인수와 AWS 전략적 협력 계약이 후속 발표되었습니다.

IVP·CapitalG (공동 리드) NVIDIA ($150M, 전략적 투자) Altimeter · Battery Ventures · BOND · BoxGroup · Blackbird · Conviction · Greylock · 01A
June 22, 2026 (최신) — Series F
Altimeter·Conviction·Spark Capital 리드 — 기업가치 $130억, 18개월 4연속 펀딩 완성
$1.5B · Valuation $13B

라운드 구조: Altimeter Capital·Conviction Partners·Spark Capital이 리드하고 Sands Capital·Wellington Management가 공동 리드로 참여한 $15억 규모의 메가라운드. Battery Ventures·Blackbird·D.E. Shaw Ventures·Durable Capital Partners·Greylock·IVP·Verified Capital·01A 등 기존 투자자 다수가 추가 투입했습니다. 라운드는 $130억과 $110억 두 개 트랜치(tranche)로 구성되어 집행되었습니다.

성장 지표: 최근 1년간 매출 약 20배, 추론 처리량 약 40배 성장. 일일 추론 호출 10억 건 이상, 87개 글로벌 클러스터·18개 클라우드 운영. 이는 18개월 내 네 번째 펀딩 라운드로, 창업 6년 만에 누적 조달액이 $20억을 돌파한 것입니다.

자금 활용 계획: 컴퓨트 확보, 소프트웨어 고도화, 인재 영입(올해 임직원 수 3배 확대 목표)에 투입되며, 엔터프라이즈 영업 조직(GTM) 확장에도 집중 투자합니다.

Altimeter Capital · Conviction · Spark Capital (리드) Sands Capital · Wellington Management (공동 리드) Battery Ventures · Blackbird · D.E. Shaw Ventures · Durable Capital · Greylock · IVP · Verified Capital · 01A
📋 Series F 핵심 요약

조달액: $15억 (트랜치 2개 — $130억 / $110억 밸류에이션 기준)

리드 투자자: Altimeter Capital, Conviction Partners, Spark Capital

공동 리드: Sands Capital, Wellington Management — 이 중 Blackbird VC는 “역대 최대 규모 투자 약정”이라고 언급

창업 이후 누적 조달액: $20억 이상 (Seed~Series F 합산)

핵심 메시지: CEO Tuhin Srivastava — “AI의 미래는 수백만 개의 특화된 모델 위에 구축될 것이며, 이를 가장 빠르게 실현하는 기업들이 시간이 지날수록 복리로 가치가 쌓이는 시스템을 Baseten 위에 구축하고 있다”

🏆
Section 04
핵심 경쟁우위 요소

AI 추론 인프라 시장에는 Modal, Fireworks AI, Together AI, Replicate, Lambda와 같은 전문 스타트업뿐 아니라 AWS·Google Cloud·Microsoft Azure 등 하이퍼스케일러, Databricks와 같은 데이터 플랫폼 기업까지 다층적인 경쟁자가 존재합니다. 이러한 환경에서 Baseten의 차별화는 기술적 깊이, 인프라 구조, 사업 모델의 수직 통합, 그리고 고객 신뢰 네 가지 층위에서 형성됩니다.

추론 전문화에 따른 기술적 깊이 — 6년간 축적된 성능 최적화 노하우

Firecracker 기반 마이크로VM, 커스텀 커널, FP8·NVFP4 양자화, NVIDIA TensorRT-LLM·Dynamo 통합 등 추론 단계에만 특화된 심층 최적화 기술을 보유합니다. 20GB급 모델을 10초 이내에 콜드스타트하는 역량은 범용 클라우드 인프라로는 단기간에 복제하기 어려운 6년 이상의 누적 엔지니어링 자산입니다. NVIDIA가 Series E에 전략적으로 직접 투자한 것도 이 기술 신뢰를 뒷받침합니다.

🌐
자산 경량형 멀티클라우드 아키텍처 — 18개 클라우드 동시 운용

자체 GPU를 직접 보유하지 않고 18개 이상의 클라우드 제공사에 워크로드를 동적으로 배분하는 구조는 GPU 공급 부족 국면에서도 가용성을 확보하고, 특정 클라우드 벤더에 대한 종속을 제거합니다. 이는 단일 클라우드에 의존하는 경쟁사 대비 비용 효율성과 공급 안정성 모두에서 구조적 우위로 작동하며, 고객이 명시적으로 구매 이유로 꼽는 핵심 요소입니다.

🔁
추론→학습→사후학습 전 영역 수직 통합 — Parsed 인수로 완성된 플랫폼

오픈소스 패키징 도구 Truss, Training(파인튜닝), Frontier Gateway(멀티모델 운용), 그리고 2025년 12월 인수한 Parsed(강화학습 기반 사후학습)까지 결합해, 고객이 자체 데이터·평가·도메인 특화 환경으로 모델을 지속 개선하는 전 생애주기를 단일 플랫폼에서 지원합니다. 경쟁사 다수가 추론 또는 학습 한쪽에 집중하는 것과 달리, Baseten은 “자신의 지능을 소유하려는” 기업 수요 전체를 포착합니다.

🤝
최상위 AI 네이티브 고객군 + 포워드 디플로이드 엔지니어링

Cursor·Notion·Lovable·Harvey·HubSpot·OpenEvidence 등 자체 제품의 핵심이 AI 지능인 고빈도 사용 기업들이 핵심 고객층을 형성하며, 이들의 사업 자체가 폭발적으로 성장하면서 Baseten 매출도 동반 확장되는 구조입니다. Baseten의 연구자·엔지니어가 고객사에 직접 임베드되어 모델을 함께 최적화하는 방식은 단순 인프라 임대를 넘어선 깊은 파트너십 관계를 형성, 높은 고객 유지율의 기반이 됩니다.

리스크 요인: Baseten은 18개월간 4차례 연속 펀딩으로 기업가치가 16배 상승했지만, 이러한 급격한 밸류에이션 상승은 향후 매출 성장세가 둔화될 경우 가치 재평가 리스크를 동반합니다. AWS·Google Cloud·Microsoft Azure와 같은 하이퍼스케일러가 자체 추론 서비스를 강화하거나 가격을 공격적으로 낮출 경우 비용 경쟁력 방어가 핵심 과제로 부상할 수 있습니다. 또한 Modal($46.5억), Fireworks AI($40억), Together AI($75억) 등 경쟁사들도 유사한 속도로 대규모 자금을 조달하며 시장 점유율 경쟁이 가속화되고 있어, GPU 공급 제약 환경에서의 컴퓨트 확보 능력과 고객 기반의 다변화(특정 AI 네이티브 스타트업에 대한 매출 집중도 완화)가 중장기 지속 성장의 관전 포인트입니다.


댓글 남기기

글로벌 VC 메가딜 브리핑에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기