SarvamSarvam AI Pvt. Ltd. · India’s Sovereign AI Full-Stack Company · $1.5B Unicorn 2026
IIT 출신의 두 AI 연구자가 인도의 22개 공용어를 위한 AI 인프라를 처음부터 구축하겠다는 결심으로 설립한 기업 — 창립 3년 만에 인도 정부로부터 국가 Sovereign LLM 개발 기업으로 선정되고, HCLTech 리드 $2억 3,400만 투자로 기업가치 $15억의 유니콘에 등극하며 인도 AI 주권의 핵심 인프라 기업으로 부상했다
Sarvam AI는 2023년 8월 인도 뱅갈루루에서 Dr. Vivek Raghavan과 Dr. Pratyush Kumar가 공동 창립한 AI 연구·제품 기업입니다. 두 창업자는 인도공과대학(IIT) 출신으로, 인도어 AI 오픈소스 이니셔티브 AI4Bharat에서 함께 활동하며 인도 언어 AI의 구조적 공백을 직접 목격했습니다. Sarvam은 산스크리트어로 ‘모두(All)’를 의미합니다. 모든 인도 시민이 자신의 언어로 AI의 혜택을 누릴 수 있어야 한다는 원칙이 사명 자체에 내재되어 있습니다.
IIT 델리 전기전자공학과 졸업 후 카네기멜론대학교(Carnegie Mellon University)에서 전기·컴퓨터공학 석사·박사 학위를 취득했습니다. 졸업 직후 학계나 대기업 대신 창업의 길을 선택해 Magma Design Automation 부사장으로서 전자설계자동화(EDA) 분야에서 약 20년간 경력을 쌓았으며, 복수의 EDA 기업을 창업했습니다. 이후 인도로 귀국해 인도 고유 식별 번호(Aadhaar) 시스템의 생체정보 인프라 구축에 12년간 자원봉사 형태로 기여하며 13억 인구 규모의 디지털 공공 인프라 설계 역량을 축적했습니다. EkStep Foundation과 Khosla Labs에서 대규모 디지털 플랫폼 구축에 기여했으며, 인도 국가 언어 번역 미션(Bhashini)의 자문, GSTN 사기 탐지 AI 모델, 인도 대법원 SUVAS 판결문 번역 시스템을 주도했습니다. AI4Bharat에서 수석 멘토로 활동하며 인도어 AI 오픈 데이터셋·모델 구축을 이끌었고, Sarvam에서는 인도 디지털 공공 인프라 경험을 AI로 확장하는 핵심 역할을 담당합니다.
IIT 봄베이에서 전기전자공학 학사를 마치고 스위스 연방공과대학교(ETH Zurich)에서 컴퓨터공학 박사(2014) 학위를 취득했습니다. 졸업 후 IBM Research 연구 과학자로 첨단 AI·컴퓨팅 프로젝트를 주도하고, 이후 Microsoft Research에서 2년간 연구활동을 이어갔습니다. 2018년부터 IIT 마드라스에서 교수로 재직하며 인도어 AI의 학문적 토대를 마련했습니다. AI4Bharat의 공동 창립자로서 인도어 오픈소스 AI 데이터셋·모델 구축을 이끌었으며, AI 교육·컨설팅 기업 One Fourth Labs도 공동 창립했습니다. Sarvam에서는 CEO로서 모델 연구·제품 개발·전사 전략을 총괄하며, 대규모 다국어 AI 시스템의 기술 방향성을 지휘합니다.
인도는 영어를 일상 언어로 사용하는 인구가 전체의 10% 미만에 불과합니다. ChatGPT 등 글로벌 AI 모델들이 인도 시장을 빠르게 침투했지만, 힌디어·타밀어·텔루구어·벵골어 등 인도 22개 공용어를 진정한 의미에서 이해하고 생성할 수 있는 모델은 사실상 전무한 상황이었습니다. Raghavan과 Kumar는 AI4Bharat에서 인도어 데이터셋을 구축하며 이 공백의 깊이를 누구보다 정확히 파악했습니다. 단순히 영어 모델을 파인튜닝하는 수준으로는 해결되지 않으며, 인도어 특화 토크나이저·데이터·아키텍처를 처음부터 설계해야 한다는 결론이 Sarvam 창립의 출발점이었습니다.
“Our ambition is to diffuse this technology widely in India, creating significant value across sectors for citizens, small businesses, enterprises, and state and central governments. We are positioned to both help them adopt and innovate on AI.”
Sarvam AI는 인도어 특화 풀스택(Full-Stack) AI 기업으로, 기반 모델(Foundation Models) 연구부터 추론 인프라(Inference Infrastructure), 기업용 API, 음성·문서·비전 AI 애플리케이션까지 수직 통합된 플랫폼을 운영합니다. 인도 정부는 2025년 4월 IndiaAI Mission 하에 Sarvam을 인도 최초 Sovereign LLM 개발 기업으로 공식 선정했습니다. 2025년 2월에는 창업 이후 처음 실시한 “14일 14개 제품 출시” 캠페인을 통해 30B·105B 파라미터 기반 모델 2종을 공개하며 기술 리더십을 입증했습니다.
핵심 기반 모델 포트폴리오 — Sarvam의 3계층 Sovereign LLM 전략:
1,050억 파라미터의 Mixture-of-Experts(MoE) 아키텍처 기반 플래그십 모델로, 토큰당 약 90억 파라미터가 활성화됩니다. 컨텍스트 윈도우 12만 8천 토큰, 인도어에 최적화된 자체 토크나이저를 적용해 GPT-4 대비 인도어 처리 효율이 2~4배 높습니다. 복잡한 추론·기업 애플리케이션·정부 핵심 시스템용으로 설계되었으며, IndiaAI Mission의 Sovereign LLM 핵심 인프라로 채택됩니다.
300억 파라미터 경량 모델로 약 16조 토큰 학습. 컨텍스트 길이 3만 2천 토큰. 실시간 음성 인터페이스·대화형 서비스·에이전트 태스크 등 낮은 지연시간(Low-Latency)이 요구되는 인터랙티브 애플리케이션에 최적화됩니다. Sarvam Cloud를 통해 기업·개발자가 비용 효율적으로 API 형태로 이용 가능합니다.
인터넷 연결이 불안정한 농촌·티어3 지역을 위해 온디바이스에서 직접 구동되는 초경량 모델. 클라우드 의존성을 제거해 개인정보 보호와 오프라인 가용성을 동시에 확보합니다. 인도의 디지털 포용 정책인 Digital India 와 궤를 같이 하는 전략적 모델입니다.
응용 AI 제품 스택 — 기반 모델에서 도메인별 솔루션까지:
Saaras는 코드 믹스(Code-Mixed) 및 잡음 환경에 강건한 인도어 자동음성인식(ASR) 엔진으로, IndicVoices 벤치마크에서 최상위 성능을 기록합니다. Bulbul은 22개 공용어 기반 39가지 문화적으로 자연스러운 음성을 제공하는 TTS 엔진으로, 은행·통신사의 자동화 고객 응대에 인간적 인터랙션을 구현합니다. 월간 50만 시간 이상의 오디오를 처리합니다.
Sarvam Vision 모델을 기반으로 토지 대장·손으로 쓴 은행 서류·법원 판결문 등 비정형 인도어 문서를 자동 분석·구조화합니다. 월간 3,500만 페이지 이상의 문서를 디지털화하며, 인도 정부의 레거시 기록 현대화 프로젝트에 핵심 인프라로 채택되고 있습니다.
인도 헌법상 22개 지정 공용어 간 번역을 지원하는 특화 번역 엔진. 단순 텍스트 번역을 넘어 구조화 문서·법률 용어·공문서 형식을 맥락적으로 처리합니다. 대법원 SUVAS 시스템 등 정부 공식 사용이 확대되고 있으며, 인도어 AI 역사상 가장 넓은 언어 커버리지를 제공합니다.
인도 일반 시민을 위한 음성 우선(Voice-First) 대화형 AI 앱. 다국어 음성 인터페이스로 영어에 익숙하지 않은 사용자도 AI 서비스를 이용할 수 있습니다. 개인 사용자에게 무료로 제공되며, 기업용 에이전트 플랫폼(B2B) 확장의 데이터 기반이자 에코시스템 확산의 소비자 접점으로 기능합니다.
정부·기업 대형 레퍼런스 배포 현황:
다국어 음성 에이전트를 통해 인도 농림축산식품부의 데이터 수집 캠페인을 지원, 17개 주 1,700만 명의 농민 데이터를 음성으로 확보
대형 보험사의 전국 음성 캠페인에 다국어 AI 플랫폼을 제공, 4,500만 보험 계약자의 보험 갱신 안내 및 지원 수행
인도 최대 핀테크 기업의 영업 지원 에이전트 플랫폼으로 채택되어 35만 명의 영업 인력을 AI로 보조하는 인프라 구축
Sarvam AI는 2023년 8월 창립 후 불과 4개월 만에 인도 역사상 가장 큰 규모의 AI 시드·Series A 복합 라운드($4,100만)를 유치하며 시장의 주목을 받았습니다. 이후 2025년 인도 정부의 Sovereign LLM 파트너로 선정되면서 기술 검증을 완료했고, 2026년 6월 HCLTech 리드의 $2억 3,400만 Series B를 통해 기업가치 $15억의 유니콘으로 등극했습니다. 초기 VC 중심 구조에서 전략적 산업 자본(HCLTech)이 리드하는 구조로의 전환은 Sarvam의 상업화 단계 진입을 공식화하는 이정표입니다.
Lightspeed Venture Partners가 리드하고 Peak XV Partners(前 Sequoia India)와 Khosla Ventures가 공동 참여한 복합 라운드입니다. Peak XV는 시드 라운드에서 1주일 이내에 투자 결정을 내렸으며, “Vivek과 Pratyush가 이끄는 Sarvam 팀은 인도에서 등장한 가장 높은 수준의 AI 팀 중 하나”라고 평가했습니다. 당시 임직원 18명의 초기 스타트업으로서 인도어 LLM 구축, 음성 우선 인터페이스, 기업용 플랫폼 개발에 자금을 집중 투입했습니다. 이 라운드는 인도 AI 스타트업 생태계에서 새로운 기준점을 수립했다는 평가를 받습니다.
인도 전자정보기술부(MeitY)가 주관하는 IndiaAI Mission이 Sarvam을 인도 최초 Sovereign LLM 개발 기업으로 공식 선정했습니다. Sarvam은 이 선정을 통해 정부의 GPU 클러스터와 컴퓨팅 인프라에 접근할 권한을 확보했으며, 상업적 자금으로는 충당이 어려운 대규모 사전 학습(Pretraining) 비용 부담을 크게 줄일 수 있었습니다. 이는 기술 신뢰성의 공식 검증이자, 인도 정부 및 공공 부문 수요를 선점하는 전략적 계기가 되었습니다. 개발될 Sovereign LLM은 추론 능력, 음성 우선 설계, 인도어 유창성을 핵심 특성으로 하며, 인도 전역의 안전하고 대규모적인 공공 배포를 목표로 합니다.
HCLTech(HCL그룹 IT 서비스 계열사)가 $1억 5,000만을 투자하며 전략적 리드 투자자로 참여한 Series B입니다. Bessemer Venture Partners가 신규 투자자로 참여하고, 기존 주주인 Khosla Ventures와 Peak XV Partners가 재참여했습니다. 현 라운드에서 $2억 3,400만을 확정했으며, 총 $3억 달성을 목표로 추가 클로징이 진행 중입니다.
HCLTech 전략적 파트너십의 의미: 단순 재무 투자를 초월하는 사업 통합 파트너십입니다. Sarvam의 AI 모델과 HCLTech의 기업 고객 관계(Engineering Workforce + Software Assets + Enterprise Relationships)를 결합해 기업·정부용 AI 제품을 공동 개발·배포하는 구조입니다. HCLTech는 인도 최대 IT 서비스 기업 중 하나로, 이번 투자는 Sarvam의 상업화를 대폭 가속화할 수 있는 즉각적인 기업 채택 채널을 제공합니다.
AI 주권 맥락: 이번 투자 발표 직전, 미국 정부의 명령으로 Anthropic이 자국 최첨단 모델에 대한 외국인 접근을 차단하는 사건이 발생해 인도 내 AI 주권 논의가 급격히 고조됐습니다. Sarvam의 $15억 유니콘 달성은 이러한 지정학적 맥락에서 더욱 강력한 상징성을 가집니다.
Sarvam의 경쟁 방어력은 인도어 특화 데이터·아키텍처에서 비롯된 기술적 효율성 우위, 인도 정부와의 Sovereign LLM 파트너십이 제공하는 규제·조달 선점, HCLTech와의 전략 제휴를 통한 엔터프라이즈 채널, 그리고 AI4Bharat에서 축적한 인도어 AI 데이터 자산의 네 가지 층위에서 형성됩니다. 이는 글로벌 빅테크가 단순히 자본과 컴퓨팅 자원만으로는 쉽게 복제할 수 없는 복합적 해자(Moat)입니다.
GPT-4 등 글로벌 모델은 영어 최적화 토크나이저를 사용해 인도 문자를 처리할 때 토큰을 비효율적으로 소비합니다. Sarvam은 인도어 전용 토크나이저를 처음부터 설계해 동일 텍스트를 4~8배 적은 토큰으로 처리합니다. 이는 추론 비용의 직접적 절감이자 컨텍스트 효율의 구조적 우위입니다. AI4Bharat에서 구축한 “Sarvam 2T” — 10개 인도어·영어 약 2조 토큰 규모의 인도어 특화 사전학습 코퍼스 — 는 경쟁사가 단기 복제하기 어려운 데이터 해자입니다.
인도 정부(MeitY)의 IndiaAI Mission이 Sarvam을 Sovereign LLM 개발 기업으로 공식 선정함으로써, 정부·공공 부문 AI 조달에서 사실상 독점적 우선 지위를 확보했습니다. 정부 GPU 클러스터 접근권은 막대한 사전학습 비용을 정부가 사실상 보조하는 구조입니다. 인도 대법원 SUVAS, 농림부 데이터 수집, 각종 정부 디지털화 사업의 공식 파트너로서 공공 부문 레퍼런스가 누적되고 있으며, 이는 민간 경쟁사는 물론 글로벌 AI 기업도 단기 진입이 불가능한 포지션입니다.
$1억 5,000만을 투자한 HCLTech는 단순 재무 투자자가 아닌 AI 제품 공동 개발·배포 파트너입니다. HCLTech의 글로벌 기업 고객 네트워크, 수십만 명의 소프트웨어 엔지니어링 인력, 기존 소프트웨어 자산과 Sarvam의 AI 모델을 결합해 기업·정부용 AI 솔루션을 구축하는 구조입니다. Sarvam 단독으로는 수년이 소요될 엔터프라이즈 채널 구축을 HCLTech 파트너십으로 사실상 즉시 확보한 셈입니다.
기반 모델(Foundation Models) → 추론 인프라(Inference) → 음성·문서·비전 AI → 에이전트 플랫폼 → 소비자 앱(Indus)까지 전 계층을 자체 보유한 인도 유일의 풀스택 AI 기업입니다. UPI가 수백 개의 핀테크 앱이 구축되는 결제 레일을 제공했듯, Sarvam은 인도의 다음 세대 AI 제품이 구축될 AI 인프라 레이어를 지향합니다. 각 계층의 긴밀한 통합은 글로벌 API에 의존하는 단순 래퍼(Wrapper) 기업이 복제할 수 없는 제품 품질과 비용 효율을 동시에 제공합니다.
$2억 3,400만 Series B를 기반으로 Sarvam은 차세대 에이전틱·코딩·사이버보안 AI 모델 연구와 추론 인프라 확장, 산업별 배포 가속화를 동시에 추진합니다. 인도의 14억 인구, 22개 공용어, 빠르게 성장하는 디지털 경제는 Sarvam이 타깃하는 세계 최대 AI 단일 시장의 조건입니다. 미국과 중국이 AI 패권을 다투는 지정학적 환경에서, 인도 고유의 AI 주권 인프라를 보유하는 것은 국가 안보이자 경제 주권의 문제가 되었습니다. Sarvam은 그 인프라를 구축하는 기업으로 자리매김하고 있습니다.

