트웰브랩스, Series B $100M


TwelveLabs 기업 분석
Deep Dive · AI / Video Intelligence Analysis

TwelveLabs

비디오를 텍스트가 아닌 고유의 신호로 이해하는 비디오 네이티브 파운데이션 모델 기업 — 창업 5년 만에 NEA·NAVER Ventures가 공동 주도하고 Amazon이 참여한 시리즈 B $1억 조달에 성공하며 ‘비디오 초지능(Video Superintelligence)’ 로드맵을 본격화하다

$100M 시리즈 B 조달액 (2026.07)
$207M+ 누적 총 조달액
30,000+ 누적 개발자 사용자 수
2021 설립연도 (San Francisco)
👤
Section 01
창업자 배경 및 설립 스토리

TwelveLabs(법인명: Twelve Labs, Inc.)는 2021년 1월 미국 샌프란시스코에서 설립된 비디오 특화 멀티모달 AI 기업입니다. 텍스트·이미지 중심으로 발전해온 생성형 AI 산업에서 상대적으로 연구가 뒤처져 있던 ‘비디오 이해(video understanding)’ 영역에 처음부터 전용 파운데이션 모델을 구축한다는 독자적 노선을 택해, 5년 만에 아마존·NEA·네이버벤처스 등 글로벌 자본의 신뢰를 확보한 대표적 비디오 AI 기업으로 성장했습니다. 본사는 샌프란시스코 베이 에어리어에 있으며, 서울에 APAC 오피스를 운영 중입니다.

👨‍💻
Jae Lee (이재)
Co-Founder & Chief Executive Officer

서울 출생. 이후 미국으로 이주해 필립스 엑시터 아카데미(Phillips Exeter Academy, 2009–2013)를 거쳐 UC 버클리에서 컴퓨터공학을 전공(2013–2017)했습니다. 창업 이전에는 대한민국 국방부 사이버작전사령부(Cyber Operations Command) 소속으로 병역을 수행하며 리드 데이터 사이언티스트로서 국가 단위 과제에 머신러닝을 적용한 이력을 보유하고 있으며, 이 시기의 경험이 비디오 이해 기술에 대한 문제의식으로 이어졌습니다. 아마존·삼성전자에서 소프트웨어 엔지니어링 인턴으로도 근무했습니다. 병역 중 사이버 부대 동료들과 AI에 대한 논의를 이어가던 중, 텍스트·이미지 처리에는 업계의 관심이 집중된 반면 빠르게 증가하는 데이터 유형인 비디오 이해는 상대적으로 연구가 부족하다는 공백을 포착했고, 이것이 2021년 TwelveLabs 창업의 직접적 계기가 되었습니다. 현재 대한민국 생성형 AI 기업 협의체(파운데이션 모델 협의체) 이사로도 활동하며 삼성·SK·LG 등 한국 주요 그룹과의 협력을 조율하고 있습니다.

Aiden Lee
Co-Founder & CTO

TwelveLabs의 기술 아키텍처 전반을 총괄하며 핵심 파운데이션 모델인 Marengo·Pegasus의 연구 개발을 주도합니다. 비디오 이해 및 비디오 파운데이션 모델 연구가 전문 분야로, 서울을 거점으로 글로벌 연구 조직을 이끌고 있습니다.

Soyoung Lee
Co-Founder & Head of Business Development

고려대학교 출신으로 한국·미국 주요 테크 기업에서 소프트웨어 엔지니어링 경력을 쌓았습니다. 엔터프라이즈 성장 전략과 전략적 파트너십 구축을 주도하며, TwelveLabs의 GTM(Go-to-Market) 조직의 핵심 축을 담당하고 있습니다.

Dave Chung
Co-Founder & COO, GTM Asia-Pacific

연세대학교 출신. 회사 운영 전반과 아시아·태평양 지역 사업 확장을 담당하며, UNICEF 한국위원회 등 한국 내 주요 고객 프로젝트를 직접 이끌고 있습니다.

Sungjun Kim (SJ Kim)
Co-Founder & Head of Engineering

대규모 비디오 인덱싱·검색 인프라의 엔지니어링 조직을 총괄합니다. 수백만 시간 분량의 비디오를 안정적으로 처리·서빙하는 스케일러블 시스템 구축을 담당하며 팀 전반의 기술 실행력을 뒷받침합니다.

🎬
Section 02
사업 현황 및 제품 포트폴리오

TwelveLabs는 비디오를 프레임 단위 메타데이터나 자막으로 환원하지 않고, 시각·음성·발화·화면 텍스트 신호를 하나의 통합된 표현으로 인식하는 ‘비디오 인지 시스템(Video Cognition System)’을 핵심 기술 기반으로 삼고 있습니다. 이 시스템은 지각(Perception)·기억(Memory)·추론(Reasoning) 세 요소가 상호 작용하는 구조로 설계되어 있으며, 비디오 아카이브를 수동적인 저장소가 아니라 특정 초 단위까지 주소 지정이 가능한 ‘기계가독 메모리’로 전환하는 것을 목표로 합니다. 2026년 5월 기준 전사 임직원은 192명이며, 샌프란시스코·서울 듀얼 허브 체제에 더해 시리즈 B 조달을 계기로 뉴욕·런던에 신규 오피스를 개설할 예정입니다.

30,000+ 누적 개발자 사용자 수
192명 전사 임직원 (2026.05 기준)
4개 도시 SF·서울·뉴욕·런던 거점
95% UNICEF 한국위원회 검색시간 단축률

핵심 파운데이션 모델 및 제품 라인업:

🧠
Marengo
멀티모달 임베딩 모델

시각·음성·발화·화면 텍스트 신호를 하나의 검색 가능한 표현 공간으로 매핑하는 임베딩 모델입니다. 2025년 12월 출시된 Marengo 3.0은 멀티 벡터(multi-vector) 방식을 새롭게 적용해 텍스트·이미지·비디오 간 any-to-any 검색 정확도를 크게 끌어올렸으며, Amazon Bedrock을 통해서도 배포되고 있습니다.

💬
Pegasus
비디오-언어 생성 모델

Marengo가 생성한 표현을 근거로 삼아, 비디오 내용에 기반한 설명·답변·요약을 생성하는 비디오-투-텍스트 모델입니다. 자연어 질의응답, 챕터 자동 생성, 하이라이트 추출, 구조화된 메타데이터(JSON) 출력 등 다운스트림 워크플로를 지원합니다.

🔎
Embed · Search · Analyze
API & Playground

개발자용 API와 인터랙티브 Playground를 통해 임베딩(Embed)·검색(Search)·분석(Analyze) 세 가지 핵심 기능을 사용량 기반 과금으로 제공합니다. 최초 인덱싱은 무료로 제공되며, 자체 데이터로 모델을 파인튜닝할 수 있는 커스터마이징 옵션도 지원합니다.

비디오 인지 시스템의 3단계 구조: ① 지각 — Marengo가 원시 비디오를 텍스트로 조기 환원하지 않고 의미 있는 표현으로 변환. ② 기억 — 비디오가 시스템에 유입되는 순간 한 번 이해된 뒤 영구적 표현으로 변환되어 특정 파일의 특정 초 단위까지 주소 지정이 가능한 상태로 보관. ③ 추론 — 단일 클립이 아니라 수백 건의 방송·시즌 전체에 분산된 패턴을 비교·검색해 근거 기반 결론을 도출. TwelveLabs는 이 구조를 단순한 모델 데모가 아닌, 비디오를 연산 가능한 데이터로 전환하는 아키텍처로 규정하고 있습니다.

배포 채널 및 생태계 파트너십: TwelveLabs 모델은 Amazon Bedrock에 정식 통합되어 있으며, Databricks의 Mosaic AI Vector Search, Snowflake의 Cortex AI에도 임베딩 서비스로 연동되어 있습니다. 초기 연구 단계부터 Oracle Cloud와 다년 파트너십을 맺고 NVIDIA H100·L40S GPU 기반 인프라를 확보했으며, 2026년 2월에는 한국 기업 중 최초로 AWS를 통해 NVIDIA Blackwell Ultra B300을 프로덕션에 도입했습니다. 이 외에도 LG CNS(2025.07, AI 비디오 솔루션 공동 개발), VAST Data(2026.02, 퍼블릭 클라우드 밖 고객 자체관리형 배포 모델 확장) 등과 파트너십을 체결했으며, Mimir·Iconik·Adobe 등 주요 미디어 자산관리(MAM) 솔루션 기업들과도 생태계 통합을 진행하고 있습니다.

대표 고객 사례 — UNICEF 한국위원회 미디어 아카이브 전환(2026.04): 수십 년간 축적된 8TB 이상의 사진·영상 자산이 개별 PC와 NAS에 흩어져 있던 UNICEF 한국위원회의 아카이브를 AWS S3로 이전하고 TwelveLabs의 비디오 네이티브 AI로 전면 색인화했습니다. “아프리카 현장에서 물을 긷는 아이들”과 같은 자연어 질의로 정확한 타임스탬프까지 즉시 검색이 가능해졌으며, 그 결과 검색 소요 시간이 약 95% 단축되었습니다. 이는 TwelveLabs의 첫 비영리 부문 배포 사례로, 미디어·엔터프라이즈를 넘어 대규모 미션크리티컬 아카이브를 보유한 조직 전반으로 사업 영역이 확장되고 있음을 보여줍니다. SBS 등 한국 주요 방송사의 콘텐츠 아카이브 재활용 프로젝트도 유사한 구조로 진행되고 있습니다.

☁️
Amazon Bedrock 정식 통합
AWS AI Competency 획득
🏛️
In-Q-Tel 전략적 투자
美 정보기관 벤처 자금 — 공공·안보 부문 신뢰 자산
🏆
CB Insights AI 100
3년 연속 선정 (Fast Company 혁신기업 동시 선정)
💰
Section 03
투자 유치 히스토리

TwelveLabs는 2021년 창업 이후 시드 → 시드 확장 → 시리즈 A → 전략 라운드 → 시리즈 B에 이르는 5차례의 조달을 통해 누적 $2억 700만 이상을 확보했습니다. 초기에는 Index Ventures·Radical Ventures 등 딥테크 전문 VC가 시드 단계를 이끌었고, 2024년 시리즈 A부터는 NEA와 NVIDIA의 NVentures가 가세하며 기관 자금의 본격적인 유입이 시작되었습니다. 2024년 말 전략 라운드에서는 Databricks·Snowflake·SK텔레콤 등 인프라·통신 기업들이 사업 파트너십과 결합된 전략적 투자자로 참여했으며, 2026년 시리즈 B에서는 NEA와 네이버벤처스가 공동 리드하고 아마존이 직접 참여하면서 미국 하이퍼스케일러와 한국 전략자본이 동시에 결합하는 독특한 자본 구조를 완성했습니다.

2021년 1월
TwelveLabs 창업 — 비디오 파운데이션 모델 개발 착수
창업 자본 (비공개)

Jae Lee가 Aiden Lee, Soyoung Lee, Dave Chung, Sungjun Kim과 공동으로 샌프란시스코에서 창업. Oracle과 다년 클라우드 파트너십을 체결해 초기 모델 학습에 필요한 GPU 인프라를 확보하고, 멀티빌리언 파라미터급 비디오 파운데이션 모델 개발에 착수했습니다.

2022년 3월
시드 라운드 — Index Ventures · Radical Ventures 주도
$5M

Index Ventures가 초기 시드를 리드하고 Radical Ventures가 공동 참여하며 최초의 기관 투자를 유치했습니다. 클로즈드 베타 단계에서 비디오의 시각·음성·텍스트·발화 맥락을 추출해 관계를 파악하는 초기 플랫폼을 검증하는 데 자금이 사용되었습니다.

Index Ventures Radical Ventures
2022년 12월
시드 확장 라운드 — Radical Ventures 리드, 누적 시드 $17M
$12M

Radical Ventures가 리드하고 Index Ventures가 재참여했으며, Jeffrey Katzenberg의 WndrCo와 Spring Ventures가 신규 투자자로 합류했습니다. Algolia 창업자 Nicolas Dessaigne, Weights & Biases CEO Lukas Biewald 등 업계 저명 엔젤도 참여했습니다. Radical Ventures 파트너 Rob Toews가 이사회에 합류했으며, 6개월 만에 검색 알고리즘 정확도를 2배 이상 끌어올린 기술적 진전을 기반으로 수십억 파라미터급 비디오 전용 파운데이션 모델 개발을 본격화했습니다.

Radical Ventures (리드) Index Ventures (재참여) WndrCo (Jeffrey Katzenberg) Spring Ventures
2024년 6월
시리즈 A — NEA · NVIDIA NVentures 공동 리드, 누적 약 $77M
$50M

New Enterprise Associates(NEA)와 NVIDIA의 벤처 자회사 NVentures가 공동으로 리드한 첫 대형 기관 라운드입니다. 기존 투자자 Index Ventures·Radical Ventures·WndrCo·Korea Investment Partners가 모두 재참여했습니다. NVIDIA H100·L40S GPU와 Triton Inference Server·TensorRT 등 NVIDIA 인프라를 플랫폼에 폭넓게 통합했으며, 조달 자금은 R&D 확대와 함께 연말까지 50명 이상을 신규 채용해 인력을 거의 2배로 확대하는 데 투입되었습니다.

New Enterprise Associates (공동 리드) NVIDIA NVentures (공동 리드) Index Ventures · Radical Ventures · WndrCo · Korea Investment Partners
2024년 12월
전략적 투자 라운드 — Databricks·SK텔레콤·Snowflake 등 인프라 기업 결집, 누적 $107M
$30M

세계적 데이터·인프라 기업인 Databricks, Snowflake Ventures와 국내 통신사 SK텔레콤, 그리고 HubSpot Ventures·In-Q-Tel(IQT)이 각각 전략적 투자자로 참여했습니다. Databricks는 Mosaic AI Vector Search에, Snowflake는 Cortex AI에 TwelveLabs의 임베딩 서비스를 통합하는 협업을 동시에 발표했으며, SK텔레콤은 차세대 AI 서비스 공동 개발을 추진했습니다. 이 라운드와 함께 전 SK텔레콤 CTO이자 Apple Siri 개발을 이끈 Yoon Kim 박사를 President 겸 Chief Strategy Officer로 영입하며 글로벌 엔터프라이즈 시장 공략을 강화했습니다.

Databricks Snowflake Ventures SK텔레콤 HubSpot Ventures In-Q-Tel (IQT)
2026년 7월 1일 (최신) — 시리즈 B
NEA · NAVER Ventures 공동 리드, Amazon 참여 — 누적 $207M+, AWS Trainium 다년 전용 계약 체결
$100M

라운드 구조: NEA와 NAVER Ventures가 공동으로 리드했으며, Amazon과 기존 투자자 Radical Ventures·Index Ventures·Korea Investment Partners에 더해 Quadrille Capital·Red Bull Ventures가 신규로 참여했습니다. NAVER Ventures에게는 창업 후 첫 투자였던 관계를 시리즈 B 공동 리드로 확대한 것으로, 한국 대기업 자본의 신뢰가 한층 깊어졌음을 보여줍니다.

전략적 의의: Amazon의 클라우드 부문 AWS는 이번 투자와 함께 TwelveLabs의 연산 워크로드를 자체 개발 AI 반도체인 Trainium 칩 기반으로 호스팅하는 다년 계약을 체결했으며, 신규 모델을 Amazon Bedrock을 통해 개발자에게 제공하기로 했습니다. 조달 자금은 샌프란시스코·서울 양 거점의 연구개발 투자와 함께, 글로벌 고객 대응을 위한 뉴욕·런던 신규 오피스 개설에 투입될 예정입니다.

포지셔닝 전환: 이번 라운드를 계기로 TwelveLabs는 단순 비디오 이해 모델 기업에서, 지각·지식·추론을 하나의 아키텍처로 결합한 완전한 형태의 에이전틱 비디오 인텔리전스 시스템 기업으로 사업 범위를 확장한다고 밝혔습니다.

New Enterprise Associates (공동 리드) NAVER Ventures (공동 리드) Amazon (AWS Trainium 다년 계약) Radical Ventures · Index Ventures · Korea Investment Partners Quadrille Capital · Red Bull Ventures (신규)
🌐
한미 이중 전략자본 구조 — 하이퍼스케일러와 한국 대기업 자본의 동시 결합

TwelveLabs의 투자자 명단은 NEA·Amazon·Radical Ventures·Index Ventures 등 미국 벤처·빅테크 자본과, NAVER Ventures·SK텔레콤·삼성·한국투자파트너스 등 한국 전략자본이 동시에 결집되어 있다는 점에서 이례적입니다. 여기에 “오징어게임” 황동혁 감독의 Firstman Studio(2025.10, $3M)와 In-Q-Tel(미 정보기관 연계 벤처 자금) 같은 이색 전략적 투자자까지 더해지며, 미디어·엔터테인먼트부터 공공·안보 영역까지 폭넓은 전략적 네트워크를 확보하고 있습니다.

🏆
Section 04
핵심 경쟁우위 요소

TwelveLabs의 경쟁 방어력은 프레임 샘플링이나 캡션에 의존하는 범용 멀티모달 모델과 구조적으로 차별화된 비디오 네이티브 아키텍처, 단일 클라우드에 종속되지 않는 하이퍼스케일러 교차 통합, 공공·국방 부문에서 확보한 신뢰 자산, 그리고 미국과 한국의 전략자본을 동시에 결합한 이중 성장 엔진에서 비롯됩니다.

🧬
비디오 네이티브 파운데이션 모델 아키텍처 — Marengo·Pegasus 이원 구조

Google Gemini와 같은 범용 멀티모달 모델이나 Google Cloud Video AI·AWS Rekognition·Azure Video Indexer 같은 프레임 단위 메타데이터 추출 도구와 달리, TwelveLabs는 창업 초기부터 3년 이상을 투자해 비디오 고유의 표현을 학습하는 임베딩 모델(Marengo)과 생성 모델(Pegasus)을 처음부터 구축했습니다. 비디오를 질의 시점에만 훑어보는 ‘일시적 검사’가 아니라, 유입 시점에 영구적으로 이해·색인해 특정 초 단위까지 주소 지정이 가능한 기계가독 메모리로 전환하는 구조는 경쟁사가 단기간에 재현하기 어려운 근본적 기술 격차입니다.

☁️
하이퍼스케일러 교차 통합을 통한 유통 해자

Amazon Bedrock, Databricks Mosaic AI Vector Search, Snowflake Cortex AI, Oracle Cloud 등 복수의 클라우드·데이터 플랫폼에 임베딩 서비스로 통합되어 있어, 특정 클라우드에 종속되지 않고 광범위한 엔터프라이즈 채널에 접근할 수 있습니다. 2026년 시리즈 B와 함께 체결한 AWS Trainium 칩 기반 다년 전용 호스팅 계약은 이 유통 구조를 한층 더 심화시켰으며, 자체 영업 조직만으로는 도달하기 어려운 규모의 개발자·엔터프라이즈 채널을 확보하게 합니다.

🛡️
공공·국방 부문 신뢰 자산 — In-Q-Tel 투자와 창업팀의 군 경력

CEO Jae Lee를 비롯한 창업팀의 대한민국 국방부 사이버작전사령부 근무 이력, 그리고 미 정보기관과 연계된 벤처 자금 In-Q-Tel의 전략적 투자는 정부·공공기관 고객 확보에 있어 일반 AI 스타트업이 쉽게 확보하기 어려운 신뢰 기반을 제공합니다. 지방자치단체의 실시간 위협 탐지·긴급대응 시간 단축·교통관리 등 미션크리티컬 공공 프로젝트로 사업 영역이 확대되고 있으며, UNICEF 한국위원회 사례를 통해 비영리·공공 부문으로도 성공적으로 진출했습니다.

🌏
한미 이중 전략자본과 서울-샌프란시스코 듀얼 허브 구조

NEA·Amazon·Radical Ventures·Index Ventures 등 미국 자본과 NAVER Ventures·SK텔레콤·삼성·한국투자파트너스 등 한국 전략자본을 동시에 주주 기반으로 확보한 것은 경쟁사 대비 뚜렷한 차별점입니다. 창업자가 이사로 있는 대한민국 파운데이션 모델 협의체를 통해 삼성·SK·LG 등 한국 대기업 AI 생태계에 직접 접근하는 동시에, 미국 하이퍼스케일러·엔터프라이즈 시장에도 동일한 강도로 침투할 수 있는 구조적 우위를 보유하고 있습니다.

차세대 성장 동력 — 완전한 에이전틱 비디오 인텔리전스 시스템으로의 확장: TwelveLabs는 비디오 이해 모델 제공에서 나아가, 지각·기억·추론을 하나의 아키텍처로 결합한 완전한 에이전틱 비디오 인텔리전스 시스템 구축을 다음 단계 로드맵으로 제시하고 있습니다. 현재 강점을 보이는 미디어·엔터테인먼트(스포츠 리그, 영화 제작사, 대형 콘텐츠 크리에이터) 영역을 기반으로, 광고·보안·스포츠·자동차 등으로 버티컬을 확장하는 동시에 뉴욕·런던 신규 오피스를 통해 글로벌 엔터프라이즈 고객 대응력을 강화한다는 계획입니다.


댓글 남기기

Global VC Megadeal Briefing에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기