Shengshu Technology (生数科技) Vidu · Motus · General World Model · 清华大学 스핀아웃 · 2026.04 Series B CNY 20억
2022년 U-ViT 아키텍처로 멀티모달 생성 AI 연구를 선도한 칭화대 팀이 2023년 창업 — 중국 최초 비디오 생성 모델 Vidu를 출시하고, Artificial Analysis 글로벌 2위를 달성한 뒤 2026년 4월 알리바바 클라우드 주도 CNY 20억으로 ‘물리 세계 AGI’를 향한 도약을 선언했다
Shengshu Technology(生数科技)는 칭화대학교(清华大学) 인공지능 연구실(TSAIL Lab) 소속 연구팀이 멀티모달 생성 AI 분야의 연구 성과를 상업화하기 위해 2023년 초 설립한 베이징 기반 AI 스타트업입니다. 창업 이전인 2022년 9월, 팀은 이미 업계를 선도하는 U-ViT 아키텍처를 발표하며 글로벌 멀티모달 생성 알고리즘 분야에서 가장 이른 연구팀 중 하나로 자리매김했습니다.
칭화대학교 컴퓨터과학과 교수이자 TSAIL(Tsinghua Statistical AI & Learning) Lab 소장으로 재직하며 확산 모델, 변분 추론, 딥 생성 모델 분야의 세계적 연구자입니다. U-ViT·Stable Video Diffusion 등 핵심 멀티모달 생성 AI 논문의 저자로, 2022년 9월 발표한 U-ViT 아키텍처는 이후 Shengshu Technology 전 제품의 기술적 토대가 됐습니다.
단순한 논문 저자에 그치지 않고 직접 창업을 선택한 Zhu Jun의 결정은, 칭화대-TSAIL Lab의 학문적 DNA를 상업 제품으로 구현하겠다는 의지를 보여줍니다. 칭화대학교와 TSAIL Lab은 Shengshu가 개발한 오픈소스 TurboDiffusion 프로젝트를 공동으로 발표하며, 학산연 협력 구조를 지속하고 있습니다.
컴퓨터과학과
소장
발표
선도 연구
창업
베이징
중국 최초 비디오
(Artificial Analysis)
CNY 20억
AGI 선언
핵심 연구팀 — 칭화대 TSAIL Lab 기반의 산학연 협력 구조:
Shengshu Technology와 칭화대 TSAIL Lab은 TurboDiffusion 오픈소스 프로젝트를 공동 발표하는 등 긴밀한 학산연 협력을 유지합니다. TSAIL Lab은 세계 최고 수준의 확산 모델·변분 추론·딥 생성 모델 연구 그룹으로, Shengshu의 연구 역량의 원천입니다. 회사 설립 이후에도 칭화대 AI 생태계와의 인재·지식 공유 채널을 유지하고 있습니다.
Shengshu 팀은 전 세계에서 가장 이른 시기에 멀티모달 생성 알고리즘을 연구한 그룹 중 하나입니다. 2022년 9월 U-ViT 아키텍처 발표, 2024년 4월 Vidu를 통한 중국 최초 비디오 생성 모델 상용화, 2024년 7월 글로벌 출시 및 Reference-to-Video 기능 업계 최초 도입은 지속적인 기술 선도 트랙 레코드를 보여줍니다.
Shengshu Technology는 Vidu 비디오 생성 플랫폼을 핵심으로 하는 멀티모달 생성 AI 기업입니다. 2025년 한 해 동안 유저 수와 매출이 모두 10배 이상 성장했으며, Vidu는 현재 200개국 이상에서 콘텐츠 창작자·스튜디오·기업 고객에게 활용되고 있습니다. 비디오 생성을 넘어 로봇 제어 플랫폼 Motus를 통해 실체화 AI(Embodied AI) 분야로 사업을 확장하고 있습니다.
유저·매출 성장
국가·지역
(Artificial Analysis)
업계 협력 비율
3대 핵심 제품·플랫폼:
중국 최초 비디오 생성 모델(2024년 4월 출시). 최신 Vidu Q3는 스토리텔링을 위한 세계 최초 비디오 모델로, 16초 동기화 오디오-비디오 생성·네이티브 1080p·고급 영화적 언어·정밀 샷 전환·다국어 텍스트 렌더링을 지원합니다. Artificial Analysis 글로벌 2위(중국 1위) 달성. Vidu Q2는 상용급 콘텐츠 생성 모델 중 전 세계 최고 속도 유지.
2025년 12월 오픈소스로 공개된 로봇 제어 모델. 비디오·오디오 등 멀티모달 데이터를 처리해 로봇이 지능적 행동을 수행하도록 설계됩니다. 인식과 동작을 실세계 환경에서 연결하는 실체화 AI 플랫폼으로, 선도적 실체화 AI 기업들과 협력해 산업·상업·가정용 지능형 로봇 개발을 진행 중입니다.
시각·청각·촉각 등 다양한 감각 정보를 통합해 물리적 현실에 대한 종합적 이해를 구축하는 ‘일반 세계 모델’. Series B 자금의 핵심 투입 대상. 로봇공학·자율주행·인터랙티브 디지털 콘텐츠 창작 분야에서의 AI 발전에 필수적인 기반 기술입니다. ByteDance·Unitree 등도 유사 방향을 탐색 중입니다.
Vidu 생태계 — MaaS·SaaS·App·Agent 4대 제품 레이어:
Shengshu는 Vidu를 중심으로 Vidu MaaS(Model-as-a-Service)·Vidu SaaS·Vidu App·Vidu Agent의 4계층 제품 생태계를 구축했습니다. MaaS는 API를 통한 기업 통합, SaaS는 구독형 비즈니스 솔루션, App은 개인 창작자 도구, Agent는 자동화 워크플로우를 각각 담당합니다. 이를 통해 개인 창작자에서 글로벌 엔터프라이즈까지 전체 스펙트럼의 고객을 커버합니다.
주요 고객·파트너 현황:
- 중국 엔터텐센트 애니메이션&코믹스·차이나 리터러처·CCTV 애니메이션·iQIYI·장시 필름그룹·망고TV 등 중국 최대 콘텐츠 기업들과 협력. 중국 영화·애니메이션·단막극·장편 영화 제작 업계 이해관계자(콘텐츠 오너·툴 개발사·제작 스튜디오)의 90%+ 커버.
- 글로벌Pollo AI·PhotoGrid·OpenArt·Hubx·Fal.ai·Eachlabs·Freepik·GensPark 등 글로벌 창작 툴 플랫폼. 교육·방송·문화 관광 분야로도 활용 확장. 200개국+ 서비스 중.
- 스마트 HW스마트 하드웨어 선도 기업들에도 Vidu 적용 확대. 인터넷 플랫폼·스마트 기기 등 B2B 채널을 통한 기업 고객 기반 확장 진행 중.
- 로보틱스선도적 실체화 AI 기업들과 협력해 Motus 기반 산업용·상업용·가정용 지능형 로봇 공동 개발. 물리 세계 AGI 로드맵의 핵심 파트너십.
“Shengshu Technology는 강력한 알고리즘 연구를 기반으로 출발해 핵심 모델 혁신의 경계를 지속적으로 확장해왔습니다. 선도적인 국제 멀티모달 파운데이션 모델 중에서 Vidu는 명확한 차별화와 강력한 경쟁 우위를 확립했습니다. 연구 돌파구에서 대규모 상업화까지, 우리는 멀티모달 파운데이션 모델이 차세대 생산 패러다임이자 생산성의 변혁적 힘이 될 것이라고 믿습니다.”
Shengshu Technology는 2023년 창업 이후 3년이 채 되지 않아 시드에서 Series B까지 빠르게 조달을 완료했습니다. Series A+(2026년 2월, CNY 6억)에 이어 불과 2개월 만에 Series B(2026년 4월, CNY 20억)를 클로징하며, 중국 AI 섹터에서 가장 빠른 자금 조달 궤도를 보여주고 있습니다.
2023년 초 창업 직후, 칭화대 TSAIL Lab의 연구 성과를 바탕으로 초기 투자를 유치했습니다. 치밍창업투자(Qiming Venture Partners)와 베이징 인공지능 산업투자기금이 초기 투자자로 참여했으며, 이후 라운드에서도 재투자를 단행했습니다. G&O·C&D Emerging Industry Equity Investment·Guowen Hechuang 등도 초기 단계부터 참여했습니다.
2024년 4월 중국 최초 비디오 생성 모델 Vidu를 출시하고, 같은 달 OpenAI의 Sora의 경쟁 제품으로 글로벌 주목을 받으며 Series A를 완료했습니다. 바이두 벤처스(Baidu Ventures)가 이 단계에서 투자에 참여했으며, 2024년 7월 글로벌 출시와 업계 최초 Reference-to-Video 기능 도입으로 기술 선도성을 입증했습니다. 2025년 한 해 동안 유저·매출 모두 10배 이상 성장하며 상업화 능력을 검증했습니다.
중관촌 과학성(Zhongguancun Science City)과 LINK-X CAPITAL이 공동 주도한 CNY 6억 라운드. Vidu Q3의 Artificial Analysis 글로벌 2위 달성과 2025년 10배 성장이라는 상업적 성과가 이 라운드를 촉진했습니다.
전략적 투자자로는 Wondershare(동영상 편집 소프트웨어 선도기업)·Visual China Group(중국 최대 시각 미디어 플랫폼)·TRS가 참여했습니다. 이들의 참여는 Vidu가 단순 모델 수준을 넘어 전문 콘텐츠 산업 인프라로 인정받고 있음을 의미합니다. 기존 투자자 치밍·베이징 AI 산업투자기금·G&O·C&D·Guowen Hechuang 모두 재투자를 단행했습니다.
알리바바 클라우드(Alibaba Cloud)가 주도한 창사 최대 단일 라운드. Series A+ 클로징 이후 불과 2개월 만의 연속 대형 조달로, 중국 AI 시장에서 이례적인 속도를 기록했습니다.
신규 투자자로 Andon Haitang(安多海棠)·중국인터넷투자기금(China Internet Investment Fund, 국가급 전략 펀드)·TAL 에듀케이션 그룹(好未来)·Luminous Ventures가 참여했습니다. 기존 투자자 Baidu Ventures도 재투자했습니다.
알리바바 클라우드의 주도는 두 가지 전략적 의미를 가집니다. 첫째, 대규모 AI 모델 학습·서비스에 필요한 클라우드 인프라를 Shengshu에 공급하는 B2B 관계 강화. 둘째, 알리바바의 Tongyi Wanxiang 등 자체 비디오 AI와 경쟁하면서도 협력하는 ‘코피티션(Coopetition)’ 전략의 일환. 자금은 General World Model 개발 및 의료·교육·방송 등 산업 다각화에 투입됩니다.
총 조달액
연속 조달 간격
중국 클라우드 1위
전략 참여
글로벌 비디오 생성 AI 시장은 ByteDance·Kuaishou·Kling·Alibaba(국내), Google·Runway·Pika(해외) 등 거대 경쟁자들이 밀집한 치열한 시장입니다. Shengshu가 이 경쟁에서 글로벌 2위 포지션을 달성하고 연속 대형 투자를 유치한 구조적 이유를 네 가지로 분석합니다.
Shengshu의 가장 깊은 경쟁 해자는 창업자 Zhu Jun 교수와 팀이 2022년 9월 U-ViT 아키텍처를 발표하며 전 세계에서 가장 이른 멀티모달 생성 알고리즘 연구팀 중 하나로 자리매김했다는 점입니다. 이 선행 연구 우위는 이후 Vidu의 Reference-to-Video(업계 최초)·멀티 샷 전환·16초 동기화 오디오-비디오 등의 차별화 기능으로 직접 이어집니다. 대형 테크 기업들이 자원을 총동원해도 따라잡기 어려운 연구 선도성(Research Primacy)의 해자입니다.
2024년 4월 중국 최초 비디오 생성 모델 출시 이후, Vidu Q1→Q2→Q3의 연속 버전업을 통해 각 단계에서 성능을 빠르게 개선했습니다. Artificial Analysis 최신 벤치마크에서 Vidu Q3는 중국 1위·글로벌 2위를 달성했으며, Vidu Q2는 상용급 콘텐츠 생성 모델 중 전 세계 최고 속도를 유지합니다. 이 벤치마크 실적은 단순한 마케팅 수치가 아닌, 알리바바·ByteDance 같은 자국 경쟁자들보다 우위에 있음을 독립 기관이 확인한 것입니다.
Shengshu의 가장 강력한 방어선은 중국 콘텐츠 산업 생태계 내 구축된 파트너십입니다. 텐센트 애니메이션&코믹스·차이나 리터러처·CCTV 애니메이션·iQIYI·망고TV 등 중국 주요 콘텐츠 기업들이 이미 Vidu를 제작 파이프라인에 통합했으며, 콘텐츠 오너·툴 개발사·프로덕션 스튜디오를 포함한 업계 이해관계자의 90% 이상과 협력 중입니다. 이 깊은 통합은 경쟁사로의 전환 비용을 극적으로 높입니다.
Shengshu의 전략적 독창성은 비디오 생성을 ‘목적’이 아닌 ‘수단’으로 보는 것입니다. Vidu의 멀티모달 생성 기술은 Motus 로봇 제어 플랫폼으로 연결되고, 최종적으로 General World Model(물리 세계 이해 AI)로 귀결됩니다. 이 3단계 로드맵은 경쟁자들이 단순 비디오 생성 품질 경쟁에 집중하는 사이, Shengshu가 AGI 방향성을 제시하며 차원이 다른 장기 목표를 갖고 있음을 보여줍니다. 알리바바 클라우드·중국인터넷투자기금이 이 비전에 베팅했다는 것이 투자자 구성이 증명하는 핵심 사실입니다.

