Sora关停，他们赌对了：这家北大系AI公司即将敲开港交所大门

2026年07月03日 18:12:23 来自北京市

当OpenAI凭借Sora点燃全球AI视频生成竞赛时，一支来自北大的创业团队却选择逆势而行。他们率先开源了全球首个先进架构的文生视频模型，获得千万级下载，却在行业热度最高时主动收缩视频业务，将最核心的研发资源转向彼时并不起眼的2D图像生成。事实证明，这并非一次技术退让，而是一场资源配置上的战略选择。2025年5月，兔展智能的Uniworld V1早于Nano Banana 3个月发布并开源，是业界首个开源的理解、生成、编辑一体的统一架构视觉大模型；2026年4月，与GPT Image2同周发布Uniworld V2.5，被誉为世界最聪明的两个视觉智能大模型。

直到Sora因高昂的推理成本与迟迟未能跑通商业模式而逐步淡出舞台，这一曾经显得“不合时宜”的选择，才开始展现出其前瞻性。这种对产业节奏的判断，并非偶然。十年前，他们因错失快速成长为全球独角兽企业的机会而留下遗憾，也因此形成了一套不同于行业共识的创业逻辑：与其追逐最耀眼的技术风口，不如寻找真正具备长期价值的基础能力。

如今，当大模型竞争逐渐从参数规模转向生态构建，这家公司也避开与科技巨头的正面竞争，通过视觉AI生态的持续布局，在细分赛道建立起自己的优势，并向2026年赴港上市迈进。

2013年，董少灵和几位同学在北大宿舍发明了最早的H5工具，2014年兔展智能正式成立。没人想到，这家早期做H5制作工具的小公司，会比Canva早一年多推出全球首款泛人群设计工具。

“我们当年在中国把H5工具发明出来，发现美国没有同类产品，第一反应不是‘我们领先了’，而是‘这东西只适合中国市场’。”兔展智能创始人、董事长兼CEO董少灵复盘道。那是“Copy to China”的黄金年代，所有人都习惯对标美国公司，没人相信中国团队能做出全球领先的产品。

最终，Canva凭借欧美成熟的SaaS付费习惯成长为全球前五的非上市独角兽，而兔展智能始终没有打出手中“全球领先”这张王牌。“我们缺的从来不是技术，而是在‘Copy to China’的年代里，敢于相信自己能领先全球的勇气。”董少灵说，“当年正是因为不敢笃定自己的技术优势，我们没有从第一天就布局全球市场，才错失了与Canva同台竞争的机会。”

此后，面对AI视觉智能的历史性窗口，董少灵团队决心不再重蹈覆辙，他和团队不再盲目对标海外风口，而是以一场非共识的错位战争，掌控属于自己的机会。

非共识AI路径：不做“中国版Sora”

2022年AI浪潮爆发，兔展智能果断“All in”视觉大模型。2024年2月，OpenAI发布Sora，一夜之间点燃了整个行业。仅仅一个月后，兔展智能就开源了全球首个复现Sora架构的文生视频模型Open-Sora Plan，项目采用宽松的MIT开源协议，收获2600万次下载，吸引了50多个国家的开发者，连续多日登顶GitHub Trending第一，2024年视觉大模型代码引用量全球第一。

就在外界以为他们要全力冲刺“中国版Sora”时，团队却做出了一个出人意料的决定：主动放缓视频模型研发，将核心资源转向2D图像的精准生成。AI视频的娱乐相关内容赛道的公司，在今年已因Seedance2.0的发布被巨头清场，这也印证了创业公司在娱乐内容方向直面巨头的艰难处境。

“很多非行业人士会产生误会，觉得只有视频才厉害，只有3D、只有世界模型才厉害，但更本质的是你先要做出一个足够聪明的模型。”董少灵说。他们的路线是“先聪明、再升维”：先让模型能像素级生成带复杂表格、数学公式、专业排版的图像，解决真实的商业需求，再逐步向3D、视频乃至世界模型演进。

目前国内同行仍扎堆视频领域，专注精准图像生成的赛道反而竞争寥寥，兔展智能的UniWorld系列是行业内首个提出理解与生成统一的模型，将生图模型与理解模型融合为同一架构，2026年4月底推出的UniWorld-V2.5更是突破了高密集文字、信息图、图文交错、结构化生成等一系列领域难题，综合性能对齐GPT-Image-2水平。

“真正的世界模型必然是多模态原生统一的，这个的起点要先从图像和语义的原生统一开始，即多模态生成和理解原生统一架构。”兔展智能联合创始人、首席科学家袁粒说。

除了能一次性生成图片、文字和排版，UniWorld-V2.5还做到了可编辑，支持多种风格和使用场景，如生活画报、财经报告等，且用户通过发语音和上传参考即可交互，生成后还可根据需求编辑修改。同时强化正版字体、版式规范、批量生成、内容合规等能力，适配商业办公、品牌营销等专业场景，实现了“一键生成+自由编辑” 的完整链路，高度契合当前专业图像生成领域的市场刚需。

AI错位战争：中国创业团队的独特解法

作为国内少有的产模一体独立模型公司，兔展智能避开巨头必争的泛娱乐赛道，深耕严肃商业表达领域。这一赛道中Adobe仅覆盖200万用户，而市场上有数亿从业者存在相关需求，是一片潜力巨大的蓝海。

兔展自研底层视觉大模型并直接落地终端产品，形成“产品数据→模型迭代→产品升级”的正向飞轮，既避开了OpenAI重模型、Adobe重产品的基因缺陷，也与Canva“模板优先”的传统模式拉开代际差，坚持走纯AI原生路线。

除Open-Sora Plan和UniWorld系列模型外，其推出的Video LLaVA模型在Google Gemini Pro技术报告中被作为视觉理解模型对比基准，标志着技术赢得国际顶级认可。LLaVA-CoT模型则在行业内首次提出视觉慢思考架构，让模型能够进行自主、系统化地多阶段推理，突破了传统视觉模型单步响应的局限，该研究成果被ICCV 2025会议收录（计算机视觉领域的三大顶会之一），获得同行评审的权威认可。

在此基础上，深度绑定华为昇腾的国产算力优势构筑了坚实的成本护城河。袁粒证实：“Open-Sora Plan-V1.5为纯昇腾‘纯血’部署，主流芯片性能对标A100，高端芯片达H100的70%-80%”。这让兔展智能彻底避开了Sora式的算力成本失控，即将公测的由UniWorld-V2.5模型驱动的产品，基础功能定价远低于GPT-Image-2，且在准确性和可编辑性方面具有显著优势。

依托国内高校和人社部的广东省首个“AI国家级高技能人才培训基地”，兔展智能还打造出全球领先的视觉AI交付团队，补齐了技术落地的最后一环。业内普遍存在“AI两条曲线”的规律，AI技术迭代速度远快于应用落地速度，二者之间的鸿沟需要专业人才填补，如今OpenAI、Anthropic也在布局交付团队，足以印证这一路线的全球价值。

目前，兔展智能累计完成多轮融资，投资方包括深创投、腾讯、招商局创投、招商局资本等知名机构，获北京大学入股，是国家高新技术企业、国家级专精特新“小巨人”企业、大湾区最具潜力独角兽企业，同时已在沙特落地成立分公司，并启动股份制改革，计划2026年赴香港上市。

Sora的退场为行业敲响了警钟：AI视觉产品的生命力不在于技术酷炫度，而在于能否找到可持续的商业化路径。而兔展智能的答案是，做企业和专业用户愿意付费的“准确”+ “智能”而非“好看”“好玩”的娱乐，就像Anthropic选择聚焦coding让模型更聪明，而非发力做一个无所不知的聊天机器人。

围绕公司使命，兔展智能延伸出了不同的AI产品线：依托“让人类叙事更生动高效”的使命，研发了一句话成片的视频龙虾产品“TUVE”、棚拍级真实感AI商品图生产力平台“AnyReal”、自动驾驶式的出海网红营销Agent“DeiNai”；围绕“让人类办事更智能便捷”的使命，则在行业内首创发明了AI UI产品、企业应用智能化入口“SkillsUI”。

如今，通过海内外多个AI业务的生态布局，兔展智能不再重蹈十年前的覆辙，而是自信且笃定地参与着全球化竞争，向世界讲述来自中国的领先AI商业故事。

董少灵是连续创业者，毕业于北京大学国际法学院，2008年开启创业之路，2017年曾入围福布斯中国30 Under 30；团队联合创始人、首席科学家袁粒现为94年出生的北京大学助理教授、博导、研究员，连续三年入选全球Top2%顶尖科学家榜单，为公司模型研发的核心掌舵人。联合创始人CTO周星，则是打造AI Native产品和工程体系的核心负责人。

图注：左：兔展智能首席科学家袁粒；右：兔展智能创始人、董事长兼CEO董少灵；图片来源：福布斯中国

以下是福布斯中国与兔展智能团队对话内容节选：

福布斯中国：当初全行业跟风视频生成，你们主动转向2D图像，内部推进时最大的阻力来自哪里？最终如何统一方向？

董少灵：

最大的阻力来自外界舆论和行业惯性。当时文生视频是绝对热点，外界普遍认为放弃这条赛道就是落后。但团队结合过往的创业经历，坚持回归技术本质：视觉AI的核心是理解与精准表达，而非单纯的视觉特效。内部经过多轮技术推演和市场研判，最终坚持走“夯实基础、循序渐进”的路线。

福布斯中国：深耕严肃商业表达赛道，你们观察到企业客户最核心的痛点是什么？

董少灵：

传统设计、图文制作流程效率低，专业人才成本高。很多中小企业和职场人员没有专业设计能力，但日常又高频需要标准化、专业化的图文内容。我们的产品就是瞄准这一痛点，用AI降低创作门槛，同时保证内容严谨、格式规范，这也是企业愿意持续付费的核心原因。

福布斯中国：你们采用的“产模一体+交付团队”模式，短期和长期的规划分别是什么？

董少灵：

短期聚焦产品打磨和人才体系搭建，把AI工具和交付服务落地到更多行业；长期希望依托数据和人才优势，形成行业标准。海外巨头重技术、轻落地，这是我们持续拉开差距的机会，也是中国AI走向全球的特色路径。

福布斯中国：适配国产算力生态，技术团队攻克的最大难点是什么？后续在算力生态上还有哪些布局？

袁粒：

最大难点是软硬件适配与性能优化，要在国产芯片上实现媲美国际主流产品的效果，需要大量底层调优工作。目前我们除了持续深度适配华为算力体系，也在参与国产AI算力生态共建，推动行业整体技术成熟。

福布斯中国：落地沙特市场，国产算力与模型的组合在海外市场接受度如何，你们做了哪些本地化调整？

董少灵：

我们组建了本地运营团队，适配当地语言、使用习惯和合规要求。海外不少国家都希望摆脱单一技术体系依赖，我们的全套中国方案恰好契合这一需求，目前海外合作推进顺利。

福布斯中国：吸取早年错失全球化的教训，如今你们的产品从立项就定位全球，在产品设计上有哪些全球化考量？

董少灵：

在功能、语言、使用逻辑上全部按照全球通用标准设计，不再区分“国内版”和“海外版”。同时兼顾不同地区的审美、商业差异，让产品能适配全球多元化的使用需求。

福布斯中国：你们6月中下旬即将公测的由UniWorld-V2.5模型驱动的端到端AI图文生成产品，针对个人用户和企业用户分别做了哪些差异化设计？

董少灵：

面向个人用户，主打轻量化、简易操作，满足社交分享、日常创作需求；面向企业用户，强化正版字体、版式规范、批量生成、内容合规等能力，适配商业办公、品牌营销等专业场景。区别于市面上纯图片生成工具和传统模板工具，我们实现了“一键生成+自由编辑” 的完整链路。

福布斯中国：站在当下，你们对三年后的发展目标有怎样的规划？

董少灵：

我们的目标是成为全球领先的视觉空间智能服务商。不止输出工具产品，更要输出整套视觉AI解决方案，成为企业数字化表达的核心助力。经历过过往的遗憾，这一次我们会沉下心，把正确的事长期做下去。

Sora关停，他们赌对了：这家北大系AI公司即将敲开港交所大门

亲爱的凤凰网用户:

第三方浏览器推荐: