Sora关停,他们赌对了:这家北大系AI公司即将敲开港交所大门
财经
财经 > 证券 > IPO > A股IPO > 正文

Sora关停,他们赌对了:这家北大系AI公司即将敲开港交所大门

当OpenAI凭借Sora点燃全球AI视频生成竞赛时,一支来自北大的创业团队却选择逆势而行。他们率先开源了全球首个先进架构的文生视频模型,获得千万级下载,却在行业热度最高时主动收缩视频业务,将最核心的研发资源转向彼时并不起眼的2D图像生成。事实证明,这并非一次技术退让,而是一场资源配置上的战略选择。2025年5月,兔展智能的Uniworld V1早于Nano Banana 3个月发布并开源,是业界首个开源的理解、生成、编辑一体的统一架构视觉大模型;2026年4月,与GPT Image2同周发布Uniworld V2.5,被誉为世界最聪明的两个视觉智能大模型。

直到Sora因高昂的推理成本与迟迟未能跑通商业模式而逐步淡出舞台,这一曾经显得“不合时宜”的选择,才开始展现出其前瞻性。这种对产业节奏的判断,并非偶然。十年前,他们因错失快速成长为全球独角兽企业的机会而留下遗憾,也因此形成了一套不同于行业共识的创业逻辑:与其追逐最耀眼的技术风口,不如寻找真正具备长期价值的基础能力。

如今,当大模型竞争逐渐从参数规模转向生态构建,这家公司也避开与科技巨头的正面竞争,通过视觉AI生态的持续布局,在细分赛道建立起自己的优势,并向2026年赴港上市迈进。

2013年,董少灵和几位同学在北大宿舍发明了最早的H5工具,2014年兔展智能正式成立。没人想到,这家早期做H5制作工具的小公司,会比Canva早一年多推出全球首款泛人群设计工具。

“我们当年在中国把H5工具发明出来,发现美国没有同类产品,第一反应不是‘我们领先了’,而是‘这东西只适合中国市场’。”兔展智能创始人、董事长兼CEO董少灵复盘道。那是“Copy to China”的黄金年代,所有人都习惯对标美国公司,没人相信中国团队能做出全球领先的产品。

最终,Canva凭借欧美成熟的SaaS付费习惯成长为全球前五的非上市独角兽,而兔展智能始终没有打出手中“全球领先”这张王牌。“我们缺的从来不是技术,而是在‘Copy to China’的年代里,敢于相信自己能领先全球的勇气。”董少灵说,“当年正是因为不敢笃定自己的技术优势,我们没有从第一天就布局全球市场,才错失了与Canva同台竞争的机会。”

此后,面对AI视觉智能的历史性窗口,董少灵团队决心不再重蹈覆辙,他和团队不再盲目对标海外风口,而是以一场非共识的错位战争,掌控属于自己的机会。

非共识AI路径:不做“中国版Sora”

2022年AI浪潮爆发,兔展智能果断“All in”视觉大模型。2024年2月,OpenAI发布Sora,一夜之间点燃了整个行业。仅仅一个月后,兔展智能就开源了全球首个复现Sora架构的文生视频模型Open-Sora Plan,项目采用宽松的MIT开源协议,收获2600万次下载,吸引了50多个国家的开发者,连续多日登顶GitHub Trending第一,2024年视觉大模型代码引用量全球第一。

就在外界以为他们要全力冲刺“中国版Sora”时,团队却做出了一个出人意料的决定:主动放缓视频模型研发,将核心资源转向2D图像的精准生成。AI视频的娱乐相关内容赛道的公司,在今年已因Seedance2.0的发布被巨头清场,这也印证了创业公司在娱乐内容方向直面巨头的艰难处境。

“很多非行业人士会产生误会,觉得只有视频才厉害,只有3D、只有世界模型才厉害,但更本质的是你先要做出一个足够聪明的模型。”董少灵说。他们的路线是“先聪明、再升维”:先让模型能像素级生成带复杂表格、数学公式、专业排版的图像,解决真实的商业需求,再逐步向3D、视频乃至世界模型演进。

目前国内同行仍扎堆视频领域,专注精准图像生成的赛道反而竞争寥寥,兔展智能的UniWorld系列是行业内首个提出理解与生成统一的模型,将生图模型与理解模型融合为同一架构,2026年4月底推出的UniWorld-V2.5更是突破了高密集文字、信息图、图文交错、结构化生成等一系列领域难题,综合性能对齐GPT-Image-2水平。

“真正的世界模型必然是多模态原生统一的,这个的起点要先从图像和语义的原生统一开始,即多模态生成和理解原生统一架构。”兔展智能联合创始人、首席科学家袁粒说。

除了能一次性生成图片、文字和排版,UniWorld-V2.5还做到了可编辑,支持多种风格和使用场景,如生活画报、财经报告等,且用户通过发语音和上传参考即可交互,生成后还可根据需求编辑修改。同时强化正版字体、版式规范、批量生成、内容合规等能力,适配商业办公、品牌营销等专业场景,实现了“一键生成+自由编辑” 的完整链路,高度契合当前专业图像生成领域的市场刚需。

AI错位战争:中国创业团队的独特解法

作为国内少有的产模一体独立模型公司,兔展智能避开巨头必争的泛娱乐赛道,深耕严肃商业表达领域。这一赛道中Adobe仅覆盖200万用户,而市场上有数亿从业者存在相关需求,是一片潜力巨大的蓝海。

兔展自研底层视觉大模型并直接落地终端产品,形成“产品数据→模型迭代→产品升级”的正向飞轮,既避开了OpenAI重模型、Adobe重产品的基因缺陷,也与Canva“模板优先”的传统模式拉开代际差,坚持走纯AI原生路线。

除Open-Sora Plan和UniWorld系列模型外,其推出的Video LLaVA模型在Google Gemini Pro技术报告中被作为视觉理解模型对比基准,标志着技术赢得国际顶级认可。LLaVA-CoT模型则在行业内首次提出视觉慢思考架构,让模型能够进行自主、系统化地多阶段推理,突破了传统视觉模型单步响应的局限,该研究成果被ICCV 2025会议收录(计算机视觉领域的三大顶会之一),获得同行评审的权威认可。

在此基础上,深度绑定华为昇腾的国产算力优势构筑了坚实的成本护城河。袁粒证实:“Open-Sora Plan-V1.5为纯昇腾‘纯血’部署,主流芯片性能对标A100,高端芯片达H100的70%-80%”。这让兔展智能彻底避开了Sora式的算力成本失控,即将公测的由UniWorld-V2.5模型驱动的产品,基础功能定价远低于GPT-Image-2,且在准确性和可编辑性方面具有显著优势。

依托国内高校和人社部的广东省首个“AI国家级高技能人才培训基地”,兔展智能还打造出全球领先的视觉AI交付团队,补齐了技术落地的最后一环。业内普遍存在“AI两条曲线”的规律,AI技术迭代速度远快于应用落地速度,二者之间的鸿沟需要专业人才填补,如今OpenAI、Anthropic也在布局交付团队,足以印证这一路线的全球价值。

目前,兔展智能累计完成多轮融资,投资方包括深创投、腾讯、招商局创投、招商局资本等知名机构,获北京大学入股,是国家高新技术企业、国家级专精特新“小巨人”企业、大湾区最具潜力独角兽企业,同时已在沙特落地成立分公司,并启动股份制改革,计划2026年赴香港上市。

Sora的退场为行业敲响了警钟:AI视觉产品的生命力不在于技术酷炫度,而在于能否找到可持续的商业化路径。而兔展智能的答案是,做企业和专业用户愿意付费的“准确”+ “智能”而非“好看”“好玩”的娱乐,就像Anthropic选择聚焦coding让模型更聪明,而非发力做一个无所不知的聊天机器人。

围绕公司使命,兔展智能延伸出了不同的AI产品线:依托“让人类叙事更生动高效”的使命,研发了一句话成片的视频龙虾产品“TUVE”、棚拍级真实感AI商品图生产力平台“AnyReal”、自动驾驶式的出海网红营销Agent“DeiNai”;围绕“让人类办事更智能便捷”的使命,则在行业内首创发明了AI UI产品、企业应用智能化入口“SkillsUI”。

如今,通过海内外多个AI业务的生态布局,兔展智能不再重蹈十年前的覆辙,而是自信且笃定地参与着全球化竞争,向世界讲述来自中国的领先AI商业故事。

董少灵是连续创业者,毕业于北京大学国际法学院,2008年开启创业之路,2017年曾入围福布斯中国30 Under 30;团队联合创始人、首席科学家袁粒现为94年出生的北京大学助理教授、博导、研究员,连续三年入选全球Top2%顶尖科学家榜单,为公司模型研发的核心掌舵人。联合创始人CTO周星,则是打造AI Native产品和工程体系的核心负责人。

图注:左:兔展智能首席科学家袁粒;右:兔展智能创始人、董事长兼CEO董少灵;图片来源:福布斯中国

以下是福布斯中国与兔展智能团队对话内容节选:

福布斯中国:当初全行业跟风视频生成,你们主动转向2D图像,内部推进时最大的阻力来自哪里?最终如何统一方向?

董少灵:

最大的阻力来自外界舆论和行业惯性。当时文生视频是绝对热点,外界普遍认为放弃这条赛道就是落后。但团队结合过往的创业经历,坚持回归技术本质:视觉AI的核心是理解与精准表达,而非单纯的视觉特效。内部经过多轮技术推演和市场研判,最终坚持走“夯实基础、循序渐进”的路线。

福布斯中国:深耕严肃商业表达赛道,你们观察到企业客户最核心的痛点是什么?

董少灵:

传统设计、图文制作流程效率低,专业人才成本高。很多中小企业和职场人员没有专业设计能力,但日常又高频需要标准化、专业化的图文内容。我们的产品就是瞄准这一痛点,用AI降低创作门槛,同时保证内容严谨、格式规范,这也是企业愿意持续付费的核心原因。

福布斯中国:你们采用的“产模一体+交付团队”模式,短期和长期的规划分别是什么?

董少灵:

短期聚焦产品打磨和人才体系搭建,把AI工具和交付服务落地到更多行业;长期希望依托数据和人才优势,形成行业标准。海外巨头重技术、轻落地,这是我们持续拉开差距的机会,也是中国AI走向全球的特色路径。

福布斯中国:适配国产算力生态,技术团队攻克的最大难点是什么?后续在算力生态上还有哪些布局?

袁粒:

最大难点是软硬件适配与性能优化,要在国产芯片上实现媲美国际主流产品的效果,需要大量底层调优工作。目前我们除了持续深度适配华为算力体系,也在参与国产AI算力生态共建,推动行业整体技术成熟。

福布斯中国:落地沙特市场,国产算力与模型的组合在海外市场接受度如何,你们做了哪些本地化调整?

董少灵:

我们组建了本地运营团队,适配当地语言、使用习惯和合规要求。海外不少国家都希望摆脱单一技术体系依赖,我们的全套中国方案恰好契合这一需求,目前海外合作推进顺利。

福布斯中国:吸取早年错失全球化的教训,如今你们的产品从立项就定位全球,在产品设计上有哪些全球化考量?

董少灵:

在功能、语言、使用逻辑上全部按照全球通用标准设计,不再区分“国内版”和“海外版”。同时兼顾不同地区的审美、商业差异,让产品能适配全球多元化的使用需求。

福布斯中国:你们6月中下旬即将公测的由UniWorld-V2.5模型驱动的端到端AI图文生成产品,针对个人用户和企业用户分别做了哪些差异化设计?

董少灵:

面向个人用户,主打轻量化、简易操作,满足社交分享、日常创作需求;面向企业用户,强化正版字体、版式规范、批量生成、内容合规等能力,适配商业办公、品牌营销等专业场景。区别于市面上纯图片生成工具和传统模板工具,我们实现了“一键生成+自由编辑” 的完整链路。

福布斯中国:站在当下,你们对三年后的发展目标有怎样的规划?

董少灵:

我们的目标是成为全球领先的视觉空间智能服务商。不止输出工具产品,更要输出整套视觉AI解决方案,成为企业数字化表达的核心助力。经历过过往的遗憾,这一次我们会沉下心,把正确的事长期做下去。

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载