近日,生数科技完成数亿元
Pre-A轮融资,该轮融资由北京市人工智能产业投资基金、百度联合领投,中关村科学城公司等跟投,启明创投、卓源亚洲等数位老股东继续支持,
华兴资本担任本轮融资的独家财务顾问
。此前,生数科技已经获得来自蚂蚁集团、BV百度风投、锦秋基金、达泰资本、智谱AI等机构的投资。本轮融资完成后,生数科技将坚持其原生通用多模态技术路线,持续迭代优化自研大模型,并加速产品开发与市场拓展。
“衷心感谢华兴资本作为生数的长期独家财务顾问,以其卓越的专业素养和高效率的工作为我们提供宝贵的融资策略建议并助力我们迅速完成两轮融资,引入了高质量投资人,也感谢新老股东的信任和鼎力支持。我们期待与华兴继续携手合作,并肩作战,持续全面突破多模态生成瓶颈。”
生数科技拥有深厚的技术底蕴,核心团队来自多个海内外顶级学术机构和科技企业,早在
2021年就率先开始了扩散模型研究,是国内最早研究深度生成模型的团队之一。期间提出的免训练推断算法Analytic-DPM、全球最快采样算法DPM-Solver,被Stable Diffusion、DALL·E 2等图像模型采用,直接推动了全球图像生成浪潮的兴起。2022年提出全球首个Diffusion与Transformer融合架构U-ViT,短短半年后再次取得重大突破,开源全球首个基于此融合架构的多模态扩散模型UniDiffuser,成功验证了大规模训练融合架构的可行性与涌现能力。
深厚的原创技术积累不仅为生数科技构建了全栈的自研能力,更为团队提供了前瞻的技术视角。
2024年初,OpenAI推出视频大模型Sora,其背后采用的
Diffusion
与
Transformer
融合架构和原生多模态技术路线引发关注,而彼时生数科技对该技术路线的布局已持续一年多。
早在
2023年初大语言模型兴起之际,生数科技创始团队就研判大模型的发展必将从语言单一模态走向多模态融合。因此成立之初,生数科技就坚持采用U-ViT融合架构处理多模态数据,持续探索大模型在图像、3D、视频等多模态生成任务下的性能边界。
同年
9月,生数科技发布产业级多模态通用大模型,在高质量图像生成、高精度3D模型生成、逐帧级视频元素编辑和个性化视频风格迁移等任务中达到行业顶尖水平。2024年4月,生数科技联合清华大学正式发布国内首个全自研视频大模型Vidu,性能全面对标OpenAI的Sora,在国内外引发广泛关注与高度认可。
在激烈的大模型竞争中,生数科技凭借超前的技术洞察和坚实的技术实力脱颖而出,成为国内首个布局原生多模态大模型路线并坚定持续投入的团队。同时在不断的探索和实践中,生数科技也在多模态数据管理平台和工程化方面构建了体系化经验,为模型的持续高效迭代提供了有力支撑。
此外在商业化进程上,生数科技从成立之初就致力于将前沿技术与商业化紧密结合,布局
MaaS(模型即服务)与应用级产品。截至目前,已陆续推出视觉创意设计平台PixWeaver、3D资产构建工具VoxCraft两款应用产品,同时携手多家合作伙伴,将多模态大模型应用于游戏、影视、文旅、智能终端等场景。
北京市人工智能产业投资基金
表示:
“多模态大模型是AI下一阶段发展的关键方向,市场潜力巨大,生数科技拥有领先的生成式AI研发团队,具备坚实的人才基础和深厚的技术积累。生数科技在图像、视频、3D等多模态领域所取得的一系列关键创新成果,在业内获得了广泛认可和高度评价,也充分证明了生数科技的技术实力和行业领先地位。我们对生数科技未来充满信心,并期待他们继续在大模型的浪潮中引领创新,开拓更广阔的发展前景。”
百度集团执行副总裁、百度智能云事业群总裁沈抖