DIGIPUNK
去投稿
发表于:2025年03月13日

全球首个超低门槛视频生成大模型 Open-Sora 2.0 开源 潞晨科技突破算力瓶颈实现 97% 成本压缩

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
核心要点👉
  • 💸 20万美元训练成本压缩97% 创商业模型训练新基准
  • 🚀 VBench指标与Sora差距仅0.69% 超越30B参数竞品
  • 🛠️ 动态张量并行技术实现68%显存占用优化
  • 🌐 4096GPU集群支持千亿参数线性扩展能力
  • 📈 2.0版本纹理精度提升83% 光照误差锐减91%

数智朋克讯,全球首个超低门槛视频生成大模型实现技术突围,潞晨科技Open-Sora 2.0开源方案重新定义产业基准。该11B参数规模的视频生成系统通过3D自编码器架构Flow Matching训练框架,在224张GPU集群上仅耗费20万美元即完成商业级模型训练,较同类闭源方案成本压缩97%。技术团队创新性引入多桶训练机制,实现720P/24FPS高帧率视频生成,其VBench评测指标较OpenAI Sora闭源模型差距收窄至0.69%,同步超越腾讯HunyuanVideo等30B参数级竞品。

此次开源方案完整释放模型权重与分布式训练协议,开发者可基于Colossal-AI系统实现多模态内容生成。性能飞跃源于架构级优化:在视频连续性预测模块,新型时空注意力机制将长程依赖建模误差降低42%;在计算资源管理层面,动态张量并行技术使显存占用减少68%,成功破解大模型视频生成的算力瓶颈。实测数据显示,该模型在复杂场景渲染中实现47%的物理规律模拟精度提升,人物动作连贯性指标达行业顶尖水平。

开源生态的全面开放标志着视频生成领域进入普惠时代,开发者现可通过GitHub获取完整训练日志与超参配置。工程团队特别披露,其分布式训练框架支持弹性扩展至4096张GPU集群,在千亿参数规模下仍保持线性加速比。值得注意的是,该模型在多轮迭代中展现出惊人的进化能力——相较于1.2版本,2.0迭代在纹理细节生成准确率提升83%光照渲染误差降低91%,成功突破影视级内容生产的技术壁垒。

本文链接: https://www.shuzhipunk.com/articles/qbKxQpM0Tuk
转载请注明文章出处

文章所属标签
视频生成
开源 AI
多模态生成