全球首个超低门槛视频生成大模型 Open-Sora 2.0 开源潞晨科技突破算力瓶颈实现 97% 成本压缩

核心要点👉

💸 20万美元训练成本压缩97% 创商业模型训练新基准
🚀 VBench指标与Sora差距仅0.69% 超越30B参数竞品
🛠️ 动态张量并行技术实现68%显存占用优化
🌐 4096GPU集群支持千亿参数线性扩展能力
📈 2.0版本纹理精度提升83% 光照误差锐减91%

数智朋克讯，全球首个超低门槛视频生成大模型实现技术突围，潞晨科技Open-Sora 2.0开源方案重新定义产业基准。该11B参数规模的视频生成系统通过3D自编码器架构与Flow Matching训练框架，在224张GPU集群上仅耗费20万美元即完成商业级模型训练，较同类闭源方案成本压缩97%。技术团队创新性引入多桶训练机制，实现720P/24FPS高帧率视频生成，其VBench评测指标较OpenAI Sora闭源模型差距收窄至0.69%，同步超越腾讯HunyuanVideo等30B参数级竞品。

此次开源方案完整释放模型权重与分布式训练协议，开发者可基于Colossal-AI系统实现多模态内容生成。性能飞跃源于架构级优化：在视频连续性预测模块，新型时空注意力机制将长程依赖建模误差降低42%；在计算资源管理层面，动态张量并行技术使显存占用减少68%，成功破解大模型视频生成的算力瓶颈。实测数据显示，该模型在复杂场景渲染中实现47%的物理规律模拟精度提升，人物动作连贯性指标达行业顶尖水平。

开源生态的全面开放标志着视频生成领域进入普惠时代，开发者现可通过GitHub获取完整训练日志与超参配置。工程团队特别披露，其分布式训练框架支持弹性扩展至4096张GPU集群，在千亿参数规模下仍保持线性加速比。值得注意的是，该模型在多轮迭代中展现出惊人的进化能力——相较于1.2版本，2.0迭代在纹理细节生成准确率提升83%，光照渲染误差降低91%，成功突破影视级内容生产的技术壁垒。

全球首个超低门槛视频生成大模型 Open-Sora 2.0 开源 潞晨科技突破算力瓶颈实现 97% 成本压缩

数智资讯订阅

全球首个超低门槛视频生成大模型 Open-Sora 2.0 开源潞晨科技突破算力瓶颈实现 97% 成本压缩