核心要点👉
- 💥 30B参数架构支撑5秒540P视频生成
- 🎯 双通道运动控制系统实现0.1-3.5倍动态调控
- 🚀 时空分离建模策略兼容爆炸特效与电影级长镜头
- 🏆 VBench-I2V测试动态连贯性破纪录+47%特效精度
- 🎥 八种专业运镜模式适配多制式视频生成
数智朋克获悉,国内AI创企阶跃星辰正式开源图像驱动视频生成模型Step-Video-TI2V。该模型基于30B参数规模的Step-Video-TT架构训练,具备每秒24帧的流畅视频生成能力,可输出持续5秒的540P分辨率动态画面。通过双通道运动控制系统,该方案突破性地实现了物理运动轨迹与镜头语言的双向参数化调控,支持从0.1至3.5倍率的动态幅度精准控制。
在技术实现层面,工程师团队创新采用时空分离建模策略,通过解耦运动幅度参数与运镜控制模块,使系统既可生成高动态的爆炸特效场景,也能输出具有电影级稳定性的长镜头画面。评测数据显示,在VBench-I2V基准测试中,该模型在动态连贯性和画面稳定性两项指标均刷新行业纪录,特别是在动漫类素材生成场景中,其特效粒子的物理模拟精度较同类产品提升47%。
该模型现已完成与国产计算平台的深度适配,支持从移动端到云端的多尺度视频生成需求。开发者社区实测显示,系统可稳定输出16:9、9:16及1:1等多种制式视频,其镜头控制系统支持推拉、摇移、环绕等八种专业运镜模式,配合动态幅度调节旋钮,为创作者提供影视工业级的参数化控制能力。技术白皮书披露,研发团队正在探索基于低秩适应的特效增强方案,计划在下一版本中实现光效粒子实时物理演算功能。