要点速达👈
- 📈 阿里云推出通义万相2.1,强化视频与图像生成性能。
- 🎥 复杂动态视频生成性能提升,支持无限长1080P视频生成。
- 🔠 首个支持中文文字生成及中英文文字特效的AI模型。
- 🖼️ 新增文生组图功能,支持电影级分镜、漫画和个性化头像设计。
- 🏆 VBench榜单成绩突出,以84.7%总分荣登榜首。
阿里云宣布其大模型“通义万相”完成迭代升级,推出2.1版本(简称万相2.1)。本次更新聚焦视频和图像生成核心能力,显著优化性能与体验。目前,该模型已全面开放,用户可通过通义万相官网进行免费体验。同时,开发者和企业用户也可以通过阿里云百炼平台调用API,探索AI工具的多样化开发及创新应用。
在视频生成领域,万相2.1的表现格外亮眼。全新架构支持复杂镜头运动,能够精准模拟碰撞、反弹、切割等物理现象,呈现高度真实的动态效果。在权威评测平台VBench中,该模型以84.7%的总分斩获榜首,技术实力领跑行业。针对复杂动态场景,如大幅度肢体运动和旋转,万相2.1在稳定性上实现大幅增强。
更令人瞩目的是,其文字视频生成能力取得历史性突破,成为首个支持中文文字生成并兼具中英文文字特效的AI模型,为广告创意和短视频制作领域带来全新可能。
“团队设计的独特视频编解码方案,通过分块处理与特征缓存技术突破显存限制,实现无限长1080P视频的高效生成与播放。”
长视频生成能力也迎来全新升级。这一技术为电影制作、教育视频及其他专业场景提供了极具实用价值的解决方案。
- 新增的文生组图功能支持生成电影级分镜、四格漫画及高度个性化头像设计。
- 通过引入IC-LoRA图像生成训练方法,结合DiT架构,文本理解与上下文优化能力得到全面提升。
- 生成内容更加贴合用户需求,推动AI图像生成的实际应用。