DIGIPUNK
去投稿
发表于:2025年01月12日

阿里云万相2.1重磅升级:AI视频与图像生成能力全面突破

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
要点速达👈
  • 📈 阿里云推出通义万相2.1,强化视频与图像生成性能。
  • 🎥 复杂动态视频生成性能提升,支持无限长1080P视频生成。
  • 🔠 首个支持中文文字生成及中英文文字特效的AI模型。
  • 🖼️ 新增文生组图功能,支持电影级分镜、漫画和个性化头像设计。
  • 🏆 VBench榜单成绩突出,以84.7%总分荣登榜首。

阿里云宣布其大模型“通义万相”完成迭代升级,推出2.1版本(简称万相2.1)。本次更新聚焦视频和图像生成核心能力,显著优化性能与体验。目前,该模型已全面开放,用户可通过通义万相官网进行免费体验。同时,开发者和企业用户也可以通过阿里云百炼平台调用API,探索AI工具的多样化开发及创新应用。

在视频生成领域,万相2.1的表现格外亮眼。全新架构支持复杂镜头运动,能够精准模拟碰撞、反弹、切割等物理现象,呈现高度真实的动态效果。在权威评测平台VBench中,该模型以84.7%的总分斩获榜首,技术实力领跑行业。针对复杂动态场景,如大幅度肢体运动和旋转,万相2.1在稳定性上实现大幅增强。

更令人瞩目的是,其文字视频生成能力取得历史性突破,成为首个支持中文文字生成并兼具中英文文字特效的AI模型,为广告创意和短视频制作领域带来全新可能。

“团队设计的独特视频编解码方案,通过分块处理与特征缓存技术突破显存限制,实现无限长1080P视频的高效生成与播放。”

长视频生成能力也迎来全新升级。这一技术为电影制作、教育视频及其他专业场景提供了极具实用价值的解决方案。

  • 新增的文生组图功能支持生成电影级分镜、四格漫画及高度个性化头像设计。
  • 通过引入IC-LoRA图像生成训练方法,结合DiT架构,文本理解与上下文优化能力得到全面提升。
  • 生成内容更加贴合用户需求,推动AI图像生成的实际应用。

本文链接: https://www.shuzhipunk.com/articles/YFwzgGUwbWH
转载请注明文章出处

文章所属标签
通义万相
阿里云万相2.1
AI视频生成