DIGIPUNK
去投稿
发表于:2025年02月09日

即梦AI发布OmniHuman多模态视频生成模型,提升短片创作效率

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
要点速达👈
  • 🚀 OmniHuman让用户通过图片与音频生成高质量动态视频,提升创作效率
  • 🎨 支持多种图像格式,精准生成真人及动漫、3D卡通风格视频
  • 💡 技术突破解决了人物生成中的常见问题,提升了动作与表情的自然度
  • 🔒 为防滥用,生成的视频将加水印标识,并进行严格内容审核
  • 🛠️ 尽管已具备强大能力,OmniHuman仍在进行小范围内测,计划持续优化

数智朋克消息——即梦AI近日在社交平台发布了其新一代多模态视频生成模型OmniHuman的预告片。该模型利用前沿技术,让用户通过一张图片和一段音频轻松生成动态AI视频,极大地提升了视频创作的效率与效果。

OmniHuman是字节跳动自主研发的闭源AI模型,支持多种图片输入格式,如肖像、半身及全身图像,并能够根据音频生成相应的动作。无论是演讲、唱歌,还是乐器演奏与人物移动,OmniHuman都能精准还原人物的表情、手势和肢体动作。与传统技术相比,这项技术在解决人物生成中的常见问题——如手势失真等,已取得了显著进展。

这项技术的另一个亮点是其强大的多模态适应性。除了真人视频,OmniHuman还能够处理动漫、3D卡通等非真人风格图像,并生成既保留原有艺术风格,又自然再现人物运动的高质量内容。根据即梦AI展示的效果,生成的视频几乎无可察觉地与真实视频相区别,提升了短视频创作的创意空间。

字节跳动团队在技术优化方面也进行了大量努力,特别是在避免技术滥用上,OmniHuman不会对外提供下载功能。此外,为确保技术的安全与正面使用,即梦AI将在平台内进行小范围的内测,并对生成的视频内容进行严格审核。所有生成视频将加上水印标识,进一步避免不当应用。

虽然目前OmniHuman的生成技术已非常成熟,但即梦AI仍计划在未来进一步提升其影视级视频生成能力。相关负责人表示,技术的持续优化将确保其在更广泛的创作环境中发挥更大的作用。

本文链接: https://www.shuzhipunk.com/articles/a7bBqhOOROn
转载请注明文章出处

文章所属标签
OmniHuman
即梦AI
字节跳动