即梦AI发布OmniHuman多模态视频生成模型，提升短片创作效率

要点速达👈

🚀 OmniHuman让用户通过图片与音频生成高质量动态视频，提升创作效率
🎨 支持多种图像格式，精准生成真人及动漫、3D卡通风格视频
💡 技术突破解决了人物生成中的常见问题，提升了动作与表情的自然度
🔒 为防滥用，生成的视频将加水印标识，并进行严格内容审核
🛠️ 尽管已具备强大能力，OmniHuman仍在进行小范围内测，计划持续优化

数智朋克消息——即梦AI近日在社交平台发布了其新一代多模态视频生成模型OmniHuman的预告片。该模型利用前沿技术，让用户通过一张图片和一段音频轻松生成动态AI视频，极大地提升了视频创作的效率与效果。

OmniHuman是字节跳动自主研发的闭源AI模型，支持多种图片输入格式，如肖像、半身及全身图像，并能够根据音频生成相应的动作。无论是演讲、唱歌，还是乐器演奏与人物移动，OmniHuman都能精准还原人物的表情、手势和肢体动作。与传统技术相比，这项技术在解决人物生成中的常见问题——如手势失真等，已取得了显著进展。

这项技术的另一个亮点是其强大的多模态适应性。除了真人视频，OmniHuman还能够处理动漫、3D卡通等非真人风格图像，并生成既保留原有艺术风格，又自然再现人物运动的高质量内容。根据即梦AI展示的效果，生成的视频几乎无可察觉地与真实视频相区别，提升了短视频创作的创意空间。

字节跳动团队在技术优化方面也进行了大量努力，特别是在避免技术滥用上，OmniHuman不会对外提供下载功能。此外，为确保技术的安全与正面使用，即梦AI将在平台内进行小范围的内测，并对生成的视频内容进行严格审核。所有生成视频将加上水印标识，进一步避免不当应用。

虽然目前OmniHuman的生成技术已非常成熟，但即梦AI仍计划在未来进一步提升其影视级视频生成能力。相关负责人表示，技术的持续优化将确保其在更广泛的创作环境中发挥更大的作用。

即梦AI发布OmniHuman多模态视频生成模型，提升短片创作效率

数智资讯订阅