DIGIPUNK
去投稿
发表于:2024年11月06日

HeyGen推出全新AI生成视频头像功能,支持自然语音克隆技术

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
要点速达👈
  • 📸 HeyGen推出20张照片即可生成动态视频头像的新功能
  • 🎤 集成语音克隆技术,文本输入也能自然发声
  • 💡 融合OpenAI语音引擎,实现多语言自然表达
  • 🔄 互动头像测试上线,即时对话成为可能
  • 🌐 视频头像支持自定义背景、发型和服装

数智朋克消息,HeyGen最新推出的AI头像生成功能,通过仅需20张脸部照片,即可自动生成高精度的动态视频头像,并支持自然流畅的语音同步。新功能让用户在不需要复杂的录制和训练的情况下,快速创建视频效果,与过去相比大大降低了使用门槛。生成的AI头像不仅支持常规表情和语音互动,还允许用户通过文本输入来让头像"开口"说话,且呈现效果十分逼真。

新服务不仅适用于真人照片,还可通过AI生成图像来进行训练。这些图像经过AI的自动判断处理后,HeyGen会生成具备自然动作和表情的动态头像,并支持高度准确的唇形同步。过去,使用HeyGen制作口型同步视频需借助“Photo Avatar”功能,如今借助这一升级,HeyGen已可在大幅提升唇形同步的精确度。

除了图像生成,HeyGen的新功能还结合了先进的语音克隆技术(TTS),支持将文本转换成接近真人的声音。HeyGen整合了OpenAI的语音引擎技术,使生成的AI语音具有自然的多语言能力。与Runway Gen-3等其他视频生成工具相比,HeyGen的语音克隆更加智能化,自动实现视频与音频的无缝对接。同时,新功能还允许用户使用AI克隆个性化声音,只需少量原始语音数据即可让虚拟形象发出接近真人的声音。此外,在视频生成中可以指定头像的发型、服饰和背景,大大提升了视频的可定制性。

目前,HeyGen已在测试基于AI生成的实时互动头像功能,未来或将支持用户与AI头像进行即时对话。尽管该功能尚在测试阶段,但可以预见其潜力巨大,未来用户将可通过HeyGen生成能够动态互动的个性化虚拟形象。

本文链接: https://www.shuzhipunk.com/articles/KRYzggCYaRH
转载请注明文章出处

文章所属标签
HeyGen
AI生成视频
语音克隆