近两年,全球生成式AI应用的规模迅猛增长,根据IDC的预测,全球AI软件市场规模将从2022年的640亿美元增长至2027年的2790亿美元。在这样的背景下,VoiceEngine的问世不仅为多模态应用在各种场景下的落地提供了新的可能性,如辅助阅读、视频转译等,也为发音障碍人群提供了有效的语言表达辅助。
OpenAI对VoiceEngine的严格内测反映了其对合成语音潜在滥用风险的深刻认识。此外,OpenAI还公布了一系列安全措施,包括逐步淘汰基于语音的身份验证和开发追踪视听内容来源的技术等,以强调技术的潜力同时增强对潜在问题的抵御能力。
生成式AI技术在提供创新解决方案的同时,也引发了关于其使用安全性的讨论。例如,AI伪造的声音用于电信诈骗的潜在风险,以及利用AI生成语音影响选民投票的事件,这些都加剧了人们对于AI技术可能被滥用的担忧。
尽管如此,从业人士普遍认为VoiceEngine将对多种职业产生深远影响,包括播客、配音艺术家、口语表演者等。大众也对OpenAI的Sora和VoiceEngine两项前沿技术的结合充满期待,预示着真正意义上的有声AI视频乃至电影短片的到来。