要点速达👈
- 🆕 阿里巴巴发布Qwen2-Audio,新增语音问答功能。
- 🎤 Qwen2-Audio可理解并分析人声、自然音、音乐等音频信号。
- 📊 通义团队推出音频理解模型测评基准,设立行业新标准。
- 🎓 Qwen2-Audio相关研究入选ACL 2024国际会议。
数智朋克报道,阿里巴巴的通义大模型家族继续扩展,Qwen2系列迎来了全新成员——音频语言模型Qwen2-Audio。该模型能够在无需文本输入的情况下,直接进行语音问答,展现出对音频信号的强大理解和分析能力。Qwen2-Audio不仅能够处理人声,还能理解自然音和音乐等多种音频信号,为语音交互应用带来了新的可能性。
与Qwen2-Audio一同推出的,还有通义团队开发的一套全新音频理解模型测评基准,为行业内的音频处理技术提供了新的标准。这项创新研究也已成功入选本周举办的国际计算语言学顶会ACL 2024,展示了阿里巴巴在人工智能前沿领域的持续创新力。