豆包App全新升级，灰度测试端到端语音模式，领先GPT-4o实现语音唱歌与角色扮演

2025-01-21 10:11:03 盛桂建

导读 2025年1月20日，豆包App发布了最新的“端到端”语音大模型，并基于此更新了实时语音通话功能。此次更新将语音识别、理解和生成整合到一个模...

2025年1月20日，豆包App发布了最新的“端到端”语音大模型，并基于此更新了实时语音通话功能。此次更新将语音识别、理解和生成整合到一个模型中，大幅提升了对话的流畅度和情感表达。新推出的“灵魂歌手”和“百变大咖”模式让豆包能够唱歌和模仿不同角色，包括明星、书中和影视中的角色，展现了其强大的拟人能力和交互自然度。

豆包此次更新采用了端到端方案，相较于传统的级联方案，在降低延时、提升自然度和情感表达方面有明显优势。这一变化不仅提升了AI语音交互的落地场景，从教育、客服等专业领域扩展到情感陪伴、心理咨询、配音等更广阔领域，也推动了AI拟人技术的发展。情感交互能力的提升为AI市场开辟了更广阔的空间，豆包在这一领域的进步备受关注。

标签：

免责声明：本文为转载，非本网原创内容，不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。