豆包App全新升级,灰度测试端到端语音模式,领先GPT-4o实现语音唱歌与角色扮演

盛桂建
导读 2025年1月20日,豆包App发布了最新的“端到端”语音大模型,并基于此更新了实时语音通话功能。此次更新将语音识别、理解和生成整合到一个模...

2025年1月20日,豆包App发布了最新的“端到端”语音大模型,并基于此更新了实时语音通话功能。此次更新将语音识别、理解和生成整合到一个模型中,大幅提升了对话的流畅度和情感表达。新推出的“灵魂歌手”和“百变大咖”模式让豆包能够唱歌和模仿不同角色,包括明星、书中和影视中的角色,展现了其强大的拟人能力和交互自然度。

豆包此次更新采用了端到端方案,相较于传统的级联方案,在降低延时、提升自然度和情感表达方面有明显优势。这一变化不仅提升了AI语音交互的落地场景,从教育、客服等专业领域扩展到情感陪伴、心理咨询、配音等更广阔领域,也推动了AI拟人技术的发展。情感交互能力的提升为AI市场开辟了更广阔的空间,豆包在这一领域的进步备受关注。

标签:

免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。