谷歌推出 AudioPaLM,一款能说会听的大语言模型|全球新资讯
来源:ZAKER科技
发表日期:2023-06-25 11:25:04
(相关资料图)
品玩 6 月 25 日讯,据 huggingface 页面显示,谷歌研究团队近日推出一款大语言模型产品 AudioPaLM,可以实现语音理解和生成功能。
AudioPaLM 将两个大语言模型 PaLM-2 和 AudioLM 融合到一个统一的多模态架构之中,利用该架构处理和生成文本和语音。 AudioPaLM 还支持语音识别以及语音翻译。试验表明,AudioPaLM 的表现显著优于现有的语音翻译系统。