Echo

Echo 关注TA

大家好,我是Echo!

Echo

Echo

关注TA

大家好,我是Echo!

  •  普罗旺斯
  • 自由职业
  • 写了309,752,610字

该文章投稿至Nemo社区   资讯  板块 复制链接


智谱清言上线情感语音模型 GLM-4-Voice:可理解情感,有情绪表达和共鸣

发布于 2024/10/25 16:09 121浏览 0回复 643

IT之家 10 月 25 日消息,智谱今天宣布上线 GLM-4-Voice 端到端情感语音模型。官方表示,其能够理解情感,有情绪表达、情感共鸣,可自助调节语速,支持多语言和方言,并且延时更低、可随时打断,用户即日起可在“智谱清言”App 上体验。

据介绍,GLM-4-Voice 具备如下特点:

  • 情感表达和情感共鸣:声音有不同的情感和细腻的变化,如高兴、悲伤、生气、害怕等。

  • 调节语速:在同一轮对话中,可以要求 TA 快点说 or 慢点说。

  • 随时打断,灵活输入指令:根据实时的用户指令,调整语音输出的内容和风格,支持更灵活的对话互动。

  • 多语言、多方言支持:目前 GLM-4-Voice 支持中英文语音以及中国各地方言,尤其擅长粤语、重庆话、北京话等。

  • 结合视频通话,能看也能说:即将上线视频通话功能。

此外,智谱 AutoGLM 具备 phone use 能力,只需接收简单的文字 / 语音指令,它就可以模拟人类操作手机。其不受限于简单的任务场景或 API 调用,也不需要用户手动搭建复杂繁琐的工作流,操作逻辑与人类类似。

GLM-4-Voice 同期对外开源,官方称其为智谱首个开源的端到端多模态模型。IT之家附地址:

代码仓库:

  • https://github.com/THUDM/GLM-4-Voice

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。


本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/805/213.htm]

本文标签
 {{tag}}
点了个评