IT之家 4 月 2 日消息,昆仑万维集团今日宣布,其音乐生成大模型“天工 SkyMusic”即日起开启免费邀测。本轮邀测将开放 1000 个免费名额,面向行业媒体、专家、以及感兴趣的音乐从业者开放,正式版将在 4 月 17 日随「天工 3.0」面向全社会免费开放。
“天工 SkyMusic”号称目前国内唯一公开可用 AI 生成大模型,天工 SkyMusic 采用音乐音频领域类 Sora 模型架构,Large-scale Transformer 负责谱曲,来学习 Music Patches 的上下文依赖关系,同时完成音乐可控性;Diffusion Transformer 负责演唱,通过 LDM 让 Music Patches 被还原成高质量音频,使其能够支持生成 80 秒 44100Hz 采样率双声道立体声歌曲。
据介绍,天工 SkyMusic 具备五大特点:高质量 AI 音乐,生成 80 秒 44100Hz 采样率双声道立体声 AI 歌曲、人声“以假乱真”,中文水平极为优秀,发音清晰无异响、歌词段落控制,生成的歌曲可以明确分辨出不同歌词段落的情绪变化、多种音乐风格,支持说唱 / 民谣 / 放克 / 古风 / 电子等、音乐智能表达,能够学习如颤音、歌剧、吟唱、男女对唱,自动和声等多种歌唱技巧。
值得注意的是,IT之家上月末曾报道了一款“音乐版 ChatGPT”工具 ——Suno V3,其在用户给出指定歌词之后能够生成不同曲风、流派的歌曲,甚至可以指定 AI 歌手的音色。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/759/642.htm]