Echo

Echo 关注TA

大家好,我是Echo!

Echo

Echo

关注TA

大家好,我是Echo!

  •  普罗旺斯
  • 自由职业
  • 写了309,771,871字

该文章投稿至Nemo社区   资讯  板块 复制链接


FFmpeg 之父发布音频压缩工具 TSAC,3.5 分钟立体声歌曲压缩至 192 KiB

发布于 2024/04/12 11:43 172浏览 0回复 772

感谢IT之家网友 地板轰鸣 的线索投递!

IT之家 4 月 12 日消息,FFmpeg 之父法布里斯・贝拉(Fabrice Bellard)发布音频压缩工具 TSAC 。

TSAC 可以把音频比特率压缩达到非常低,对于 44.1 kHz 的音频,TSAC 可压缩至单声道 5.5 kb / s 或立体声 7.5 kb / s,同时保持良好的听感。TSAC 号称可以将 3.5 分钟的立体声歌曲压缩为 192 KiB 的文件

TSAC 官网提供了一系列原声与压缩片段,供用户对比试听:https://bellard.org/tsac/

截屏2024-04-12 10.43.10

TSCA 基于为立体声扩展的 Descript 音频编解码器的修改版本和 Transformer 模型,以进一步提高压缩比,两种模型都量化为每个参数 8 位。

因为压缩过程需要调用 CUDA,所以须使用英伟达 GPU。如果只使用 CPU,压缩速度会非常慢,且 CPU 必须支持 AVX2 指令集。

TSCA 的作者法布里斯・贝拉,是一位业内非常著名的计算机程序员,IT之家附法布里斯・贝拉介绍:

法布里斯・贝拉,1972 年生于法国格勒诺布尔(Grenoble)。在高中就读期间开发了著名的可执行压缩程序 LZEXE,这是当年 DOS 上第一个广泛使用的文件压缩程序。大学就读于巴黎综合理工学院,后在巴黎高等电信学校攻读。

1997 年他提出了最快速的计算圆周率的算法。2000 年他创建了 FFmepg 项目,这是一个领先的开源多媒体框架,大部分媒体播放器均使用该框架。他的另一个重要贡献是编写了 QEMU,这是一个高速度及跨平台的开源模拟器。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。


本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/761/407.htm]

本文标签
 {{tag}}
点了个评