近日,Meta公布了一项新的AI语音压缩技术“EnCodec”,号称能以64kbps的速度压缩比MP3格式小10倍的音频,同时还能保证质量不流失。
Meta指出压缩技术对现在的互联网非常重要。这样,用户可以轻松发送高质量的图片和语音消息。然而,发送这些多媒体消息需要足够的带宽和存储空间,尤其是在未来,因此需要更好的压缩技术。
据介绍,“ENCODEC”AI训练模型涵盖三个部分,分别是编码器、量化器和解码器。
编码器可以将原始数据转换为较低帧速率的格式,然后量化器将数据压缩到目标大小。最后解码器通过神经网络对数据进行解码。
值得一提的是,虽然之前有人尝试过用神经网络压缩音频,但Meta是第一个将这项技术用于48kHz立体声的团队。