High Fidelity Neural Audio Compression

太強了!
我以為unet 用在人聲就很不錯了,generic 聽感模型已經早在199x 年被atrac musicam 之類的挖得差不多了(之後是有例如aac wma)

但我錯了,這3k 的品質也太好了點。