[心得] 整理翻译 mp3 vs AAC 与 有损 vs 无损

楼主: iaminanl (好MAN)   2017-12-19 12:15:55
《前言》
想写这篇文章很久了,
主要前阵子在探究Apple music与Spotify的音质差异,
就我所知,
- Apple music是256Kbps的AAC
- Spotify是320Kbps的MP3
(编按:这里完全误会,原来Spotify是OGG Vorbis,因此我拿掉后面不正确的结论)
以这主题来说,CODEC不同、位元率不同,要比较有点奇怪,
且还不考虑不同的mp3 codec也有差异、串流在不同环境下的比较,
要讨论音质其实并不容易。
然而网络上,至少中文的资源,针对这个主题,
往往只用描述的方式,
整理针对CODEC的说明、大概解释位元率,
深一点会解释不同编码的逻辑与特色
但很少透过具体图像,去比较声音如何被影响,
不论是透过示意图、算法模拟或是真实的转换,
我个人会很想知道“频谱或是波形,压缩前后的差异”
(当然对许多情况,不用讲到这么具体,就足以支持其论点)
寻寻觅觅,这篇来自Stereophile.com的老外文章,
看完拍案叫绝,
非常详尽的介绍有损压缩与无损压缩,
并拿几种常用的出来比较,使用频谱解释。
(有损的部分选择Mp3与AAC、无损选择FLAC)
https://www.stereophile.com/features/308mp3cd/index.html
其中使用频谱的部分,
选的题材非常具有启发性,
当然,频谱是非常根本、非常物理层的,
编曲、录音、混音、编码等等的技术往往影响音乐更多,
然而从最根本的角度去看不同的CODEC,
可以直接佐证一些特色与理念。
太精彩了,常常会打开来看,也很想整理起来,
最近工作很操,决定静下来写这篇文章转换心情。
《内文概述》
本篇文章将撷取文章,翻译给各位版友参考,
将包含:
- 翻译一段文字,解释录音档,以及有损压缩与无损压缩
- 利用这篇文章的图,简单比较不同codec的差异
(因为我比较熟悉英文的术语,翻译的部分看不懂可以讨论一下)
文章会有点长,尽可能的解释清楚是我的目标;
另外如果有兴趣可以点进去原文,
看底下的讨论,很多也很精彩。
《内文之一:有损与无损的差异(翻译)》
一片CD上,三分钟的录音档,大小为30到40MB。一台4G的iPod大概可以装入
一百三十首歌曲,大约只是九张唱片的大小,为了放进更多的歌,某种压缩
的技术让档案变很小就很必要,一方面也可以减少下载的时间。
无损压缩对于声音是无害的。就很像我们使用WinZip压缩电脑的档案,你读
取出来的内容跟压进去的内容一定是一样的。而一般档案的压缩与声音档案
的压缩最大的差异,在于后者需要能够随机存取。(想像为了听一张唱片,
还要等电脑把400M的档案全部解压缩完,大概会马上就不想听歌啦)如果有
办法把档案压到40~60%,一台4G的iPod就能放进三百首歌,大概是二十张唱
片,当然不同的压缩技术有点差异,但我们需要把档案压的更小。
1980末期,MP3这种CODEC被提出来,并在1991年变成一种标准。一般来说,
MP3的压缩比可以到10倍,也就是一首CD上要30MB的歌曲只需要3MB的储存空
间。现在iPod可以装进超过一千首歌了,而且通常家里一般的高速网络,只
要十秒,歌曲就被抓下来啦。
但天下没有白吃的午餐。MP3以及其他种类似压缩比的算法,都是“有损”
的:在这样的需求下,许多音乐资讯就被舍弃掉。而舍弃多少,就看他的位
元率,越低的位元率就越多音乐消失。
以CD来说,不考虑overhead,从唱片上拉下来的档案传输速率,两声道是超
过1400 Kbps,一般的MP3是使用十分之一,128Kbps。为了要这样搞,MP3把
连续的声音切成分离的时间区块,并透过各种转换去检视每个区块。Codec
的设计者,根据一些声音的心里学,做一些假设,讨论看看有哪些可以舍弃,
例如同一个时间里,播出比较小声的就被舍弃,毕竟大声的会盖过小声的。
另一方面为了要使用各种转换来处理,这些被切开的时间之间,可能具有的
连续性特质就也被舍弃了。(编按:这段英文好懂很多XD)
一般听众会不会感受到有东西被舍弃了?那些在不同区块间的连续性特质,
到底听不听的出来?如我1994年所写的,“如果这些算法,使用声音心理
学的假设时,所写出的算法是正确的,那大部分的人都听不出来的。”
欸欸,“如果”这个饼画的有点大。
况且,当各种算法间所做的假设都不太一样的同时,那些他们舍弃的,永
远舍弃的真实资讯,可能在一些使用者的系统上,有一些音乐是听的出来差
异的。用玩家术语来说,这些codec不够透明!有些测试可以轻易demo出来。
所以对我们这些发烧用户来说,讨论哪个有损压缩的音质最好,是有点阿杂
的事情。最好就使用WAV或AIF等完全没压缩的档案,不然就选择无损压缩,
像FLAC或ALAC,这些档案在不同种的系统、音乐间,对用户都是完全透明的。
(编按:透明,意思应该是指没有隐瞒)
《内文之二:不同code之间的差异:AAC与MP3》
进入讨论前,先简单介绍一下什么是频谱。
(信号与系统入门教学,START!)
人类的混沌持续数千年,直到富立叶转换出现,世界才有了光明,
所谓富立叶转换(Fourier Transform),
他证明出,世界上所有的波形(函数)都一定能透过一连串的单频波组成,
可能1% 10Hz+2% 11Hz+0.368% 12Hz+...+=原PO的声音,
把那些几趴几趴,对频率作图,就是大家所说的频谱。
男生、女生声音的频谱比较:
http://imgur.com/Kz2xsDk
y轴是刚刚说的几趴几趴,x轴就是越来越大的频率。
大概解释一下就好
作者: yenchieh1102 (香蕉史塔克)   2017-12-19 13:43:00
推整理
作者: stardust7011   2017-12-19 14:36:00
推推 受益良多 目前仍处于不是mp3就是CD转的状态
作者: alstorsummer (alstorsummer)   2017-12-19 19:18:00
推分享
作者: justlovekiss (就是爱亲亲)   2017-12-20 09:41:00
推专业

Links booklink

Contact Us: admin [ a t ] ucptt.com