[轉貼] 影音壓縮技術 @ 心的距離

來源:影音壓縮技術

壹.為何要壓縮

MPEG(Motion Pictures Expert Group)它是一個協會組織,專門定義動態畫面壓縮規格,相對於JPEG(Joint Photographic Experts Group)則是專門定義靜態畫面壓縮規格的組織;其MPEG運用的地方有很多.如通訊,廣播,電視傳播,衛星通訊,影音光碟,MP3……..等等.這裡是針對影音光碟運用做介紹.影音光碟裡運用有,Video CD(包含卡拉OK CD),CD-I,DVD等.如果沒有MPEG提供標準的壓縮規格,我們也別想在一片薄薄的光碟片上看到這麼長的影片,在加上白皮書的標準,使我們可以在不同系統的Player放出影片.

故MPEG它提供影音光碟兩大功能:

A.壓縮功能:字面上MPEG的MP代表Motion Pictures,事實上影片只是一連串靜畫面,以台灣的電視規格(NTSC系統),一秒鐘有30張靜態畫面,現在你,Win95下,存一張 640x480 256色的BMP圖大概要300KB, 如果不壓縮的話,一張光碟根本放不了幾分鐘的影片.
B.跨平台功能:因為MPEG與白皮書的標準規格統一下,所以製好的視訊資料才可以在不同牌子的機器上還原再生撥放(家電產品),在PC和MAC上也可以撥放(電腦產品).

現在你可知道MPEG和影音光碟關係多密切了吧,下面我們分別介紹MPEG 1,MPEG 2,影音光碟應用方面,MPEG 1是給Video CD &MP3用的,MPEG 2 是給DVD用的.

貳.MPEG 1原理與應用

MPEG 1 是為了將聲音和影像做數位化及壓縮所定義的一套影音壓縮標準.主要的目標之一是與現存CD速率相容之下,提供VHS品質的影像及CD品質的聲音.這表示在使用MPEG 1的規格時,可以用單倍速的CD-ROM光碟機撥放72分鐘VHS品質的電影,此種資料傳輸速率是大約每秒2.5M bit,而影像解析度在NTSC規格下是352X240,每秒30個frames;在PAL下352X288,每秒25個frames.

將數位影像帶入PC用戶的最大障礙就是影像的龐大資料量,若在MPEG的352X240解析度,每秒30個frames之下,未壓縮的RGB格式影像每秒約需要60Megabits(即每分鐘需要456MegaBytes)的儲存空間及資料處理能力,這大約是MPEG影像資料的50倍和其它的壓縮格式相比,MPEG以較低的傳輸速率送相當高的品質,例如,在相等的影像品質之下,以Motion JPEG(MJPEG)格式壓縮擷取的資料,在容量商上就比MPEG擷取的資料大約6-10倍.

MPEG擷取的資料是由三種以不同壓縮方式的frames組合而成:

第一種為I-frames只用在壓縮完整frames,這種壓縮法類似JPEG壓縮而利用離散餘弦轉換(Discrete Cosine Transform ,DCT),量化(Quantization)和霍夫曼編碼法(Huffman Encoding)的數學程序來忽略較無關和重複的多餘資料,通常I-frames具有最大的資料,只需要I-frames的資料既可重組完整影像,不需要參考其他的frames.

第二種為P-frame(預測式frames ,Predictive frames),P-frame充分利用了動態預測以減少顯示一個影像所需的資料.目前顯示的frame是藉著參考前一個frame及記錄一種稱做巨集塊的動態影像次單位所組成,因此P-frame是由前後二個I-frame預測算出來的.

第三種為B-frame(雙向式frames ,Bi-directional),是藉由預測及修改來形成的,來自於前後frames的資訊組成目前B-frame影像.在這三種frames格式中,B-frame的資料容量最少.

P和B-frame應用前後frames的資料來減少顯示一個特定frame所需的資料總量,換句話說,它使用暫時性的壓縮(temporal compression)來壓縮資料,理所當然的P和B-frame並不是完整的資料,它們只有儲存解壓縮用的資料運算式已.這是MPEG壓縮不同於其他壓縮法,而使MPEG如此有效率的主要原因之一,在大部分的MPEG格式中典型的frames序列
(frame sequence)是: IBBPBBPBBPBBPBBPBBPBBP……

在兩個I-frame之間稱為GOP(畫面群,Group of Picture)其序列將會重複到影像結束.

MPEG也定義了壓縮聲音的方法是將聲音及影像交錯的放入系統資料的標準,MPEG聲音壓縮標準分成三種等級,分別稱為等級一,等級二,等級三 (level 1,level 2,level 3).等級一和等級二是使用在大部分的應用上,而等級三主要是使用在低位元速率的應用上,如MP3 player.當使用等級二的編碼時MPEG聲音標準是定義為擁有192Kbps,使用等級二可再現CD音質.實驗顯示於此標準之下,以訓練過的聽者對原始未壓縮的16位元44.1KHz立體聲和MPEG還原的聲音難以分辨.

最近在Internet上流行的MPEG 3 Audio(MP3)和MP3 player,則是屬於網路上低速率傳輸高品質聲音的方式,如果你將MP3用44.1KHz 16bit壓縮CD上的歌曲並存在硬碟上,其撥放的品質可比原CD音質差不多!而資料佔多少空間呢?簡單的算法一分鐘1Mbyte,如果你用CD-R來存放這些MP3資料,一片約可放600分鐘.那是不是可將多少心愛音樂CD壓縮存放在一張CD-R上呢?

參.MPEG 2應用

MPEG 1及Video CD最被人垢病的地方有兩個:

1.畫質大差,只有VHS的畫質,在大眾傳播的領域裏,Beta Cam是起嗎的,如果只有VHS的畫質,實在難登大雅之堂.
2.如果你說第一個條件是為專業人士設計的,和一般社會大眾有什麼關係,那第二點一定說你心有戚戚焉,長度問題.很多人在看VCD時都會抱怨,第一片看到一半,突然畫面停止,心想是不是當機了,搞了半天才想起,要換片了,一部電影至少90分鐘,以VCD的容量一定得放兩片,就算和LD一樣可自動換面,還是有被打斷的不爽感覺,於是MPEG 2和DVD就產生了,從此一片看到底,畫質又好得不得了,因為MPEG 2的影像bit rate將高達4-9Mbits/sec,比VCD的1.15Mbits/sec要高太多了.

DVD最大的訴求在於高畫質,高密度,多國語言,多國字幕,比LD更好的畫質.以發燒迷的立場想,當然希望DVD-Audio能夠採用 24bit/96KHz的型態問市,不過考量真正24bit的A/D轉換器以及D/A轉換器的製造技術尚未成熟,所以究竟DVD-Audio的決定版規格,會等到24bit的轉換器成熟後才推出,但目前還是以20bit/96KHz為主.

多數地區使用的PAL系統以MPEG為之.而美,日,台灣等地使用NTSC,少數地區域以杜比AC-3規格,所謂AC-3是由杜比(DOLBY)實驗室提出的一個新的聲音規格,屬於5.1Chanel的數位聲音規格,包含六個分離的一聲道,資料大小為20bit, 壓縮比為10:1到16:1.其整個音效環境的佈局為L,R,C,LS,LR,WOOFER.這比起找期杜比立體環繞技術(Dolby Sorround Pro Logic)的L,R,C以及一個立體環繞聲道,頻率範圍100Hz-7000Hz,音效的品質,or是可發音頻的範圍,都高了許多.

肆.MPEG 1 level 3 原理與應用

電腦如何儲存聲音在電腦中,所有的資料都是儲存成數位的型式,你可以想成所有的資料都是由 0和 1來表示,所以連聲音也不例外,在電腦世界裡面,聲音的儲存大致分為兩大類,第一類為聲波資料,另一類為合成音效；所謂的聲波資料,是經由類比數位轉換器來取樣將類比的訊號（例如我們的聲音），轉換成數位的訊號（0和1）,而所謂的合成音效,就是我們俗稱的MIDI（註1）,它是由電腦內建的音源所組合而成. 我們將聲波資料轉換成數位型式存儲在電腦當中,而儲存的大小依據兩個方面來考量,第一個是取樣頻率,第二個是取樣解析度,所謂的取樣頻率是指我們對於聲音頻率的取樣範圍,例如我們可以取5～5kHZ的範圍,也就是這個範圍的聲音我們都取樣,然後記錄下來,所以很容易理解的,範圍越大,所需要的儲存空間越大.

另一個觀點是所謂的取樣解析度,所謂的解析度是關於類比轉換成數位時, 我們取樣的次數,可以舉一個簡單的例子來比擬,就是一把十公分的尺,你可以每公分做一個刻度,那你的解析度就有限,但如果我們每公厘取個刻度,那整個精準度就提昇很多了,但相對的就是付出了更多的記憶體去記錄每個刻度.所以如果我們要聽品質很好的聲音,我們就要付出更多的記憶體空間.
註1：MIDI為Musical Instrument Digital Interface簡寫,樂器數位界面.

什麼是MP3

MP3是MPEG 1 Audio Layer 3的縮寫,MPEG是一個壓縮的規格,是由動畫專家軟體所發明的,當初發展的目的是希望降低資訊媒體的傳輸負載量.它是將聲音資料壓縮,排除原始聲音資料中多餘的資訊,所以能讓檔案尺寸大量減少,但是音質卻沒有隨之下降.例如原先一個50～60MB的Wave資料,用MP3壓縮後,就只要4MB多的空間就能儲存,所有一個光碟片上才能放上近百首的歌曲,而這是以往CD所辦不到的...

MPEG不斷在進步,所謂的MP3,是三種先進的編碼方式中最新的一個,並為原先的MPEG加入了許多先進的功能.其中之一是Layer 3採用了一致性編碼法”（Entropy Encoding）將聲音資料中多餘的部份降到最低.由於這樣的功能,MP3才能在不降低音質的前提下,以12：1的比例壓縮CD中的音樂.

MPEG各壓縮規格比較表

好了,我們現在已經知道MP3,其實是MPEG Audio Layer-3的簡寫,那您是否好奇,是否有MPEG Audio Layer-2或者MPEG Audio Layer-1,沒有錯,他們的確存在,而且很多我們已經在享用了,只是我們不知道而已,例如我們常看的VCD,其實就是MPEG-1的壓縮方式錄製儲存的,好,那他們的壓縮比例各自為何呢?讓我們看一下下列的圖示:

好,首先,最下面的是Wave資料的大小,依序而上,分別為MPEG－1,MPEG－2,MPEG－3.

為何我們要取Wave資料當作我們的比較對象呢？因為Wave資料是一種沒有經過壓縮的音訊檔案格式,他唯一的好處就是不失真而已,所以由上圖,我們可以很明顯的得知,MP3不愧是壓縮中最厲害的一個,可以達到1：0~1：12的比例,這也就是為什麼,我們可以在小小的記憶體中裝入進百首的歌曲.

也許您會好奇:捷克,這是如何辦到的,原因很簡單,首先是先進的編碼技術,讓整個資料重新編碼壓縮,其次是利用資料的縮減,例如我們人的耳朵,對於超過 15KHz的聲音就不是很靈敏了,所以聰明的科學家就想阿,既然聽不到,幹嘛要錄下來,所以就將一些資料刪掉,讓資料更小,所以縱使整個資料失真了,但其實我們也感覺不出來說.

其實MP3的可行,也要歸功於CPU處理速度的越來越快,所以才能一邊撥放歌曲,一邊解碼,這是以前電腦所不容易做到的,不然您也可以試著將您的電腦同時開Word, Access,開個三四個,然後您在看看您的MP3是否還那樣流暢說...

我們了解到MPEG各個規格的壓縮比例不同,但是什麼東西造成這種現象呢？主要的原因就是取樣的頻率.我們可以先用下列的表格,讓您先大致了解一下...

規格取樣演算方式壓縮比例取樣率
MPEG-1 Layer-1 固定取樣率 4:1 384Kbps
MPEG-1 Layer-2 可調取樣率 6:1到8:1 256Kbps至192Kbps
MPEG-1 Layer-3 可調取樣率 10:1到12:1 128kbps至112Kbps

好,看到這個表格,我們要依序解釋幾個名詞,相信便能更了解.

取樣演算方式

所謂的取樣演算方式就是探討他是否可以調整其取樣頻率,很明顯可以看出MP1沒有辦法,他只能固定在384Kbps的取樣率,這樣是什麼意思呢？就是說, 就是代表這種壓縮規格有點死板,就只能這樣壓,假設我們只是要通電話,您會要求音質要接近CD的音質嗎？我想這是不必要的,所以後期發展出來的MP2和 MP3都具有調整取樣頻率的功能,這樣的好處是我們可以根據實際情形，來調整資料大小...

壓縮比例

這個欄位是以和原始的Wave檔為一個比較,也就是利用MP1只能壓成原始檔案的四分之一,而MP3卻能高達十二分之一,差別有夠大的說...

取樣率

這個是以每秒中多少Kbps為一個單位,取樣頻率越高,當然失真就越小拉.這裡您可能會想到一個問題,那是否可以將取樣頻率再降低,那不是就能將檔案壓成更小嗎？沒有錯,但相對的您就會付出失真的代價喔,所謂的失真,簡單來講就是音質更差的意思,我們提供一個表格,讓您可以清楚的了解這其中的差異性...

音質頻率聲道取樣率壓縮率
音樂CD的音質 >15KHz Stereo 112K~128Kbps 1:12~14
接近CD的音質 15KHz Stereo 96Kbps 1:16
FM收音機的音質 11KHz Stereo 56K~64Kbps 1:24~26
AM收音機的音質 7.5KHz Mono 32Kbps 1:24
短波無線電的音質 4.5KHz Mono 16Kbps 1:48
電話的音質 2.5KHz Mono 8Kbps 1:96

由上面這個表,我們便可以清楚的了解到,取樣頻率越低,壓縮率就越高,還辦法,這就是現實,總是有取捨的阿...就看您需求的是什麼拉!!

kezeodsnx

心的距離

kezeodsnx 發表在痞客邦留言(0) 人氣()

E-mail轉寄

心的距離

Custom Search

[轉貼] 影音壓縮技術

歷史上的今天

留言列表

文章搜尋

參觀人氣

文章分類

生活 (4)

Linux (7)

心的距離

@import url(http://www.google.com/cse/api/branding.css); Custom Search

[轉貼] 影 音 壓 縮 技 術

歷史上的今天

留言列表

文章搜尋

廣告版面

廣告版面

參觀人氣

文章分類

生活 (4)

Linux (7)

Custom Search

[轉貼] 影音壓縮技術