為什麼採集聲音信號時間要超過一秒
Ⅰ 聲音數字化的原理
原理如下:
一、模擬信號和數字信號
模擬信號是指信號隨時間的變化是連續的,即任意時間點總有一個瞬態的信號量與之對應,所以我們也將模擬信號稱為連續信號。那麼模擬信號為什麼叫模擬信號呢?模擬信號傳輸過程中就是利用感測器把各種自然界各種連續的信號轉換為幾乎一模一樣的電信號。比如說話聲音,原本是聲帶的震動,經過麥克風的採集,將聲波信號轉換為電信號,此時的電信號波形是和原來的聲波波形一樣的。只是換了種物理量來表示和傳遞。因此,模擬信號就是用電信號來直接模擬了自然界各種物理量。而與之對應的數字信號則是不連續的離散的,是對模擬信號進行采樣得到。數字信號是模擬信號的近似,即然是近似就不可能完全一模一樣。所以相對於自然界的信號,數字信號只能做到無限的接近。既然我們自然界所有的物理量都是模擬信號,為啥還需要數字信號呢?因為數字信號更便於計算機做直接各種數字處理、計算和存儲,所以任何信號轉換成了數字量後,就可以充分利用計算機來做各種計算和處理。
二、數字音頻化
我們把聲音模擬信號轉換成數字信號的過程稱為音頻數字化(A/D轉換,模數轉換)。目前最常見的方案是PCM(脈沖編碼調制PulseCoddeMolation),其主要過程是:采樣->量化->編碼。
1、采樣
把時間連續的信號轉換為一連串時間不連續的脈沖信號,這個過程稱為采樣。也就是每隔一段時間採集一次模擬信號的樣本。采樣後的脈沖信號稱為采樣信號,采樣信號在時間軸上是離散的。每秒採集的樣本數量,稱為采樣率,比如采樣率44.1kHz表示1秒鍾採集44100個樣本。采樣率越高,還原的聲音也就越真實。由於人耳的聽覺范圍是20Hz~20kHz,根據香農采樣定理(若信號的最高頻率為fmax,只要采樣頻率f>=2fmax,采樣信號就能唯一復現原信號),理論上來說要把採集的聲音信號唯一地還原成原來的聲音,聲音采樣率需要高於聲音信號最高頻率的2倍,需要至少每秒進行40000次采樣(40kHz采樣率)。這就是為什麼常見的CD采樣率為44.1kHz,電話、無線對講機和無線麥克風等的采樣率是8kHz。
2、量化
采樣信號量化為數字信號的過程,稱為量化。就是將每一個采樣點的樣本值數字化。
2.1、位深度
位深度(也叫采樣精度,采樣大小,BitDepth)表示使用多少個二進制位來存儲一個采樣點的樣本值。位深度越高,表示的振幅越精確。若要盡可能精確的還原聲音,只有高采樣率是不夠的。描述一個采樣點,橫軸(時間)代表采樣率,縱軸(幅度)代表位深度。16bit表示用16位(2個位元組)來表示對該采樣點的振幅進行編碼時所能達到的精確程度,就是把縱軸分成16份描述振幅大小。常見的常見的CD採用16bit的位深度,能表示65535(2^16)個不同值。DVD使用24bit的位深度,大部分電話設備使用8bit位深度。
3、編碼
將采樣和量化後的數字數據轉成二進制碼流。
如果想要播放聲音,需進行D/A轉換(數模轉換),把數字信號轉再換成模擬信號。
Ⅱ 為什麼用labview採集的聲音信號時間只有0.45s
這個是看你的存儲深度是多少定的。
使用的Labview的聲音採集卡的話,可以設置採集的時長之類的參數。或者實時採集之類的。
Ⅲ 音頻文件中的比特率和采樣率分別指什麼
音頻文件中的比特率和采樣率的含義如下:
1、比特率:
比特率是指每秒傳送的比特(bit)數。單位為bps(Bit Per Second),比特率越高,每秒傳送數據就越多。聲音中的比特率是指將模擬聲音信號轉換成數字聲音信號後,單位時間內的二進制數據量,是間接衡量音頻質量的一個指標。
2、采樣率:
音頻采樣率是指錄音設備在一秒鍾內對聲音信號的采樣次數,采樣頻率越高聲音的還原就越真實越自然。在當今的主流採集卡上,采樣頻率一般共分為11025Hz、22050Hz、24000Hz、44100Hz、48000Hz五個等級。
(3)為什麼採集聲音信號時間要超過一秒擴展閱讀:
比特率的幾種分類:
1、VBR(Variable Bitrate):動態比特率也就是沒有固定的比特率,壓縮軟體在壓縮時根據音頻數據即時確定使用什麼比特率,這是以質量為前提兼顧文件大小的方式,推薦編碼模式;
2、ABR(Average Bitrate):平均比特率是VBR的一種插值參數。LAME針對CBR不佳的文件體積比和VBR生成文件大小不定的特點獨創了這種編碼模式。
ABR在指定的文件大小內,以每50幀(30幀約1秒)為一段,低頻和不敏感頻率使用相對低的流量,高頻和大動態表現時使用高流量,可以做為VBR和CBR的一種折衷選擇。
3、CBR(Constant Bitrate):常數比特率指文件從頭到尾都是一種位速率。相對於VBR和ABR來講,它壓縮出來的文件體積很大,而且音質相對於VBR和ABR不會有明顯的提高
參考資料來源:網路-音頻采樣率
參考資料來源:網路-比特率
Ⅳ sampling time 和采樣精度有關系嗎
音頻采樣大小和采樣率是兩個獨立互不影響的數值,因此采樣大小並不能決定采樣率為多少,具體還得看音頻原錄制者如何設置。
簡單地說:
1.采樣位數可以理解為採集卡處理聲音的解析度。這個數值越大,解析度就越高,錄制和回放的聲音就越真實;
2.采樣頻率是指錄音設備在一秒鍾內對聲音信號的采樣次數,采樣頻率越高聲音的還原就越真實越自然。
因此,採集音頻時完全可以用一個很大的解析度進行采樣,但減少採樣次數(降低采樣頻率),使音頻聽起來真實,但不流暢自然。而想讓一個音頻有最好的音質,需要用最高的采樣位數,同時使用最大的采樣頻率,最終會使音頻變得非常大。
音頻采樣 (Audio Sampling)
數碼音頻系統是通過將聲波波形轉換成一連串的二進制數據來再現原始聲音的,實現這個步驟使用的設備是模/數轉換器(A/D)它以每秒上萬次的速率對聲波進行采樣,每一次采樣都記錄下了原始模擬聲波在某一時刻的狀態,稱之為樣本。將一串的樣本連接起來,就可以描述一段聲波了,把每一秒鍾所采樣的數目稱為采樣頻率或采率,單位為HZ(赫茲)。采樣頻率越高所能描述的聲波頻率就越高。采樣率決定聲音頻率的范圍(相當於音調),可以用數字波形表示。以波形表示的頻率范圍通常被稱為帶寬。要正確理解音頻采樣可以分為采樣的位數和采樣的頻率。
采樣的位數 (Aampling bitrate / 或作 Sampling Bitrate Resolution)
采樣位數可以理解為採集卡處理聲音的解析度。這個數值越大,解析度就越高,錄制和回放的聲音就越真實。我們首先要知道:電腦中的聲音文件是用數字0和1來表示的。連續的模擬信號按一定的采樣頻率經數碼脈沖取樣後,每一個離散的脈沖信號被以一定的量化精度量化成一串二進制編碼流,這串編碼流的位數即為采樣位數,也稱為量化精度。從碼率的計算公式中可以清楚的看出碼率和采樣位數的關系:碼率=取樣頻率×量化精度×聲道數。
在電腦上錄音的本質就是把模擬聲音信號轉換成數字信號。反之,在播放時則是把數字信號還原成模擬聲音信號輸出。採集卡的位是指採集卡在採集和播放聲音文件時所使用數字聲音信號的二進制位數。採集卡的位客觀地反映了數字聲音信號對輸入聲音信號描述的准確程度。8位代表2的8次方--256,16位則代表2的16次方--64K。比較一下,一段相同的音樂信息,16位音效卡能把它分為64K個精度單位進行處理,而8位音效卡只能處理256個精度單位。8位采樣的差別在於動態范圍的寬窄,動態范圍寬廣,音量起伏的大小變化就能夠更精細的被記錄下來,如此一來不論是細微的聲音或是強烈的動感震撼,都可以表現的淋漓盡致,而CD音質的采樣規格正式16位采樣的規格。
16位二進制數的最小值是0000000000000000,最大值是1111111111111111,對應的十進制數就是0和65535,也就是最大和最小值之間的差值是65535,也就是說,它量化的模擬量的動態范圍可以差65535,也就是96.32分貝,所以,量化精度只和動態范圍有關,和頻率響應沒關系。動態范圍定在96分貝也是有道理的,人耳的無痛苦極限聲壓是90分貝,96分貝的動態范圍在普通應用中足夠使用,所以96分貝動態范圍內的模擬波,經量化後,不會產生削波失真的。聲音的位數就相當於畫面的顏色數,表示每個取樣的數據量,當然數據量越大,回放的聲音越准確,不至於把開水壺的叫聲和火車的鳴笛混淆。同樣的道理,對於畫面來說就是更清晰和准確,不至於把血和西紅柿醬混淆。不過受人的器官的機能限制,16位的聲音和24位的畫面基本已經是普通人類的極限了,更高位數就只能靠儀器才能分辨出來了。比如電話就是3kHZ取樣的7位聲音,而CD是44.1kHZ取樣的16位聲音,所以CD就比電話更清楚。
如今市面上所有的主流產品都是16位的採集卡,而並非有些無知商家所鼓吹的64位乃至128位,他們將採集卡的復音概念與采樣位數概念混淆在了一起。如今功能最為強大的採集卡系列採用的EMU10K1晶元雖然號稱可以達到32位,但是它只是建立在Direct Sound加速基礎上的一種多音頻流技術,其本質還是一塊16位的音效卡。應該說16位的采樣精度對於電腦多媒體音頻而言已經綽綽有餘了。 很多人都說,就算從原版CD抓軌,再刻錄成CD,重放的音質也是不一樣的,這個也是有道理的,那麼,既然0101這樣的二進數是完全克隆的,重放怎麼會不一樣呢?那是因為,時基問題造成的數模互換時的差別,並非是克隆過來的二進制數變了,二進制數一個也沒變,時基誤差不一樣,數模轉換後的模擬波的頻率和源相比就會有不一樣。
采樣的頻率 (Sampling rate / 或作 Sampling frequency)
采樣頻率是指錄音設備在一秒鍾內對聲音信號的采樣次數,采樣頻率越高聲音的還原就越真實越自然。在當今的主流採集卡上,采樣頻率一般共分為22.05KHz、44.1KHz、48KHz三個等級,22.05 KHz只能達到FM廣播的聲音品質,44.1KHz則是理論上的CD音質界限,48KHz則更加精確一些。對於高於48KHz的采樣頻率人耳已無法辨別出來了,所以在電腦上沒有多少使用價值。
5kHz的采樣率僅能達到人們講話的聲音質量。
11kHz的采樣率是播放小段聲音的最低標准,是CD音質的四分之一。
22kHz采樣率的聲音可以達到CD音質的一半,目前大多數網站都選用這樣的采樣率。
44kHz的采樣率是標準的CD音質,可以達到很好的聽覺效果。
采樣率類似於動態影像的幀數,比如電影的采樣率是24赫茲,PAL制式的采樣率是25赫茲,NTSC制式的采樣率是30赫茲。當我們把采樣到的一個個靜止畫面再以采樣率同樣的速度回放時,看到的就是連續的畫面。同樣的道理,把以44.1kHZ采樣率記錄的CD以同樣的速率播放時,就能聽到連續的聲音。顯然,這個采樣率越高,聽到的聲音和看到的圖像就越連貫。當然,人的聽覺和視覺器官能分辨的采樣率是有限的。對同一段聲音,用20kHz和44.1kHz來采樣,重放時,可能可以聽出其中的差別,而基本上高於44.1kHZ采樣的聲音,比如說96kHz采樣,絕大部分人已經覺察不到兩種采樣出來的聲音的分別了。之所以使用44.1kHZ這個數值是因為經過了反復實驗,人們發現這個采樣精度最合適,低於這個值就會有較明顯的損失,而高於這個值人的耳朵已經很難分辨,而且增大了數字音頻所佔用的空間。一般為了達到「萬分精確」,我們還會使用48k甚至96k的采樣精度,實際上,96k采樣精度和44.1k采樣精度的區別絕對不會象44.1k和22k那樣區別如此之大,我們所使用的CD的采樣標准就是44.1k。
Ⅳ 音頻基礎概念
人類耳朵的聽力有一個頻率范圍,大約是20Hz~20kHz
通過采樣和量化技術獲得的離散性(數字化)音頻數據。計算機內部處理的是二進制數據,處理的都是數字音頻,所以需要將模擬音頻通過采樣、量化轉換成有限個數字表示的離散序列 (即實現音頻數字化) 。
對於高質量的音頻信號,其頻率范圍(人耳能夠聽到的頻率范圍)是20Hz~20kHz,所以采樣頻率一般為 44.1kHz ,這樣就可以保證采樣聲音達到20kHz也能被數字化,從而使得經過數字化處理之後,人耳聽到的聲音質量不會被降低。而所謂的44.1kHz就是代表1秒會采樣44100次。
量化是指在幅度軸上對信號進行數字化,比如用16比特的二進制信號來表示聲音的一個采樣。
表示一個樣本的二進制的位數,即樣本的比特數。量化是將經過 采樣得到的離散數據轉換成二進制數的過程 ,量化深度表示每個采樣點用多少比特表示,在計算機中音頻的量化深度一般為4、8、16、32位(bit)等。例如:量化深度為8bit時,每個采樣點可以表示256個不同的量化值,而量化深度為16bit時,每個采樣點可以表示65536個不同的量化值。量化深度的大小影響到聲音的質量,顯然, 位數越多,量化後的波形越接近原始波形 ,聲音的質量越高,而需要的存儲空間也越多
就是按照一定的格式記錄采樣和量化後的數字數據,比如 順序存儲或壓縮存儲。
==比特率==(它用於衡量音頻數據單位時間內的容量大小)
是實現聲波/數字信號相互轉換的一種硬體。音效卡的基本功能是把來自話筒、磁帶、光碟的原始聲音信號加以轉換,輸出到耳機、揚聲器、擴音機、錄音機等聲響設備,或通過音樂設備數字介面(MIDI)使樂器發出美妙的聲音。
==無損壓縮== 是指解壓後的數據可以完全復原。在常用的壓縮格式中,用得較多的是有損壓縮,
==有損壓縮== 是指解壓後的數據不能完全復原,會丟失一部分信息,壓縮比越小,丟失的信息就越多,信號還原後的失真就會越大。
根據不同的應用場景(包括存儲設備、傳輸網路環境、播放設備等),可以選用不同的壓縮編碼演算法,如PCM、WAV、AAC、MP3、Ogg等。
<u> 壓縮編碼的原理實際上是壓縮掉冗餘信號,冗餘信號是指不能被人耳感知到的信號 </u>
而WAV編碼的一種實現(有多種實現方式,但是都不會進行壓縮操作)就是 在PCM數據格式的前面加上44位元組,分別用來描述PCM的采樣率、聲道數、數據格式等信息。
MP3具有不錯的壓縮比,使用LAME編碼(MP3編碼格式的一種實現)的中高碼率的MP3文件,聽感上非常接近源WAV文件,當然在不同的應用場景下,應該調整合適的參數以達到最好的效果。
特點 :音質在128Kbit/s以上表現還不錯,壓縮比比較高,大量軟體和硬體都支持,兼容性好。
適用場合 :高比特率下對兼容性有要求的音樂欣賞。
AAC是新一代的音頻有損壓縮技術,它通過一些附加的編碼技術(比如PS、SBR等),衍生出了LC-AAC、HE-AAC、HE-AAC v2三種主要的編碼格式
特點 :在小於128Kbit/s的碼率下表現優異,並且多用於視頻中的音頻編碼。
適用場合 :128Kbit/s以下的音頻編碼,多用於視頻中音頻軌的編碼。
Ogg是一種非常有潛力的編碼,在各種碼率下都有比較優秀的表現,尤其是在中低碼率場景下。Ogg除了音質好之外,還是完全免費的,這為Ogg獲得更多的支持打好了基礎。Ogg有著非常出色的演算法,可以用更小的碼率達到更好的音質,
特點 :<u>可以用比MP3更小的碼率實現比MP3更好的音質</u>,高中低碼率下均有良好的表現,兼容性不夠好,流媒體特性不支持。
適用場合 :語音聊天的音頻消息場景。
(Moving Picture Experts Group,動態圖像專家組)是ISO(International Standardization Organization,國際標准化組織)與IEC(International Electrotechnical Commission,國際電工委員會)於1988年成立的專門針對運動圖像和語音壓縮制定國際標準的組織。
Acc一個音頻幀包含1024個采樣點,MP3一個音頻幀包含1152個采樣點。
音頻幀的播放時間
在音序器軟體中看到的一條一條的平行「軌道」 。每條音軌分別定義了該條音軌的屬性,如音軌的音色,音色庫,通道數,輸入/輸出埠,音量等。
當使用音序器時,一條音軌對應於音樂的一個聲部,它把 MIDI 或者音頻數據記錄在特定的時間位置。每一音軌可以定義為一種樂器的演奏。 所有的音序器都可以允許多音軌操作,這就意味著一首歌所有的音軌,無論是 MIDI 還是音頻都能同時播放。
指聲音在錄制或播放時在不同空間位置採集或回放的相互獨立的音頻信號 ,所以聲道數也就是聲音錄制時的音源數量或回放時相應的揚聲器數量。
從雙聲道開始,聲音在錄制過程中被分配到兩個獨立的聲道,從而達到了很好的聲音定位效果。這種技術在音樂欣賞中顯得尤為有用,聽眾可以清晰地分辨出各種樂器來自的方向,從而使音樂更富想像力,更加接近於臨場感受。
記錄聲音時,如果每次生成一個聲波數據,稱為單聲道;每次生成兩個聲波數據,稱為雙聲道。使用雙聲道記錄聲音,能夠在一定程度上再現聲音的方位,反映人耳的聽覺特性。
音頻采樣率是指錄音設備在一秒鍾內對聲音信號的采樣次數,采樣頻率越高聲音的還原就越真實越自然。在當今的主流採集卡上,采樣頻率一般共分為11025Hz、22050Hz、24000Hz、44100Hz、48000Hz五個等級
頻率對應於時間軸線,振幅對應於電平軸線。波是無限光滑的,弦線可以看成由無數點組成,由於存儲空間是相對有限的,數字編碼過程中,必須對弦線的點進行采樣。采樣的過程就是抽取某點的頻率值,很顯然,在一秒中內抽取的點越多,獲取得頻率信息更豐富, 為了復原波形,一次振動中,必須有2個點的采樣,人耳能夠感覺到的最高頻率為20kHz,因此要滿足人耳的聽覺要求,則需要至少每秒進行40k次采樣,用40kHz表達,這個40kHz就是采樣率。我們常見的CD,采樣率為44.1kHz。
Ⅵ 廣播級別的音頻采樣率要達到多少
廣播級別的音頻采樣率要達到22050Hz和24000HZ。
音頻采樣率是指錄音設備在一秒鍾內對聲音信號的采樣次數,采樣頻率越高聲音的還原就越真實越自然。采樣率類似於動態影像的幀數,比如電影的采樣率是24赫茲,PAL制式的采樣率是25赫茲,NTSC制式的采樣率是30赫茲。
當把采樣到的一個個靜止畫面再以采樣率同樣的速度回放時,看到的就是連續的畫面。同樣的道理,把以44.1kHZ采樣率記錄的CD以同樣的速率播放時,就能聽到連續的聲音。采樣率越高,聽到的聲音和看到的圖像就越連貫。
在當今的主流採集卡上,采樣頻率一般共分為11025Hz、22050Hz、24000Hz、44100Hz、48000Hz五個等級,11025Hz能達到AM調幅廣播的聲音品質,而22050Hz和24000HZ能達到FM調頻廣播的聲音品質,44100Hz則是理論上的CD音質界限,48000Hz則更加精確一些。
(6)為什麼採集聲音信號時間要超過一秒擴展閱讀:
音頻采樣率的注意事項:
1、聲音其實是一種能量波,因此也有頻率和振幅的特徵,頻率對應於時間軸線,振幅對應於電平軸線。波是無限光滑的,弦線可以看成由無數點組成,由於存儲空間是相對有限的,數字編碼過程中,必須對弦線的點進行采樣。
2、採集過程中視頻和音頻同步是非常重要的,光有頻率信息是不夠的,我們還必須獲得該頻率的能量值並量化,采樣率和采樣大小的值越大,記錄的波形更接近原始信號。
參考資料來源:網路-音頻采樣率
Ⅶ 簡釋:(1)聲音采樣頻率;(2)聲音樣本位數;(3)midi技術.
采樣頻率是指計算機每秒鍾採集多少個聲音樣本,是描述聲音文件的音質、音調,衡量音效卡、聲音文件的質量標准。采樣頻率越高,即采樣的間隔時間越短,則在單位時間內計算機得到的聲音樣本數據就越多,對聲音波形的表示也越精確。采樣頻率與聲音頻率之間有一定的關系,根據奎斯特理論,只有采樣頻率高於聲音信號最高頻率的兩倍時,才能把數字信號表示的聲音還原成為原來的聲音。這就是說采樣頻率是衡量音效卡採集、記錄和還原聲音文件的質量標准。
當前音效卡常用的采樣頻率一般為11KHz(每秒採集聲音樣本11千次)、22KHz、44.1KHz和48KHz。11KHz的采樣率獲得的聲音稱為電話音質,基本上能讓你分辨出通話人的聲音;22KHz稱為廣播音質;44.1KHz稱為CD音質。采樣頻率越高,獲得的聲音文件質量越好,佔用磁(光)盤的空間也就越大。一首CD音質的歌曲會佔去8M左右的盤空間。
答案補充
MIDI是Musical
Instrument
Digital
Interface的縮寫,直接翻譯過來的意思就是樂器數字化介面,可以把MIDI理解成是一種協議、一種標准、或是一種技術,但不要把它看作是某個硬體設備。
MIDI這種播放指令序列文件是樂器數字化介面的簡寫,是由日本和美國幾家著名電子樂器廠商於1983年共同制定的數字音樂/電子合成器的統一國際標准,它的出現解決了各個不同廠商之間的數字音樂樂器的兼容問題!日本羅蘭公司於1984年提出了GS標准,大大增強了音樂的表現力。為了更有利於音樂家廣泛地使用不同的合成器設備和促進MIDI文件的交流,國際MIDI生產者協會(MMA)在1991年制定了通用MIDI標准——GM,該標準是以日本Roland公司的通用合成器GS標准為基礎而制訂的。
GM標準的提出得到了Windows操作系統的支持,使得數字音樂設備之間的信息交流得到了簡化,受到全世界數字音樂愛好者的一致好評。隨後,YAMAHA公司在GM標准上於1994年推出了自己的XG的MIDI格式,增加了更多數量的樂器組,擴大了MIDI標準定義范圍,在專業音樂范圍內得到廣泛的應用!
Ⅷ 關於音頻錄音的參數問題
當然是越高越音質越好了.不過也沒那個必要,就算是再好的,一般的MP3也聽不出它的音效來,一般像`128KBPS,44KHZ,16位,立體聲的就差不多了.
1.位速
位速是指在一個數據流中每秒鍾能通過的信息量;Kbps表示「每秒千位元組數」,因此數值越大表示數據越多,位速越高,信息量越大!
2.采樣率
采樣頻率是指錄音設備在一秒鍾內對聲音信號的采樣次數,采樣頻率越高聲音的還原就越真實越自然。44KHz采樣率的聲音就是要花費44000個數據來描述1秒鍾的聲音波形.原則上采樣率越高,聲音的質量越好.而采樣率在44KHz的時候已經接近人耳的分辨極限.理論上也是CD音質的界限.
3.采樣的位數
采樣位數可以理解為採集卡處理聲音的解析度。這個數值越大,解析度就越高,錄制和回放的聲音就越真實。我們首先要知道:電腦中的聲音文件是用數字0和1來表示的。所以在電腦上錄音的本質就是把模擬聲音信號轉換成數字信號。反之,在播放時則是把數字信號還原成模擬聲音信號輸出。採集卡的位是指採集卡在採集和播放聲音文件時所使用數字聲音信號的二進制位數。採集卡的位客觀地反映了數字聲音信號對輸入聲音信號描述的准確程度。8位代表2的8次方--256,16位則代表2的16次方--64K。比較一下,一段相同的音樂信息,16位音效卡能把它分為64K個精度單位進行處理,而8位音效卡只能處理256個精度單位,造成了較大的信號損失,最終的采樣效果自然是無法相提並論的。
如今市面上所有的主流產品都是16位的採集卡,而並非有些無知商家所鼓吹的64位乃至128位,他們將採集卡的復音概念與采樣位數概念混淆在了一起。如今功能最為強大的採集卡系列採用的EMU10K1晶元雖然號稱可以達到32位,但是它只是建立在Direct Sound加速基礎上的一種多音頻流技術,其本質還是一塊16位的音效卡。應該說16位的采樣精度對於電腦多媒體音頻而言已經綽綽有餘了。
4.stereo就不用說了吧...
參考
http://..com/question/5658130.html?si=5
http://publish.it168.com/cword/1234.shtml
http://www.microsoft.com/china/windowsxp/moviemaker/expert/digitalvideo.asp
Ⅸ 歌曲中的采樣率和比特率是什麼意思
把模擬音頻信號轉成數字音頻信號的過程稱作采樣,簡單地說就是通過波形采樣的方法記錄1秒鍾長度的聲音,需要多少個數據點。
eg:44.1KHz采樣率的聲音就是要花費44000個數據點來描述1秒鍾的聲音波形。原則上采樣率越高,聲音質量越好。
采樣頻率一般共分為22.05KHz、44.1KHz、48KHz三個等級;22.05 KHz只能達到FM廣播的聲音品質,44.1KHz則是理論上的CD音質界限,48KHz則已達到DVD音質了。
采樣率是指將聲音(模擬信號)轉換成mp3(數字信號)時的采樣頻率,也就是單位時間內采樣多少點數據。
比特率是指每秒傳送的比特(bit)數。單位為bps(Bit Per Second),比特率越高,傳送的數據越大,音質越好。
比特率是指每秒傳送的比特(bit)數。單位為bps(Bit Per Second),比特率越高,每秒傳送數據就越多,畫質就越清晰。
聲音中的比特率是指將模擬聲音信號轉換成數字聲音信號後,單位時間內的二進制數據量,是間接衡量音頻質量的一個指標。 視頻中的比特率(碼率)原理與聲音中的相同,都是指由模擬信號轉換為數字信號後,單位時間內的二進制數據量。
可以這樣講,采樣率和比特率就像是坐標軸上的橫縱坐標。橫坐標的采樣率表示了每秒鍾的采樣數據點。縱坐標的比特率表示了用數字量來量化模擬量的時候的精度。
(9)為什麼採集聲音信號時間要超過一秒擴展閱讀:
進行采樣的意義:
聲音其實是一種能量波,因此也有頻率和振幅的特徵,頻率對應於時間軸線,振幅對應於電平軸線。波是無限光滑的,弦線可以看成由無數點組成,由於存儲空間是相對有限的,數字編碼過程中,必須對弦線的點進行采樣。
采樣的過程就是抽取某點的頻率值,很顯然,在一秒中內抽取的點越多,獲取得頻率信息更豐富,為了復原波形,一次振動中,必須有2個點的采樣,人耳能夠感覺到的最高頻率為20kHz。
因此要滿足人耳的聽覺要求,則需要至少每秒進行40k次采樣,用40kHz表達,這個40kHz就是采樣率。我們常見的CD,采樣率為44.1kHz。
採集過程中視頻和音頻同步是非常重要的,光有頻率信息是不夠的,我們還必須獲得該頻率的能量值並量化,用於表示信號強度。量化電平數為2的整數次冪,我們常見的CD位16級的采樣大小,即2的4次方。
采樣大小相對采樣率更難理解,因為要顯得抽象點,舉個簡單例子:假設對一個波進行8次采樣,采樣點分別對應的能量值分別為A1-A8,但我們只使用2bit的采樣大小,結果我們只能保留A1-A8中4個點的值而舍棄另外4個。
如果我們進行3bit的采樣大小,則剛好記錄下8個點的所有信息。采樣率和采樣大小的值越大,記錄的波形更接近原始信號。
參考資料來源:網路-音頻采樣率
參考資料來源:網路-比特率
Ⅹ 我們聽到的聲音信號是怎麼轉換的
聲音是一種機械波,人的鼓膜感受到聲波的振動,並通過聽覺神經傳給大腦,於是我們就聽到了聲音。聲波的振動幅度越大,所聽到的聲音就越響,而聲波振動的頻率越高,我們聽到的聲音就越尖細。一般來說,正常人的耳朵只能分辨頻率從20赫茲到22千赫之間的聲音。低於20赫茲的聲音叫做次聲波,高於22千赫的聲音叫做超聲波。聲音是一種模擬信號,而電腦只能處理數字信息0和1。因此,首先要把模擬的聲音信號變成電腦能夠識別處理的數字信號,這個過程稱為數字化,也叫模數轉換。在電腦對數字化後的聲音信號處理完後,得到的依然是數字信號。如果把它們直接送給音箱,那你根本就聽不懂。因此,必須把數字聲音信號轉變成模擬聲音信號,然後再輸出到音箱,這個過程叫做數模轉換。 把聲音數字化一般分兩個步驟來完成:采樣和量化。首先,對模擬聲音信號進行采樣。這個過程的實際操作是:每隔一個很短的時間對模擬聲音信號取一個樣本,也就是獲取模擬聲音信號在這時的電壓值,我們把每一秒鍾之內采樣的次數叫做采樣頻率,國際單位制中的單位是赫茲。一般來說,采樣頻率要達到原始聲音信號最高頻率的兩倍以上,才能較好地保證原始模擬信號在數字化後不失真。人耳能聽到的聲音的最高頻率是22千赫,所以要達到比較好的數字化效果,采樣頻率要在44千赫以上,相當於每秒鍾要采樣四萬四千次。然後,再對每個采樣樣本進行數字化處理。一般比較常用的是使用八位或者十六位量化精度。所謂八位量化(八位編碼),就是把聲音的音量從最小值到最大值之間分成28,也就是256個等級。每個等級對應的數字編碼從0到256,用一個位元組來表示,而每個采樣樣本的音量就近似地對應這256個等級中的一個,也就相應地獲得一個數字編碼。而十六位量化與八位量化在原理上沒有本質的區別,只是十六位量化把音量分成了65536個等級,這樣數字化後的聲音將更加逼真。 超過十六位的量化精度,正常人的耳朵也分辨不出來,所以現在最常用的是採用十六位量化來處理聲音。 單聲道和立體聲——立體聲叫做雙聲道,它是把聲音分成左右兩個獨立的聲道分別進行處理。而單聲道則只有一個聲道。以上的數字化過程都是由安裝在電腦中的音效卡來完成的。經過數字化後的聲音數據在電腦的硬碟中存儲為文件。最常見的聲音文件格式就是Wave文件,在Windows 10操作系統中,它的擴展名為.wav。 Wave文件的大小與數字化過程中使用的采樣頻率和量化精度有直接關系。如44千赫采樣頻率、十六位量化精度的雙聲道Wave文件大小是10兆位元組/分鍾。