登陆注册
13835000000045

第45章 数字音频传播(2)

3.高保真立体声音频压缩编码技术标准

高保真立体声音频信号频率范围是50Hz~20KHz,采用44.1KHz采样频率、16bit量化进行数字转换,其数据速率每声道达705Kb/s。1991年,国际标准化组织ISO和CCITT开始联合制定MPEG-1标准,其中ISOCD 11172-3作为“MPEG-1音频”标准,成为国际上公认的高保真立体声音频压缩标准。

MPEG-1音频压缩标准包括三个使用高性能音频数据压缩方法的感知编码方案,按照压缩质量和编码方案的复杂程度划分为Layer1、Layer2(即MUSICAM,又称MP2)、Layer3(又称MP3)。目前广泛使用的VCD的音频压缩方案为层Ⅰ,它的典型码流为每通道192Kb/s。层Ⅱ为掩蔽模式通用子带集成编码与多路复用,典型码流为每通道128Kb/s,广泛应用于数字音频广播、数字演播室等专业数字音频的制作、交流、存储和传输。层Ⅲ是综合MUSICAM和ASPEC的优点提出的混合压缩技术,复杂度相对较高,典型码流为64Kb/s,在低码率下有高品质的音质。

MPEG-1的三层音频编码采用的基本结构相同:在传统的频谱分析和编码技术基础上应用了子带分析和心理声学模型理论。其基本思想是将信号分解为若干子频带内的分量之和,通过研究人耳和大脑听觉神经对音频失真的敏感度,对各子带分量根据其不同的分布特性采取不同的压缩策略。具体压缩过程是:首先,将输入的PCM信号通过时频映射实现子带分割,将宽带音频信号分成32个子频带。同时,通过快速傅立叶变换(FFT)运算,对信号进行频谱分析,得出各子带的掩蔽特性。由于掩蔽特性的存在,减少了对量化比特率的要求,这样,不同的子带可以分配不同的量化比特数,但对于各子带而言,采用的是线性量化。在解码端进行相反过程即可输出原PCM码流。

MPEG-1层Ⅲ编码在层Ⅰ、层Ⅱ的基础上引入辅助子带、非均匀量化和熵编码技术,进一步提高压缩比,而基本不会破坏音质。

4.多声道音频压缩编码技术标准

环绕声技术发展至今已相当成熟,在对环绕声压缩的研究中也产生了许多专利技术,如THX、杜比AC—3、DTS及MPEG—2等。这些技术在不同的场合,尤其是在影剧院、家庭影院系统及高清晰度电视(HDTV)等系统中得到广泛的应用。

(1)MPEG-2

MPEG-2标准是在MPEG-1基础上发展起来的多声道编码系统。MPEG-1中MUSICAM只传输左右两个声道,而MPEG-2声音编码能支持5.1声道,实现“环绕”立体声效果,又称为MUSICAM环绕声。

但是一个新的多声道环绕声系统应该与双声道立体声兼容,因为此前已经开发了许多MPEG-1音频芯片,这些解码器只能处理双声道音频信号,因此,MPEG-2尽量保持与原有MPEG-1音频编码的兼容性,主声道(左、右)仍然保持后向兼容,以保证现存的双声道解码器能从5.1多声道信号中解出相应的立体声,而环绕声道则采用新的编码方法,半采样率也是MPEG-2的优势之一,MPEG-2仅需使用MPEG-1中一半的采样率即可保持极佳的声音质量。

MPEG-2AAC(Advanced Audio Coding,先进音频编码),即ISO/IEC13818-7标准,是MPEG-2音频编码的新发展,它能以更大的压缩比(可达30:1)提供与MP3相同质量的音频,还能为高清晰度音频提供较高质量的编码和重放(采样频率为96KHz)。MPEG-2AAC在采样频率为8~96KHz下提供了l~48个声道可选范围的高质量音频编码。AAC适用于比特率从8Kb/s单声道的电话音质到160Kb/s多声道的超高质量音频范围内的编码。

MP4使用的就是MPEG-2AAC技术。MP4并不是MPEG-4或者MPEG Layer4,它的出现是针对MP3的大众化、无版权的一种保护格式,由美国网络技术公司开发、美国唱片行业联合会倡导公布的一种新的网络下载和音乐播放格式。

由于使用了MPEG-2AAC技术,MP4的优越性要远远高于MP3,更适合多媒体技术的发展以及视听欣赏的需求。但是,MP4是一种商品,具有强加的版权信息,而MP3是一种任何人都可以自由使用的压缩算法和音乐格式。此外,MP4实际上是由音乐出版界联合授意的官方标准,MP3则是广为流传的民间标准。相比之下,MP3的灵活度和自由度要远远大于MP4。因此MP3仍然是目前最为流行的一种音乐格式,占据着大量的网络资源,MP4很难推广普及。

(2)杜比AC-3

杜比数字AC-3技术是由美国杜比实验室针对环绕声开发的一种数字音频压缩技术。在5.1声道的条件下,可将码率压缩至384Kb/s,压缩比约为10∶1。杜比数字AC-3系统可用前置的左、右音箱,中置音箱产生极有深度感和定位明确的音场,用两个后置的环绕音箱和超低音箱表现宽广壮阔的音场,细节十分丰富,具有优良的回放音质和效果。

杜比AC-3是根据感觉来开发的多声道环绕声编码系统。它将每一声道的音频根据人耳听觉特性划分为许多最优的狭窄频段(人类的听觉对不同频率的声音具有不同的灵敏度,因此各频段的宽度并不完全一样),利用音响心理学“听觉掩蔽效应”,删除人耳听不到或可忽略的部分。同时,利用狭窄频段的划分使部分频段噪声在编码时几乎被全部滤除,使其余噪声的频谱靠近在信号频谱附近,而这些噪声可被信号所抑制。因此杜比AC-3系统实际上是一种具有选择性及强抑噪的系统。

杜比AC-3最初是针对影院系统开发的,最早在1991年的电影Batman Returns中被应用。目前应用仍然非常广泛,已被美国采用作为高清晰电视(HDTV)音频系统标准,最新DVD机也兼容杜比数字AC-3,是极有发展前途的技术。

四、数字音频的编辑处理

1.数字音频素材来源

音频素材大致可以分为三大类:音乐、效果声音以及解说声音素材。其采集方式主要有以下几种:

用软件创作

可以在音频编辑软件中通过电子音乐创作方式直接创作声音。

通过声卡录制声音

通过计算机的声卡和录音软件,从话筒采集语音生成音频文件,也可以用录音机把磁带上的声音信号通过线路输入(LINE)接口送到计算机中。

通过声卡的MIDI接口获取声音

通过计算机声卡的MIDI接口,从带MIDI输出的乐器中采集音乐,形成MIDI文件;或用连接在计算机上的MIDI键盘创作音乐,形成MIDI文件。

从CD或VCD、DVD中直接捕获

使用专门的软件抓取CD或VCD、DVD光盘中的音轨,生成声源素材。再利用声音编辑软件对声源素材进行剪辑、合成,最终生成所需的声音文件。

数字音频库的利用

可以利用一些软件光盘中提供的声音文件,如声卡产品的配套光盘中往往提供许多音频素材。网络资源库中也有很多已经归类的音频素材,可以直接使用。

2.数字音频文件格式

声音文件有多种存储格式,原则上不同的声音格式需要不同的播放器,实际上现在的播放器大都可以支持多种格式。如Windows自带的媒体播放机、著名的免费软件Win AMP等等。常用的声音文件格式有:

(1)MID和RMI

这两种文件扩展名表示该文件是MIDI文件,是目前最成熟的音乐文件格式。

MID文件的优点是所占存储空间比波形声音小得多,一个6分钟、有16个乐器的文件也只是80多KB。另外,与波形声音相比,MIDI声音在编辑修改方面也是十分方便灵活的,例如可任意修改曲子的速度、音调,也可改换不同的乐器等。其缺点是播放效果因软、硬件而异。使用媒体播放机可以播放,但如果想有比较好的播放效果,计算机必须支持波形表功能。

(2)WAV

WAV文件是真实声音数字化后的文件,是Windows存放数字声音的标准格式,由于微软的影响力,目前也成为一种通用的数字声音文件格式,几乎所有的音频处理软件都支持WAV格式。虽然WAV格式具有很高的音质,但数据没有经过压缩,文件所占存储空间很大(1分钟的CD音质需要10M字节),不适于在网络上传播。

WAV格式使用媒体播放机可以直接播放。

(3)MP3

由于MP3具有压缩程度高(1分钟CD音质音乐一般需要1M字节)、音质好的特点,所以MP3是目前最为流行的一种音乐文件。

(4)RA、RAM

这两种文件是Real公司开发的用于网上实时数字音频流技术的文件格式。由于它主要用于实时的网上传播,所以在高保真方面远远不如MP3,但在只需要低保真的网络传播方面却有很大优势。要播放RA,需要使用Real Player。

(5)ASF、ASX、WMA、WAX等

ASF和WMA都是微软公司为了和Real公司竞争而开发的网上流式数字音频压缩技术。这种压缩技术同时兼顾了保真度和网络传输的需求。也是由于微软的影响力,这种音频格式现在正获得越来越多的支持,如Win AMP、Windows的媒体播放机都可以播放。

(6)cda格式

CD光盘采用的文件格式,又叫“红皮书”格式,44.1KHz采样频率、16bit量化。

在大多数播放软件的“打开文件类型”中,都可以看到该格式,CD光盘可以在CD唱机中播放,也能用电脑里的各种播放软件来重放。一个CD音频文件是一个*.cda文件,这只是一个索引信息,并不真正包含声音信息,所以不论CD音乐的长短,在电脑上看到的“*.cda文件”都是44字节长。注意:不能直接复制.cda文件到硬盘上播放,而是要使用抓音轨软件把CD格式的文件转换成WAV文件。

不同格式的音频文件可以通过工具软件进行转换,如CD中的音乐数据可用抓音轨软件转换成WAV文件,WAV文件也可以用音频软件压缩成MP3文件等等。

3.音频的编辑处理

数字音频处理主要指声音的编辑,如捕捉、修改声音文件、特效制作等。音频编辑软件一般包括以下功能:

记录数字音频片段

修剪:把数字记录起点和终点间的死点除去。

接合与集合:把不同文件的音频片段组合在一起。

音量调整:提高或降低音量,也可以用来柔化或消除失真。

格式转换:改变文件的格式。

重新采样或降低采样率:这样可以极大地压缩文件,当然在质量上相应也有降低。

淡入淡出:一段音频数据中音量的增加和减少。

均衡:通过削减音频数据流中的尖峰处和水平处来消除噪声。

拉伸时间:通过在信号中删除或增加数据来放慢或加速声音。

数字信号处理:增加声音的特殊效果,如混响、回声、插入静音。

倒时序的声音:反向播放数据流。

多数音频编辑系统包含一个图形浏览器,方便用户监视音频波形信号。

五、数字信号传输基础知识

1.信道编码技术

数字信号在信道中传输,不可避免地会受到噪声干扰,并有可能导致对接收信号的错误判断而产生错码(误码),信道编码就是对数码流进行相应的处理,以降低误码率,提高数据传输效率。

信道编码就是在源数据中添加一些冗余数据,在接收端根据这些冗余数据进行判错和纠错。但信道编码增加了数据量,在带宽固定的信道中,总的传送码率是固定的,编码结果只能是降低了有用信息的传送码率。术语“编码效率”指有用比特数除以总比特数,不同编码方式的编码效率不同。

(1)检错码与纠错码

在数字通信系统中,利用信道编码进行差错控制的基本方式大致可分为三类:前向纠错(FEC)、反馈重发(ARQ)与混合纠错(HEC)。

信息在发送端经纠错编码后送入信道,接收端通过纠错解码自动纠正传输中的差错,这种方式称为前向纠错,前向表示差错控制过程单向,不存在差错信息反馈。前向纠错具有无需反向信道、时延小、实时性好等优点,它既适用于点对点通信,又适用于点对多点组播或广播式通信,其缺点是解码设备比较复杂、为提高纠错性能必须插入更多监督码元致使编码效率下降。

最为关键的一点是:FEC纠错能力有限,当差错数超出纠错能力时就无法纠正,而且出现这种情况时系统没有任何提示,收信者无法判断差错是否已经纠正,因而FEC通常不用于数据通信,而用于容错能力较强的语音、图像通信,因而在数字广播电视领域应用广泛。当然,随着编码理论与大规模集成电路技术的不断成熟,性能优良的实用编解码方法不断涌现,编解码器件成本不断降低,前向纠错的应用已从语音、图像扩展到计算机存储系统、磁盘、光盘、激光唱机等存储领域。

反馈重发方式是指发送端发送检错码,接收端通过解码器检测接收到的信号是否符合编码规则,从而判断是否存在传输差错,若判定有错,则通过反向信道通知发送端重新发送,如此反复直至接收端认为正确为止。ARQ系统有两类:一类是等待式,即发送端每发一码字或一帧,就停下来等待接收端回音;另一类是连续式,对帧或码字进行顺序编号后连续发送,接收端对所有帧的正确与否按顺序号给出反馈,发端根据反馈决定重发与否。

同类推荐
  • 降低飞翔的高度

    降低飞翔的高度

    思维能力是各种能力的核心。思维包括分析、综合、概括、抽象、推理、想象等过程。我们应通过概念的形成、规律的得出、模型的建立、知识的应用等培养思维能力。因此,在学习过程中,不但要学到知识,还要学到科学的思维方法,发展思维能力。
  • 句典

    句典

    《句典(经典·珍藏版)》是一本关于中华传统语言的精彩汇编,也是了解古代文化、传习古 代经典、掌握古人智慧的优秀普及本。 本书可谓妙趣横生的语言储备库:哲人慧语,应对妙语、嘲戏绮语、 村言野趣,谐谑调侃活生生的语言文字和故事,都是几千年来中华文化的 智慧结晶,这些警语妙言经过智者高士的巧妙概括,既显得高度精炼,又 极易触动人的心灵。随手翻过,珠玑遍拾,让人不知不觉间激活思维,从 政汲取鲜活的智慧营养。
  • 梁晓声说:我们的时代与文艺

    梁晓声说:我们的时代与文艺

    20世纪90年代以来,文艺不再是中国社会的主流。但梁晓声一直坚持创作,在各个历史时期不断推出自己的作品,其中饱含着充沛的人文主义情怀,一直为大众所喜爱和尊敬。在本书中,梁晓声站在作家、大学教师、读者等立场,对这个时代的文艺、文学等问题作了多维度的沉思。
  • 秦汉魏晋南北朝时期家族、宗族关系研究

    秦汉魏晋南北朝时期家族、宗族关系研究

    本书从秦汉魏晋南北朝时期的家庭结构、乡里社区内居民的姓氏分布状况入手,着重探讨了这一时期家族宗族内部各成员间在政治、经济和文化教育等方面的互动关系以及家族宗族关系对外部社会所产生的影响。
  • 性张力下的中国人

    性张力下的中国人

    与古人相比,我们今天在性问题上所面对的局面、所感到的困惑、甚至所见到的表现等等,实际上没有太大的不同。在中国传统文化中,对于性问题,长期存在着看起来是对立的两极:一极是重生殖、重子嗣、多妻和重人欲的;另一极则是礼教,在宋代以后它成为在理论上必须严格遵守的社会规范,而且越来越带上明显的禁欲色彩。在上述两极的同时作用下,就产生了性张力。性张力问题说到底是社会在性方面如何进行制约、平衡的问题。问题是一个所有社会都共同面临的问题。本书不仅仅将关注焦点集中在古代中国人身上;同时也扩展、联系到现世的中国社会的种种性现象,从“性张力”这一角度重新审视中国人的性生活。
热门推荐
  • 课堂教学策略与艺术

    课堂教学策略与艺术

    丁步洲编著的《课堂教学策略与艺术》是针对浙江省教师资格考试所编写的教辅类考试用书。本书分两大部分进行理论学习和实践指导,一是策略篇,里面涉及课堂教学准备策略、复习巩固策略、设计和组织预习的策略、课堂讲授的策略、教学活动组织策略、知识巩固的策略等;二是艺术篇,主要设计课堂教学导入的艺术、课堂教学情境创设的艺术、课堂教学提问的艺术、课堂教学高潮设置艺术等。
  • 绝世狐医:介王殿下你别跑

    绝世狐医:介王殿下你别跑

    一个只会医术不会武功的狐医,一个战功赫赫却粗枝大叶的王爷,只是一个偶然,两个冤家一生纠缠。“灵兮,今天出诊带上我可好?我保证不打也不闹。”“介子祈,你说说我怎么敢带你。每次我一给男人号脉,你看看你的嘴歪的,还要嘟嘟囔囔的,我还不是你的妻子呢。”“那有什么,不就是没有结婚吗?”“那当然有什么了。”“既然这样,我们明天成婚吧,灵兮!”那一天,是她的盛典,全城祝福着她幸福美满;那一夜,是他的狂欢,万千娇媚妖娆只为他开。
  • 追爱十年

    追爱十年

    五官尚算精致眼睛大,睫毛长而卷曲,美人胚子。身高172cm,体重75kg,标准女汉子。学生时代我从来没有想过恋爱,直到高一,他的出现,让我第一次有被人追的感觉,原以为一段恋情就会这样开始,没想,一切都是我自作多情。但我不会放弃的,,,,,,纵使千般不易,纵使要我放弃底线,我,只求,再见他一面。
  • 见闻录

    见闻录

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。
  • 八境逐仙

    八境逐仙

    市集奇遇老乞丐,引发灭门,却引出一个更加宏伟的世界。陆山从渺小之地而来,如何揭开那浩瀚无穷的世界一角,在天地之间掌握盖世力量,登上万古仙台,追逐渺茫成仙大道!
  • 神仙食炁金柜妙录

    神仙食炁金柜妙录

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。
  • 钢铁是怎样炼成的(语文新课标课外读物)

    钢铁是怎样炼成的(语文新课标课外读物)

    现代中、小学生不能只局限于校园和课本,应该广开视野,广长见识,广泛了解博大的世界和社会,不断增加丰富的现代社会知识和世界信息,才有所精神准备,才能迅速地长大,将来才能够自由地翱翔于世界蓝天。否则,我们将永远是妈妈怀抱中的乖宝宝,将永远是温室里面的豆芽菜,那么,我们将怎样走向社会、走向世界呢?
  • 超级龙龟分身

    超级龙龟分身

    得神兽龙龟传承,执掌天下水域。海外购岛,成为名副其实的大岛主,大土豪,阳光、沙滩、沉船宝藏,大渔场等等应有尽有。整个大海都是我的地盘,谁敢在我的地盘撒野,那就等着接受“海神”的惩罚吧!当然,这不过只是开始的表象,主角的目标可不仅限于次……各种黑科技也是不能少的!
  • 盛世荣宠

    盛世荣宠

    父是亲王,母是王妃,大伯是皇帝,舅舅是国公,他们都很疼爱她。阿元一直觉得自己穿了一个人生大赢家,一路无忧无虑(称王称霸)地长到十五岁,赐婚的旨意叫阿元傻眼了!阿元(木然脸):我确实想嫁到你们家,可是为毛娶我的不是你弟?湛某人(微笑拖走):别做梦了,洗洗睡吧。这是王府贵女养成不成反被养成,顺便PK各路好汉的故事~
  • 血色彼岸的复仇

    血色彼岸的复仇

    血色彼岸绽放时便是一人的死亡之日......曾经天真无邪的她们因为爸爸的背叛变成了堕天使地狱的撒旦为了复仇她们忍受了比别人强百倍的训练只为了复仇......当堕天使遇上真正的恶魔会擦出什么火花相遇、误会、冰释、再误会、离开、回来等等遭遇当她们回来的时候她们变得比以前更冷血他们又如何挽回......