中国广电信息网∷∷广电行业综合资讯网站∷∷

来源:百度文库 编辑:神马文学网 时间:2024/04/29 03:02:46
音频工作者高清指南
中国广电信息网  转自:本站原创  时间:2007-4-18 15:36:48 点击:174
HDTV正在改变电视节目的拍摄、分配和后期制作方式。更高分辨率的图像要求有更新换代的摄像机及编辑和合成系统,还需要要求摄影、摄像、编辑、工程经 理、视觉特技和着色师等提高技巧的编辑、特效和色度分级设备。音频工作者面临的变化不那么引人注目,但现场录音师、音响指导、音频编辑和配音不可能脱离图 像,而这将最终改变他们的工作方式。
声音考虑
在HDTV中,环绕声现已是整个电视节目的一个主要部分,但即使具有处理电影及混录戏剧和纪录片5.1的经验,HDTV这种新视频技术到底对音频界意味着什么还是不确知的。
欧洲高清广播机构Euro 1080和比利时转播公司Alfacam CEO Gabriel Feheravari曾说过对5.1环绕声的重要性估计不足,并补充说它包含在链路内对成本核算的影响超过了HD制作。BBC技术指导部首席技术专家 Andy Quested表示赞同:“人们不应低估电视声音的重要性和难度。图像只是一个层面,但声音有许多层面。”
这种HD音频制作中许多层面的概念可能也与声音专业人士在开始接触此新视频技术必须牢记的许多层面相对应。主要的技术依然保留,但音频HD制作链中所牵涉的全部人员都必须密切注意隐藏的新陷阱和新问题。这些陷阱出现处的主要层面分为:采集和混录;后期制作和传送。
采集和混录
立体声的发展带来了新录音技术,因而使混录过程中的思维发生了变化。向5.1转换与立体声变成标准时要牢记的单声兼容性情形一模一样,因此,任何立体声混录也必须满足那些依然在用两种原有音频格式聆听的人的要求。
由于戏剧和纪录片海外发行的要求甚至先于欧洲HD服务的推出,现场录音师和配音录音师一直在满足提供必需和额外的素材并混合到图像的需求。对于戏剧和电影 制作,由于环绕声轨被内建于配音剧院,变化是极小的;现场录音师提供一个立体声混音或独立声轨上的单独元素,然后经过适配,建立对白、音效和环境的混音。
由于发现频道和国家地理频道在美国率先采用HD和5.1,纪录片摄制者必须考虑如何最佳地为环绕声轨采集音频。由于现场拍摄组人员很少,根据需要声像将在 后期建立,但为了追求更高的真实感,一些制作人员改变主意,在现场记录环绕声。它是用SoundField环绕声话筒或MMS(也称为MSM)话筒结构实 现的。MMS向成熟的MS结构增加一个第二中置话筒,记录后左和后右声道声音。两种结构都以矩阵形式提供它们分别的左和右素材,这些素材然后被“解码”并 在后期中被安排为单独的声轨。
MMS被记录在多轨现场录音机上(可以是SoundField SPS422B或ST250的输出),这些录音机还能直接连接到数字音频工作站。像Nagra V、Zaxcom Deva、Aaton Cantar和HHB PROTADRIVE这样的硬盘和固态现场录音机的声轨容量使得有机会在第1到第6轨上以环绕声记录或有独特音频元素,留下第7轨和第8轨用于立体声混 录。
图1 SoundField正在成为5.1采集的一个标准
早期的新型现场录音机与后期制作机房中的数字音频工作站存在不兼容性,尤其是在声轨的相容上。这些问题大部分已经得到解决,但了解录音格式以及在什么码率 下录音是防止问题出现的必要信息,无论是立体声还是5.1都是如此。在现场,使话筒朝后意味着拍摄组必须比平常更安静、更小心,以避免外来的噪声被录进 来。话筒贴近主持人将使主话音信号很干净,但录音师推荐另外的现场录音方法。
说服制片人在什么方面都掏钱始终是困难的,对许多电视台管理人员来说,现场记录环绕声似乎是一笔不必要的开支。它的好处是有真实的气氛和真实感,而且由于 未必需要价格高昂的六话筒阵列,与拍摄立体声节目相比支出也不一定高。经验丰富的录音师表示相当不错的现场环绕声可以只用3个声轨就能洁净、高效和经济地 采集。
实况转播
实况体育节目已经成为HD的一大优势,像德国世界杯足球赛的HD转播和BSkyB转播的英超联赛。BSkyB选择SoundField SP422环绕声话筒系统用于采集,得到独立的环境话筒支持,其音响指导认为这是最方便的工作方式。为避免2次单独混录,采用Dolby DP563 Dolby Surround和Pro Logic II编码器,由5.1信号制作DPL和立体声。
Sky的5.1音频计划是由自由职业音响指导Robert Edwards和Video Sound Services的Ian Rosam设计的。HBS的世界杯转播除了使用SoundField新型数字控制器DSF1(Digital SoundField 1)外,还采用了一个“增强”,做法是围绕每个赛场补充22个话筒用于增强球场效果和气氛。
尽管SoundField提供的合一解决方案被视为实现此目标的最简单方式,但并非人人都信服,因此其它广播机构在转播中采用了MMS。BBC音响指导 Bill Whiston为环绕声老手了,过去12年一直在以模拟环绕声混录温布尔登网球比赛,现在他利用积累的经验转向5.1。他表示场地话筒的安装要依项目的变 化而变化,无论是体育比赛还是实况音乐都是如此,甚至于每场体育比赛都不一样。
图2 BBC转播温网比赛
BBC最近的温网转播,试验用HD拍摄。Whiston在中心球场以5.1混录。此球场的结构令安装话筒相对容易,但有些足球场由于形状的原因问题较多, 观众话筒有时比首选的更靠近观众本身。针对温布尔登主球场的声效,采用一种MSM Schoeps方案来采集Whiston所称的“高观众声”。
平衡输出
传统上网球比赛音频转播被分为球场和观众席两个部分,依照动作转移重点。Whiston说:“我们过去习惯不要太多的球场声音效果,但麦肯罗出场时,大家 都想听听他到底在场上说了些什么,因此从那时起较多的球场声音被混进来。”MSM并不用于主球场,它在一套Schoeps MS设备的配合下,与各种话筒(主要是Sennheiser 416)围绕球场设置获得立体声像。416深入观众席以低声平录音,也被用于填补可能出现在前置和后置扬声器之间的环绕声像中的缺陷。
在混录中心球场时,Whiston表示他优先考虑的还是立体声客户,但5.1通过使用Dolby DP570内的元数据得到了帮助,音频被缩混为Dolby E码流供分配。在一套有4个AES声轨的HD视频设备上,此结构通常将是前左和前右声道在第一轨上,Dolby E在第二轨上,后左和后右声道在第三轨上,而第四轨供(无解说词的)电视背景声音。
尽管电视剧甚至一些纪录片倾向于仿效电影模式的5.1(具有前右、中置和前左,后左和后右声道,以及一个亚低音声道),但有一些持异议者质疑5.0工作方 式是否更好,因为很少的家庭有亚低音扬声器,而甚至于支持4.0的人家中也无亚低音和中置声道。与亚低音相比,中置声道的争议更多,一些人称幻像中心足够 好了,另一些人则反驳此中置声道是需要的,因为并非每一个人都自如地拥有合乎规范的扬声器调试技术。
BSkyB正在把此中置声道用于解说,把踢球声置于左或右,观众声置于侧和后。BBC的Bill Whiston支持幻像中心,主要是因为在他参与模拟环绕声录制期间,他发现增添到中置声道的任何东西通常会令该声道崩溃。他说:“在制备5.1中,我们 尝试过中置声道有和无任何东西,我喜欢更多的立体声解说,并不是在中置声道直接放置立体声,但最终结果是在中置声道有少量的立体声。并非人人都能内行地调 试立体声,更别提5.1了,因此太束缚于中置声道的人可能是听天由命的人。”
音响指导同意5.1电视声音方式的发展将要通过反复试验,而新问题将继续出现。尽管大多数5.1调谐器在日本制造,但在欧洲使用时并没有低音管理系统。提供一个低音声道,但不是LFE声道,因此如果什么也没混入LFE,那么混音内显然不可能有低音。
在5.1和HD中,已经考虑了声像是否应该按照视频图像变化,但共识是任何的剧烈变化都会导致观众不安。在温网转播中,Bill Whiston逐渐增强场次之间靠近球手的观众席的话筒,但没有尝试匹配安装在裁判员席的摄像机,原因是变焦效果会太强烈。“在音乐会上我们问自己是将听 众置于指挥台或后6英尺,还是置于前排座位,”Whiston说,“它应该是声像的一个延伸,而尽管环绕声带来别样的感受,但位置必须考虑,使得没有恼人 的东西。”
实况播出得益于HD较高的清晰度,但这也是戏剧中引起关注的东西。演员和化妆师知道现在每一个毛孔和色斑都能被观众看得一清二楚,而对对白编辑来说,特别 清晰在转到ARD时可能导致问题出现。对口型并不只是后期的事情,也是分配中的一件工作,因为HD摄像机信号和Dolby E及链路中的其它编解码,都可能导致同步延迟。因此必须解决一系列其他问题。
显而易见高清与前端(图像拍摄)和后端(编辑和后期制作)有关。不过,若忽视此过程的中间部分就要自担风险,因为把图像从一地传输到另一地,并使它们可以被每一个人观看或处理,要求是非常严格的。即使在最终完成工序后,根据观看作品的地区,还有分发格式的问题。
HDTV音频也与采集和最后制备、直播场合的混录及影视节目后期制作有关。而由于存在困难的同步问题和分发格式要应付,分配和最后分发问题同样也是 HDTV音频主要的考虑因素,但更加重视,重视程度尤在混录大量声道的复杂性之上。HD图像与以前的SD是截然不同的,但它仅仅是一个层面。HDTV音频 有许多层面,并非只是5.1码流,而且还有不同的分量信号通道。
独特的要求
由于欧洲的5.1电影服务,多声道和多轨音频是一种为人知晓的SD图像伴音,但HD既要求又实现分离环绕声。如何从现场传输6或8声道音频,然后在全台中传输的问题以前就颇费工程师心血,而现在此要求变成了强制性的。
杜比在上世纪90年代中期开发了Dolby E载波,它把6个5.1必需的声道压缩为一个易处理的双声道信号,使环绕声能从台内的一地分配到另一地,并最终传输到家中,在那里机顶盒把此素材转换为Dolby Digital环绕声轨。
与杜比其它面向环绕声的格式一样,尽管广播工程师有异议,但E载波似已成为多声道音频信号传输事实上的标准。杜比英国公司市场发展经理Jason Power承认存在分离声道的其它传输方式,包括相配的录像机和嵌入音频,但称Dolby E对广播应用有意义,因为它用Dolby Digital建立了完整的链路。
美国HDTV大联盟从合作一开始就包括了杜比,因此Dolby E已被确定用于HDTV。随着HD的到来,此载波的地位由于缺少具有满足多声道音频的足够声道的HD VT设备而得到增强,尽管此情形随着现在有了8和12声道设备而得到了改变。
嵌入音频也许是一种更灵活的选择,但对于收录链路来说,此连接管道必须有足够容量以容纳视频信号、多声道音频、立体声及其它任何音频元素。2006年德国 世界杯赛就是一个例子,当时T-Systems(德国电信)提供了一个20Gb/s ATM链路以容纳非压缩音频和HD图像。对于上行,环绕声码流是被Dolby E编码的,因为卫星链路上没有相当的带宽。
DTS系统
杜比在电影环绕声领域的竞争对手DTS目前正向其期待已久的电视领域进军,它按照Dolby E的路线开发了一种收录/分配系统。此基于硬件的系统是DTS和Linear Acoustic的合作成果。Linear Acoustic是一家美国研究开发公司,由Tim Carroll创办,他曾用Dolby E工作,但现在觉得该系统用于今后的工作欠精确确定。大家知道的新系统e2(上角标)采用DTS得到Linear Acoustic支持的Coherent Acoustics(相干声学)压缩算法,它也构成Linear Acoustic的StreamStacker-HD系列产品的基础。
广播机构需要收录和分配的灵活性,BBC首席技术专家Andy Quested表示,原因在于多声道音频不只是5.1,还有立体声信号和任何的附加物,如(无解说词的)电视背景音乐,也需要考虑。他说:“因此音频要比 图像复杂得多。视频方面从黑白发展到彩色,从4:3宽高比发展到16:9宽屏,以及现在的SD发展到HD,但每个都取代另一个,现在没有人会想并行拥有 HD和SD摄像机。但由于音频和立体声依然必需共存,因此就音频来说我们还不到那个阶段。”BBC在德国世界杯赛转播时没有使用5.1信号,尽管世界杯转 播是在其HD试验服务上运行的。
广播机构正在安装的新视频设施是为了处理高清图像,但对音频链的关注很少,除非该广播中心是从零做起的。尽管Dolby E是为在现有全双声道设施通过音频而设计的,但Quested指出仍有不能通过此载波的设备在使用,包括一些编解码器。
反对Dolby E的另一理由是它可能引起相对于图像的延迟,导致同步和定时误差。延迟和同步问题出现在SD播出,图像混合器可能对视频引起延迟,但还有可能来自数字调音 台的延迟。在高清时,摄像机在CCU输出有相当可观的视频延迟;图像混合器甚至制作室内使用的监看显示器都可能增添更多的延迟。压缩音频被用于Dolby E、某些DAW、编解码器及其它处理设备时都将带来它们特有的延迟。
等待视频
在美国,已经发现新一代家用等离子显示屏引入延迟,而且即使同步问题被广播机构减到最小,家中使用的大屏幕也可能令最微小的延迟显而易见。“在50英寸屏 幕上,观众将看见任何延迟,而如果他们坐得相当近看,在28英寸屏上也能看见延迟,”Quested说,“HD论坛声音小组正在努力增强对同步的重视,而 有说法称观众对音频迟到的容忍度大于音频在图像前出现。大多数人不会注意到甚至一帧的滞后,但一场的提前都显而易见和令人不安。”EBU和SMPTE都推 荐提前5ms和最长滞后15ms的限制范围。
知识
Quested并不只是关心同步和定时问题的存在,还关心工程和操作人员是否有足够的技能来处理这种情况。在有解决此问题的经验的人员中,其中两个是 BBC音响指导Bill Whiston及转播车和现场录音公司Sound Moves董事总经理Steve Williams。Whiston去年为温网中心球赛的HD转播混合5.1,他指出在赛事前就决定如何处理延迟方面花了很多时间。
“在外面拍摄的一切在时间方面都必须一致,”Whiston说,“由于编码问题,与Dolby E有关的任何分离的东西都被延迟一帧。如果每一个人都完全了解这是事实的话,那么应当没有问题。”Steve Williams甚至于做得更安全,延迟一帧半,有时甚至于2帧,以确保同步。Williams补充说通过制作对讲系统的矩阵分配可能引起额外的延迟,而 在现场一般是没有可以监听素材看延迟是否出现的静音或隔离区的。
同步设备
制造商和系统设计商现在正在解决延迟问题,并且越来越多地使用Dolby E。杜比的Jason Power指出使用Dolby E本身不是问题,因为此格式具有大家都清楚的一帧的可计量延迟。
调音台被转播车运营商广泛使用的Calrec在IBC2006上推出了一款Sigma台子,它具有允许向信号引入可变延迟度的Bluefin高密度信号处 理,并在处理能力和通道数方面有惊人的增加。该台子能提供256段最多2.73秒的输入延迟及192段最多2.73秒的输出延迟,以及编组输入上的延迟 (48段最多2.73秒的延迟,如果编组为5.1的话),因而产生总共496段的延迟,或22.5分钟的总延迟。
同样在IBC,Studer为其Vista和On Air 3000调音台推出了一种I/O选件卡,它能接受任何包含用Dolby E或Dolby Digital编码的信号的AES/EBU码流。此卡解码输入级内的码流,然后向调音台提供最多两组8通道。
专业开发商Broadcast Project Research(BPR)与Facilities Forum和ITFC(商业电视后期制作和字幕及音频描述机构)的总工程师们合作,制造了一系列解决同步问题的工具。这些工具包括用来插入VT时钟的 SmartLips发生器、手持式Smartlips声级和A/V同步仪,以及Fastlips A/V同步仪表。
BPR的产品设计用于接近于实况工作的后期制作,因为在VT素材载入数字编辑或存储系统时以及它通过一个转录设备或一个宽高比转换器(ARC)时(这两种情况可能导致两帧的视频延迟),可能向它引入延迟。
应该抛弃对HD视频和5.1音频来说后期制作环境是一个直截了当环境这种观念,这还有其它许多理由。
非线性技术使得不同系统之间的集成更容易、更可行,但对它仍有期待。Avid编辑系统不能处理Dolby E码流;某杜比硬件不得不用于在信号进入编辑机或合成系统前解码它。Digidesign的Pro Tools数字音频工作站能混合其架构内的Dolby Digital 5.1,而在许多制作上,在声轨被实况播放到主调音台供最后混录前,在此系统内制备尽可能多的环绕声混音。
现在能看清楚了
一个争论不休的问题是音频编辑机和混录调音台是否必须有对应其作品的HD图像。取决于所采用的操作系统,在某些DAWA上运行HD图像是存在问题的。 Avid的Mojo和Merging Technololgies VCube等的箱式系统可以给予帮助。英国伦敦后期制作机构Envy的音频部运行在Mac上,而不是PC上,这取消了v10视频板,使工程师不准采用一些 视频标准,但Mojo箱提供他们需要的大部分功能。
儿童电视节目Lazy Town上的后期制作链现在有一个HD工作流程,从使用DPX文件在草谷的高质量Viper HD摄像机上拍摄到后期处理。虽然图像编辑师工作于Avid系统上处理HD视频,但为音频制作人员回放的图像是SD,来自Unity媒体服务器的素材用 DNxchange传输协议转换。处理广告和高端故事片和长电视剧的设备较可能有针对音频设备的HD回放功能,关键是要客户满意。
图3 儿童电视节目Lazy Town的视频编辑工作于Avid系统上
广播分发
一旦被混录,声轨必须准备用于传输,而且像SD一样,每家广播机构都有不同的要求。广播机构现在希望以至少8声轨(通常包括5.1和供电视立体声的 LTRT)接收音频。商业广告片很可能有5.1及压缩的立体声和分离效果及一个用于旁白的声道。对于电视剧制作,为使广播机构能够选取所需要的任何特效, 还包括M&E。
SOHO机构Lip Sync声音负责人Steve Haynes称新兴的5.1和HD方式是电影做法的延伸,电影做法采用4或6声道,往往工作在有数字时间码的DA88上,混录到35mm。“HD VT机器声道数量的发展正在允许我们为客户量身定制,整个工作方便多了,只要一盒磁带,任何东西都可以在上面。”
相对于多声轨音频,尽管确实只有一个高清图像要处理,但图像性质是各有不同的。地面电视广播图像有625(欧洲)或525(美国)有效行;HD图像或是 720p或1080i。隔行扫描是电视传输的首选,并用于体育、音乐会及其它实况节目。逐行扫描给出摄影机基于帧的外观,用于纪录片和戏剧片比较有利。
更高……更低
有两种确实会出现混淆的是帧频。欧洲工作于25fps逐行(25p),而美国选择了23p。如果图像和M&E在24p制备,而且必须在25p传 输,那么音频时长必须短4%以便与图像匹配。因此为实现匹配,声轨必须重新修正。Steve Haynes为此使用适用于Pro Tools的Serato音调和时间压缩插件,并发现在24比特而不是16比特录音使过渡不易察觉或不“起伏”。
过多的HD标准还意味着为确保兼容性,在工作开始前必须组织准备好图像。这与用一个黑场信号发生器排列PAL图像类似;对于HD,用三同步参考信号稳定一切并保证图像的平稳工作。
化妆
在艺术上配音师并不觉得HD有大影响。另一方面对白剪辑则为难于鲜明和清晰的大图像,尤其是ADR正在工作时。有一个顾虑是除非同步绝对正确,否则观众将 注意到已被替换掉的台词。对白剪辑Ian Wilkinson表示现在甚至需要更大的关注,但压力最大的制作组成员是化妆师和服装设计师,因为他们的工作是毫无保留地被观众仔细观看的。某些演员担 心的是HD将显示其脸上的所有缺陷,而英国最受欢迎的肥皂剧的布景由于对HD来说太旧已被改建。从音频的角度,表演者应当更多地关心其发音,而不是他们的 形象。