CAT5电缆:及时可靠的长距离音频传输

来源:百度文库 编辑:神马文学网 时间:2024/04/26 05:39:21
 能否以最小的延迟和 99.999% 的可靠性长距离地传输高码率的数字音频信号?是否采用普通以太网机制就能满足您的要求,或者您需要一种为音频优化的变种?
  要点
  传输音频的 CAT5(5 类)电缆配置进入 TCP/IP 不敢涉足的应用场合;
  Cirrus Logic公司宣称除了得到主要半导体厂商的支持外, CobraNet 还有与一般以太网传输之间的兼容性;
  MaGIC(加速媒体全球信息载体)的发展速度有所下降,制造商在把它的某些思想纳入业界标准委员会的活动中;
  EtherSound 提供精确的容错以及极小的延迟,付出的代价是以太网兼容性。
  AudioRail 选择了一种不同于竞争者的成本优化路径。
  下次你去听音乐会时,注意一下那些将舞台设备连接至观众席中间混音台的电缆。你可能会发现一至多条“蛇形”粗电缆,里面有多根电线,每根电线都会传送某种模拟信号。你会想,这么沉重、庞大的电缆,一定会产生很大EMI辐射吧?对外界噪声也会很敏感?没错。所有这些问题(还不止这些)都阻碍着传统的模拟互连机制发展。那么,为什么很多录音室和其它音响设备环境(如教堂、办公室和学校礼堂)仍然在使用这种古老的方案?
  商业、工业和专业音频领域里进步的车轮总是转得很缓慢。音响设备的设计注意了在恶劣条件下的长期使用寿命,所以新设备的预算就没有存在空间了,更换与升级的机会变得微乎其微。即使有了这种机会,潜在客户也会迷失于各类不兼容方案中,因为供应商总是试图把他们约束在单一来源的设备套件上。模拟向数字的转换还在进行中,市场领导推动的事实标准和行业标准团体的帮助引起的争论均会削弱选项的多样性。
  如果你是要在互联网上听流媒体音频,或者将服务器里的音乐库传送给家庭或办公室局域网连接的各种音响设备,那么“选项的多样性”要求可能会难到你。在CAT5(5类)电缆上进行方便、实用而廉价的 TCP/IP 以太网传输能确保 100m 传输距离吗?还是会更长?无需电缆的 Wi-Fi(无线保真)技术怎么样?(见附文“电缆传输的选择”。)在某些情况下(随着技术的进步会越来越多),答案是肯定的。但是在高要求的音频环境下,固有的时间不敏感性和批量文件传输特性却阻碍着它的应用。
  当你按下带 LAN 或 WAN 连接音频接收机上的“播放”键后,会有几秒钟的延迟,因为数据先要装满本地的缓存区。缓存区用于补偿协议开销,以及由于数据包路由延迟而产生不可避免的数据包接收顺序混乱,还有更糟糕的网络拥塞、冲突,以及其它导致数据包丢失、强制重发或误码隐藏等问题。大多数家庭网络在现在任何时候几乎都是轻载的,但这种状况在视频流时代正在快速改变。然而,你不能对商用、工业和专用网络作同样的假定,特别是那些承担多通道高分辨率音频,以及用于控制数据和进行普通数据传送的网络。
  可觉察的延迟是现场演出所不能容忍的,大多数录音环境下也不接受。那么什么是“可觉察的”?根据 Gibson公司 的主席兼首席执行官 Henry Juszkiewicz 的说法,鉴于“学院派”们声称人类的耳朵、眼睛、肌肉和大脑可以联合作用,探测出皮秒级的延迟,所以音频技术人员应该争取使通过网络每个“跳跃”的延迟为半毫秒。专业音乐家能够觉察到 2 ms 级的总延迟(也包括模数和数模转换、模拟音频处理和数字音频处理算法,以及其它延迟),但对一般聆听者来说,低于 5 ms 的延迟很难察觉到的。

  CobraNet 的攻击
  虽然基于普通 TCP/IP的 CAT5电 缆传输可能不能满足音频应用的要求,但对软、硬件供应商来说,大批量、低成本的 CAT5 电缆仍具有吸引力。Cirrus Logic 公司的 CobraNet 技术是该公司 2001年年中收购 Peak Audio公司 的成果,它是 CAT5 音频宝座的最有力竞争者和市场份额领先者。CobraNet技术 还因为能够与其它以太网数据流在同一个网络资源上共存而知名(图 1)。然而,它的能力也并非完全不受约束,现在 Broadcom公司 的网络架构师、前苹果公司 FireWire 首席架构师 Michael Johas Teener 就注意到,CobraNet 采用了一种“有限拓扑”概念,以确保能够实现自己声称的能力。据他分析, “一次附加的交换,或者合法但‘非 CobraNet’配置”,质量就会变差(见附文“其它协议”,以及参考文献 1)。
  CobraNet 协议把一条或多条音频通道结合为一个以太数据包,并带有识别数据,如采样大小和速率。你还可以通过以太网桥接  RS-232 数据或包括用户定义控制数据的普通以太网数据包发送控制信息。第一代的 CobraNet 收发器模块采用 FPGA 封装的数字逻辑、Motorola(现在的 Freescale)DSP 以及模拟电路。第二代模块在一片 CS1810xx ASIC 中包括了数字和模拟电路,以及 Cirrus Logic 的 DSP。(现有2×2、 8×8 和 16×16通道的变型。)Cirrus 还在一月份的消费电子大展上展示了一个包含 DSP 的 CS4961xx 变型产品。该芯片是支持多种采样大小、采样速率和音频通道的多维矩阵,芯片定义的各种延迟时间可以满足你的应用需要,如 5.33 ms、2.66ms 和 1.33 ms。(点击此处进入上 Brina 的博客网页“通过 CAT5 传送音频:有趣的亮点和其它信息” www.edn.com/briansbrain。可下载来自 Cirrus Logic 的电子表格,为您做必要的计算提供方便。)
  CobraNet 支持 48 kHz 和 96 kHz 取样速率,但奇怪的是不支持红皮书音频 CD 和一般音频外设使用的 44.1 kHz标准。它还支持 32 位 的采样率。按照高级营销经理 David Parker 的说法,CobraNet 在东京迪斯尼公园安装了一套展示系统,它采用一根千兆以太网光纤主干线,以及 250 个相当于 100兆位 以太网收发器的结点。这个统一的网络用于处理相关的数据流,如照明、交通控制以及销售网点的收银机,还有分布式音频广播和现场音频广播等。Parker 说:“公园每周开放7天,全年 365 天不停。任何一个网络故障都会造成整个公园的瘫痪。”

  MaGIC 调音
  回溯过去,当 Gibson公司在苦思冥想将数码吉他连接到放大器和混频器接口上时,CobraNet 仍然需要预付每通道特许费。公司决策者似乎看到了滚滚特许费流入自己的口袋。Gibson公司则走了自己的道路,MaGIC(加速媒体全球信息载体) 就是结果。(MaGIC 的前身是 Zipi,是公司基于令牌环网方案。)除了一个 FAQ、一个完整的规范和其它资料外,Gibson公司的网站上还提供约 10 分钟 Windows Media 格式的视频,概述了 Gibson对 MaGIC 作为家庭控制、多媒体以及通用数据传输协议的所有憧憬。然而,Gibson公司的这个视频是在 2001 年公布的,从那以后,其它公司和业界标准团体也为消费电子市场推出了替代方案,而且现在占据了优势地位,包括苹果公司的 Bonjour、UPnP(通用即插即用),以及微软的 PlaysForSure和 Windows 媒体扩展器等。





  但是,Gibson 公司仍相信,他们的方案在商用、工业以及专业音频领域仍然具有价值。MaGIC 可以在 100Mb 以太网上提供 32 条 32 位 双向音频通道,采样率可高达 192 kHz。(随着通道数量的增加,允许的采样率也会下降。反之亦然。)Gibson公司 称数据与控制信号的传输要比 MIDI(乐器数字接口)快 30倍到 3 万倍。其它电缆功能包括幻象电源、自动时钟和网络同步等。尤其值得注意的是,MaGIC 规范在 100m CAT5 电缆上的点对点延时时间为 250ms。
  但是,这种令人印象深刻的性能规格却要付出代价,即不能完全与以太网兼容。MaGIC 确实符合 IEEE 802.3 PHY(物理)层,并采用标准 CAT5 电缆和 RJ45 接头。(也可以使用 Neutrik 的加固 EtherCon 接头。)但是,它采用了非常规的数据包大小,需要一种特殊的 MAC(媒体访问控制)来实现。Gibson公司 在网站上的 FAQ 中称:“我们数据包占用的空间大小与以太网 UDP(用户数据报协议)相同。与标准以太网不同的原因是,我们数据包的大小与传输速率是不变的 . 我们在 MAC 层上作路由,这是 Layer 2。我们把数据看作这一层的帧,而不是包。MAC 层的某些部分可以组合到软件里。”(参考文献 2)。
  Gibson公司 向所有感兴趣的团体提供 10 年的MaGIC 许可免费,希望能促使该协议成为业界标准的互连方案。另有 2500 美元的软件开发工具包和一个 600 美元的评估板可提供,CobraNet 收发器的 VHDL 的实现是面向 Altera 和 Xilinx FPGA 的。Juszkiewicz 承认,在大批量应用中,需要用现代的 ASIC 实现方法才能达到成本目标,并且他正在就未来支持千兆以太网速率的 CobraNet硅片提供对 MaGIC 协议的支持进行协商。(Cirrus Logic 公司对 Juskiewicz 的声明不作评论。)那么 Gibson公司 原计划在 2002年年底进入生产的数码吉他怎么样了?(点击此处进入 Brian 的 Blog 网“通过 CAT5 传输音频:亲自实践拥塞)。该吉他的原型多年前就已经有了,但公司正在等待一个合作伙伴开发的结果,它会提供能反映 MaGIC 能力的出色标准,包括将每根弦放在一个专用音频通道的能力。

 

  一个“正统”的替代者
  Digigram 公司的 EtherSound 现在是 CobraNet 的有力竞争者。与 MaGIC 类似,EtherSound 在 PHY 层与以太网兼容,但需要一个特殊的 MAC。它不支持传统的总线结构和环状拓扑,而需要一种菊花链接或星形互连结构(基于 Layer 2 交换,不支持较高层的交换机和路由器),或两种方法的结合(图 2)。但这些限制的好处是降低和确定了延迟,在主模块串行输入端和下一个从模块串行输出端之间的音频传输是六个采样,即在 48 kHz 采样率下为 125ms。每次在路径中增加一个菊花链的 EtherSound 模块,就会增加约 1.5ms 的延迟(见附文“无线何处去”)。EtherSound 是一种同步网络。主控模块产生网络音频时钟,每当一个应用需要保持相位一致性时,所有下游 EtherSound 设备的音频时钟都取自于这个时钟。


  EtherSound 协议 1.0 版是一个每帧两数据包方案,第一个包内含命令信息,接下来的包中含的是相当于 64 个通道的音频信息,每个通道支持 24 位采样。EtherSound 本身允许 44.1kHz 和 48 kHz 采样率,更高采样率的音频流(如 88.2kHz、96kHz 和 192 kHz)使用一个 EtherSound 帧中多个通道来实现。一个 100 Mbps 的 EtherSound 网络可以携带各种音频流的组合,例如 48 kHz的 64 个音频流,或 48 kHz的 62 个音频流加一个 96 kHz的音频流,一直到 192 kHz的 16 个音频流。
  现在有许可的工具可以加快制作时间,包括一个软件开发工具包、源码和目标码、一块评估板和两个针对 Xilinx Spartan-IIe FPGA 的参考设计。Digigram公司 还销售许多 EtherSound 发射机与接收机,带有多种数量与类型的模拟输入、输出端,以及一个  miXart 8 ESPC 声卡。计划中的 100 Mb 增强版包括在网络上任意地点定义双向菊花链的功能、支持 Xilinx Spartan-3 FPGA、广泛的网络管理、基于环状的网络冗余,以及为所有设备产生网络时钟的能力。另外,与 Cirrus Logic公司 和 Gibson公司 一样,Digigram公司 正密切关注千兆位以太网,把它们看作一种未来的发展,能够支持标准以太网以及其他媒体传输,如视频和普通数据。

  注重简单性
  Garth Wiebe公司 建立 AudioRail 技术是基于一种假设,即大多数人不会在现场音响上投入资金。他解释说:“你有学校、教堂、小型音乐组织、剧院、会议中心,等等。确实有大型的音响公司和场所,但大量较小、预算较低的组织阻碍了它们的发展。”因此,他创建了初级 M11 协议,这是一种采用时分复用方法的 4 位、25 MHz 数据流。AudioRail 使用以太网收发器,但用一个更简化的 FPGA 可编程逻辑设计替代了以太网的 MAC。
  Wiebe 说,这样的结果就产生了一个可靠的产品,它的成本只占其它实时网络音频方案的一小部分。Wiebe 还说:“我们还没有一次现场失败的例子。没有客户对故障进行抱怨,确实如此。而且除了美国以外,我们还把这个技术带给全球其它国家。”你可以亲自到该公司的网站上研究 AudioRail 的成本和可靠性,网站上有该公司和其竞争者的技术与产品介绍。每个 500 美元的 ADAT(Alesis 数字音频带) rx32tx32 机架安装式设备可提供8个 ADAT “光导管”的光学连接,包含4个输入和4个输出(图 3)。每个光导管端口可以传送8个 16位 至 24 位、48 kHz 音频通道,通过每个 AudioRail 双 CAT5 连接,总共有 64 个 24 位、48 kHz 音频通道(点击此处进入 Brian 的 Blog:“通过 CAT 传送音频:其它方案”)。


  AudioRail 与其竞争者一样可提供低延迟性:在数字域约为5ms,准确地说是端到端为 4.5ms + 0.25ms/跳跃+0.005ms/m。Wiebe 告诫说:“有一个特性虽能提供灵活性和多功能,但也可能带来问题。这就是 AudioRail 数字音频流均可以用自己来源的独立时钟作驱动。AudioRail 可以简单地把数字音频电缆捆扎在一起,实现模块化。它们不需要公共时钟。灵活性与多功能性意味着你能够以不同的采样速率,通过同一根 CAT5 电缆运行多个时钟域。潜在的问题是,在只有单个数字音频系统的情况下,你必须确信所有设备都正确地作为时钟主设备的从设备,即使它们均来自同一个 AudioRail 机箱。这可能需要点特别办法,也许是几个极短字的 时钟BNC电缆,两端把各设备的时钟端接起来。”

 

  附文:无线何处去?
  近些年来,上台表演的许多吉他演奏者(包括歌手和其它音乐家)都已经采用了无线技术,因此通过 CAT5 电缆连接吉他的想法似乎有些过时。Gibson 公司负责 MaGIC 业务开发的副总裁 David Mayne 指出,公司的实现方法着重于提供低延迟和保证 100% 的 QoS(服务质量)。该设计中并没有什么部分是阻止采用无线传输的,但无线方法会降低公司对 QoS 的预期值。Gibson公司 清楚无线的好处,也期望继续采用无线方法,但质量是公司的首要关注点。首席执行官兼主席 Henry Juszkiewicz 把 UWB(超宽带)看作“很大的希望”,因为与当今的 2.4 GHz 和 5.2 GHz WiFi 方法相比,它更抗干扰,因而其延迟时间更可预测。
  AudioRail 技术的创建人 Garth Wiebe 也在商业、工业和专业音频领域的无线传输方面有相同的想法。他认为:“无线技术中充满隐藏的危险。进入射频段,你必须考虑信号衰减和数据的重新传输。这对数据不是问题,但实时音响却无法容忍这些问题。理论上说,要解决这些问题就需要更大的缓冲,这会产生更多延迟,也是无法接受的。”
  Broadcom 公司的网络系统架构师 Michael Johas Teener 将这个讨论推广至视频领域,他指出:“无线传输的服务质量不能满足高清晰质量的视频要求。单接入点域中的延迟过长,达到数十毫秒,而在网格结构中更糟糕,普通家庭环境下就经常会发生数据包丢失”(参考文献 A)。因此,Belkin 选择了一种基于 Magis 网络芯片组的专有无线传输机制,用于它的 RemoteAV 发射与接收组件。
  参考文献
  A.http://grouper.ieee.org/groups/802/3/tutorial/mar05/tutorial_1_0305.pdf.

  附文:其它协议
  CAT5(5 类)线缆具有低成本和长距离驱动能力,使它成为除以太网数据包传输以外,可用于音频数据格式的一种很具吸收力的选择。例如,根据 Analog Devices 公司的 DSP 营销项目经理 Denis Labrecque(他也是前 MIDI 软件供应商 Staccato 系统公司的企业营销经理)的说法,MIDI(乐器数字接口)制造商协会就正在从事通过 CAT5 进行 MIDI 传输的标准化工作,不过协会的代表未对这一信息作出回应,而协会的网站上目前也只列出通过 IEEE-1394 传输 MIDI的规范。
  通过 CAT5线缆传输FireWire编码音频是另一种可能,FireWire音频的先驱 Bob Moses 正在从事他最新的冒险,他现在是 Wavefront 半导体公司的副总裁和工程主管。Moses 评论说:“据我所知,我是唯一一个用FireWire设备通过 CAT5 传输音频的人,至少现在是这样,我做了两个设计。第一个是用 TI 硅片的参考设计,名为 OnRamp。第二个参考设计是采用我们最新的 Dice II FireWire音频芯片的评估模块。我们计划在 CAT6 以下的电缆上传输 400 Mbps(或在低于 CAT5e 上传输 200 Mbps,或在普通 CAT5 上传输 100Mbps)。我们相信,这种解决方案比以太网方案要便宜得多,这样你能得到FireWire等时传输的所有好处,而从在以太网上传输音频的其他方案上是得不到这些的。”

  附文:电缆传输的选择
  CAT5(五类线)有 100m 的规格限制,这对您需要的音频传输距离是否过短?如果这样,可考虑采用光缆。例如,Cirrus Logic公司的 CobraNet 资料中就表示,它能够在多模光纤上可靠地传输长达 2km,或者在单模光纤上传输长达 100km。光缆的传输机制不同于电缆,它不会辐射出 EMF,也不易受其它 EMF 源的干扰。