网络容量规划:你还在伤脑筋吗?

来源:百度文库 编辑:神马文学网 时间:2024/04/24 06:15:53
http://www.sina.com.cn  2009年10月19日 02:06  IT168.com
[商用频道] [企业采购] [办公打印] [投影机] [服务器] [网络与安全] [电脑] [软件及服务]
几乎所有处在业务成长中的企业都会有网络容量的问题。企业也许一开始建立网管系统的时候不太能意识到这方面的问题,但当故障管理、问题管理、变更管理、版本管理逐渐展开的时候,容量规划的需求就慢慢出现了。网络容量规划的开展需要有相应的管理能力作基础,包括对业务需求的了解,对网络资产、配置、拓扑的了解和对网络的长期、深入的监控。
与网络容量相关的内容涉及四个层面:基础层面、设备层面、链路层面、协议层面。各层面具体的一些内容如下:
基础层面:机房空间,电力、空调、走线空间。
设备层面:CPU/Mem/交换矩阵/总线利用率,并发连接数,License数量,端口数,插槽数。
链路层面:带宽利用率,业务带宽占比,QoS各队列带宽利用率,数据掉包率。
协议层面:IP地址。
上面各层面的具体内容根据其变化特性,可分为强波动性和弱波动性两类。如CPU利用率、链路带宽、并发连接数属强波动性,IP地址占用、机架空间、端口占用、槽位占用、License占用属弱波动性。弱波动性的内容在扩展时比较容易统计、估算,而对强波动性的内容有的时候可能会缺少好的方法。
网络容量规划的方法:
首先建立网络容量模型:建立上层业务对下层网络基础的依赖关系;了解新增业务对网络容量的需求和进一步的对底层基础的需求。
其次在建立的网络容量模型基础上对一些重要参数进行趋势分析。
简单的网络模型图:

以强波动性的链路流量为例,介绍一种实用的趋势分析的方法。
通常情况下,我们会对链路流量进行长期监测,但是如何评价它会有一些问题。
简单的统计方法,可能很难得到满意的结果。例如统计过去一段时间的平均利用率,但平均值可能和峰值离的很远;统计过去一段时间的峰值,但峰值不能反映长期的平均水平;统计过去一段时间的峰值出现频度,但难以识别其规律,难以估计未来的发展趋势。
实际的解决可以采用序列分析的方法,把事物的发展看成趋势、周期、随机三类因素影响的总和。如下图。

使用多次移动平均(Moving Average),可以将周期、趋势和随机因素解耦。移动平均的具体方法是,对于一个序列,以N为周期,向前遍历求平均值得到一个新的序列。如下图,a1-a7是原始序列,周期N=3,b5是a5、a6、a7的平均值。

通常网络中的一些参数(如链路流量),通常是以天或周为周期的因素变化。所以,相应的可以以天为周期作移动平均来消除一天中的波动,或者以周为周期作移动平均来消除一周中的波动。
如下图是一个具体的例子,一个实际的链路流量图,通过每两小时采一次端口平均流量(Bytes/Sec),连续采集两个月(如 8月22,12:00 p.m.-10月22,12:00 p.m.)共732个采样点绘出。其中横轴是两个月的时间,纵轴为端口流量值。

从上图中可以看到:每天的双峰波动规律较为明显;每周似乎可以看到一定的波动;而从10月4日到6日有一个明显的链路流量高峰,在两个月中的其它时段是没有的。
对上面的统计图做分析可以采取如下的方法和步骤。
1.以一天为周期做移动平均,消除一天中周期波动的影响,如下图。

图中蓝线为原来的统计曲线,红线是做平均移动后得到的曲线,从红线中可以看到明显的以星期为周期的规律(中间10月4日到6日为特例)。
2.进一步以周为单位做移动平均,消除一周中周期波动的影响,得到长期的趋势。如下图。从图中可以看到长期的平稳的趋势。

3.除去长期趋势的影响,可得到只含每天周期和随机因子的曲线,如下图。图中,横轴为时间轴(两个月),纵轴为各时刻实际采样值与以天为周期移动平均后的值(可参考前图)的比。该图反映了一天内各时刻值和移动平均值相比的波动状况。

在上图的基础上,对每天同一时段的波动因子取平均,得到一天内不同时段的周期影响因子,如下图。
内容导航
4.同理,还可以计算出一周内各天的周期因子,如下图。

5.到现在,我们已经得到了趋势图和周期因子(一天的和一周的)。除去趋势和周期因素的影响,则得到随机因子,如下图。

可以用统计的方法验证其随机性,以说明我们对周期因子提取的比较全面,该序列的标准差为0.032,即平均有3.2%的波动。
6.对趋势进行拟合,拟合时剔除异常情况的影响,可得到回归拟合后的趋势图,如下图。

在上面回归拟合趋势图的基础上,结合周期、随机因子进行外推,可得出未来两周内的推算流量图,如下图。

上图中,蓝色曲线部分为(10月22日)之前一段时间的实际采样图,红色虚曲线为推算的未来两周流量图,上边的绿色虚线为包络线,是在前面的平均波动值3.2%乘三之后绘出的波动上限。一旦哪一时段的实际流量值超出了绿色包络线,则可认为是出现了重大事件或者是有一些方面(如业务模式、网络路径)做出了人为的改变。
上面介绍的这种分析方法的主要目的是掌握链路流量的平均水平和变化规律,可以用它来进行短期的预测,但预测的结果仅仅作为一个参考,因为网络之外的很多重要因素好是不可控的,如新业务上线、网络结构变化、病毒爆发等,这些影响可轻易地突破预估范围。
但是,通过这种趋势估计,一旦实际情况与估计出现较大偏离,我们可以认为一定有不寻常的事件发生了,比如实际情况中的10月4日到6日出现的高峰。结合Cisco Netflow技术,对主要应用的带宽使用情况进行趋势分析和预测,则可以达到更好的容量规划效果。