股票市场分析方法综述：从随机波动到动力学过程

来源：百度文库编辑：神马文学网时间：2024/04/29 02:34:00

股票市场分析方法综述：从随机波动到动力学过程

研究组

在自然界、工程技术科学领域以及经济社会方面，波动现象俯拾皆是。例如河流来水量的年际变化、太阳黑子数量的变化、机械振动、电路振荡、物价指数和GDP的消长、时尚的变化，等等。不同的波动现象服从不同的规律。出于预测、控制和驾驭波动的目的，人们在研究各种波动现象所服从的规律方面，投入了大量的财力、物力和心智；既取得了很大的进展，也打开了更为广阔的有待探索的空间。

本文将对二十世纪八十年代及前有关股价波动的某些研究作出综述，其重点在于数学系统建模方面。

一、随机走动与巴奇莱尔假设

对于一个时间序列数组（横轴为时间t，纵轴为所关心的某一变量的值），它随时间t变化的图象应该如何来表示呢？最易想到是如下的一个回归模型：X_t=β₁t+ε_t（ε_t是一个随机变量，其均值为零，方差为；对于不同的t值，可以假设ε_t是正态独立分布的）。

这个模型要求诸ε_t因而诸X_t是相互独立的。但是，当一个时间序列的诸X_t具有如下性质时：即X_t-1大，X_t也一般趋向大值；如X_t-1小，X_t也趋向于小值；则上述模型对此数组显然是不合适的。因为，X_t可能依赖于X_t-1，X_t-1可能依赖于X_t-2，等等。例如，气候变化常呈现连旱、连涝的图景；而股票市场的价格波动通常也具有连涨连跌的模式（即追涨杀跌）。

在这种情况下，我们宁可要一个表示X_t对X_t-1或X_t-1对X_t-2的这种依赖关系的模型，而不要表示X_t对t的依赖关系的模型。基本统计方法主要基于假设数据在统计上是相互独立的或互不相关的。这不能直接用于上述数据模式，因为它们不是相互独立的。实际上，每一个数据组最重要和最有用的特性是多次观测之间的依赖关系或相关性。依赖关系正是表征作为基础的动态或“记忆”性能的（在力学里称之惯性）。一旦确定依赖关系的量值，则利用系统的依赖关系/动态/记忆性能就可从系统的过去值预测其未来值。依赖关系或动态的本质是使一个系统与另一个系统相互区别开来。

一阶模型

如此，可以把表示X_t与X_t-1关系的模型写成

X_t=ø₁ X_t-1+a_t（1）

前式表示在同一时刻，一个变量对另一个变量的依赖关系；（1）式则表示变量在不同时刻对其自身的依赖关系，即变量X_t对其自身回归。因此，（1）式被称为一阶自回归模型，用AR（1）表示。

式（1）的AR（1）模型首先假设：在不同的t值上诸a_t是相互独立的，且均值为零，为方便起见，也将假设a_t 的分布是正态的。另外由于（1）式是一阶自回归或自回归的，它就隐含地假定：a_t不依赖于X_t-2，X_t-3等等。

如有一组数据，怎样用一个AR（1）模型去“拟合”它，并获得ø₁和的估计值呢？由于AR（1）模型恰好为条件回归，可以通过使诸a_t的平方和为极小，用条件最小二乘估计的方法去求ø₁和（a_t的方差）。参数ø₁表示X_t对X_t-1之间的依赖程度，如依赖关系较强，则ø₁的值将较大；反则反之。如果ø₁为零，则AR（1）模型变为：X_t=a_t；如此，X_t实际上成为一个相互独立的或不相关的序列（这是一个AR（O）模型）。在这种情况下，X_t随X_t-1变化的图形（即X_t-1为横轴，X_t为纵轴）看起来将是不规则的、随处散布的。

显然，AR（1）模型并不是适用于每一个平稳的随机系统，但它对许多具有惯性特点的系统是一种近似良好的模型。通过对1961年5月17日至1962年11月2日IBM每日股价的研究便可以清楚地看到这一点（数据和图示见附录）。用条件最小二乘估计可计算上述IBM股价序列的AR（1）模型的参数，由此可求得：ø₁=0.999, =52.61。相应的计算和检验表明a_t与a_t-1及a_t与X_t-2的关系没有明显违反上述基本假设的迹象。这样，AR（1）模型（具有舍入的各参数）：

X_t=0.999X_t-1+a_t ,a_t～NID（0,52.61）可被认为适用于IBM股价序列。

这个AR（1）模型可以非常近似地表示为：

X_t=X_t-1+a_t （2）

即：X_t-X_t-1=a_t或 X_t=a_t，式中表示差分算子。由于ø₁接近于1，故（2）式是AR（1）模型的一个有趣的极限形式。首先，它表示系统的特点是惯性极大，即有强依赖关系或记忆性能。除了随机相互独立的增量a_t之外，当模型从t-1时刻运动至t时，其数值或响应保持不变。如没有这个增量a_t，系统可能无限期地停留在同一状态。

AR（1）模型的极限形式（2）的一个直接结论是：基于X_t-1预测X_t，即。这样，明天股价的最好预测或预报就是今天的股价，至少对于正在研究的IBM股价来说是如此。

由于X_t-1=X_t-2 +a_t-1，如将此代入（2），并继续迭代下去，

可得：X_t= a_t +a_t-1 +a_t-2 + … ＝（3）

如此，X_t就简单地成为许多相互独立的随机变量之和。换言之，序列是每一时刻由随机的一步加到先前的状态上而产生的。由此，式（3）及式（2）被称为“随机走动”模型。也就是说，股价的行为就像随机走动一样，明天价格的最好预报就是今天的价格；这一个推断早在1900年就由巴奇莱尔（Bachelier）提出了。现在称之为巴奇莱尔假说。

股价的波动行为就像随机走动一样，这一观点至今仍在经济研究中占据主流地位；而且，它还成为市场有效性假设的基石。它假设市场价格是不可预测的，其检验方法是通过市场价格遵从随机游走模型等方法来实现的。市场有效性假设的含意是：市场价格的随机波动反映的正是一个功能良好、理性的有效市场，因此，任何人都不可能只依靠信息的分析来获得套利的机会；由于证券价格是随机波动的，任何信息都不能影响市场价格的系统发展趋势。

在后文中，我们将会看到市场价格或股价波动的不可预测性及其程度，不一定只依赖于随机走动模式。

高阶模型

前述AR（1）模型对于IBM股价波动的机理给出了一个定性的说明，即其是随机走动的。然而它是不是一个最合适的模型呢？为了回答这一问题需要把模型的选择推广到ARMA（n，n-1）的范围，即（n阶）自回归（n-1阶）滑动平均模型。

现在产生一个问题，是否总能用一个ARMA（n，n-1）模型去表示或近似表示一组数据呢？换言之，每一随机系统能否用一个ARMA（n，n-1）模型去恰当地表示呢？对于平稳随机系统，包括其极限情况（例如随机走动），这个问题的答案是肯定的。利用希尔伯特空间（无穷维空间）上线性算子的基本理论，可以证明：对于离散的、连续的、标量的以及向量的情况，用一个（n，n-1）阶的自回归滑动平均模型可以把任一平稳随机系统逼近到所要求的精度。另外，所谓求和ARMA模型（即ARIMA）也可以作为ARMA（n，n-1）的特例来得到；例如随机走动 X_t=a_t，是ø₁=1时的AR（1，0）；求和随机走动 X_ta_t是ø₁=2，ø₂=-1和θ=0时的ARMA（2,1）等等。虽然，对n应为多大没有一个理论的极限，但在实用中，n值通常都是较小的；对于很多情况，n=2实际已足够了。在实际中，大量的随机系统可以恰当地用ARMA（2，1）模型来模拟。在研究连续系统时，ARMA（2，1）模型的重要性将变得特别明显。

ARMA（2，1）模型的方程如下：

X_t= ø₁X_t-1+ ø₂X_t-2 - θ₁a_t-1+a_t (4)

对于IBM股价序列，由于高阶模型的残差平方和减小明显，拟合了ARMA（2，1）、ARMA（4，3）、ARMA（6，5）和ARMA（8，7）模型系列，结果见附录的表2；利用F-判据，合适的模型就是ARMA（6，5）。但是，AR（1）（即AR（1，0））模型的置信区间是最好的；如果选择一个0.01的显著水平，利用F分布的百分数点表，则可以认为AR（1）是合适的。

IBM股价序列的AR（2，1）模型为：

X_t=1.05 X_t-1-0.05 X_t-2-0.03a_t_-1+a_t

其中ø₁接近于1，ø₂的值很小。因此，当 ø₁=1时的极限ARMA（1，1）模型：X_t= X_t-1-θ₁a_t-1+a_t，也可能是合适的；对于这个模型，只有一个参数，因为均值μ被抵消：

X_t-X_t-1=（X_t-μ）-（X_t-1-μ）

参数θ₁的估值为：θ₁＝-0.0848±0.1030，残差平方和＝19334.2。

这样，这个极限的ARMA（1，1）模型也可以被认为是合适的；尽管小的θ₁值及其置信区间再次显示出AR（1）模型（Ø₁→1）或随机走动。但在处理指数平滑法预报股价时，此ARMA（1，1）的结果将是有用的。

二、微分方程与动力学

用常系数微分方程表示的最简单系统是一阶系统，从连续、离散关系的观点来看，一阶系统也是最简单的。因为它的均匀采样系统具有AR（1）模型的离散表达式。对于较高阶系统，这将不再是正确的，例如，均匀采样的二阶连续系统一般不具有AR（2）的离散表达式。

一阶模型

尽管简单，但一阶微分方程仍能表示大量的实际系统，它所依据的基本假设是：在任何时刻，变量的变化率都与其量值成比例。这个假设对于许多实际系统（如转动机械等）都非常接近于真实情况。该假设对于任何处于平衡状态的系统受到小扰动时也是正确的。因此，一阶模型对许多随机系统也是有用的。

现考虑系统的响应X（t），它在时刻t的变化率X´(t)与该时刻的量值成比例，而符号相反，如果比例常数用a₀表示，则系统的方程为：

X′(t) = －a₀X (t)

或X′(t) + a₀X(t)=0 （5）

上述方程的解为：X(t)=x(0)

通过引入“连续白噪声”扰动力函数Z（t），可把上述齐次微分方程转化为一个非齐次随机微分方程：

X′(t) +a₀X(t)=Z(t) （6）

式（6）表示连续时间一阶自回归系统。为了避免每次都使用连续一词以便与离散AR系统相区别，下文将用A（1）表示它。

这里，输入Z（t）相应于前文中离散形式的a_t，Z（t）具有零均值，并且在不同时刻是互不相关的。输出X（t）也为一具有零均值的平稳随机过程；X（t）的相关或协方差函数是连续时间的函数，且当正交分解已知时可以推导出来。

应该注意a_t的方差是；而Z（t）的方差为“无穷大”，这是白噪声不存在这个具体事实的数学解释。然而，在一个有限区间（例如Δ）上，白噪声的积分的确存在，且方差实际上为Δ 。

在前述（6）式中，当a₀→0，易见A（1）模型变为

X′(t) = Z(t) （7）

这是连续时间下的随机走动。如同在离散情况已经看到的那样，随机走动简单地就是不相关的变量a_t的总和（参见（3）式）。自然，在连续情况下，它就是不相关白噪声Z（t）的积分。

当a₀趋于零时取极限，可得到上式的等效表达式：

(8a)

… (8b)

即X_t=a_t +a_t-1 +a_t-2 + ……。

这正是离散时间随机走动式（2），它是离散模型在a₀ →零时的极限情况。

式（7）形式的连续时间随机走动亦称为独立增量过程。因为它在不连贯的间隔内，过程的增量是相互独立的，如两间隔相重叠，则增量将为相关的。

前文已提到，随机走动模型是巴奇莱尔于1900年联系股票价格提出的设想。维纳及其他人在描述粒子悬浮在流体中，受流体分子随击冲击下的布朗运动时曾经使用连续时间随机走动模型（7）。因此，连续时间随机走动也称为巴奇莱尔一维纳过程。

在（5）式中，参数a₀表示系统的阻尼、惯性或对平衡位置改变的阻力。参数在概率意义上表示随机扰动力函数、噪声或干扰力Z（t）的力量或强度，它导致发生改变并产生响应X（t）。

下述方程：

X′(t) = -a₀x(t)+Z(t)

表示变化率也受随机分量Z（t）的影响。-a₀X（t）项的作用就象是恢复或阻尼力，要把系统推回到已假设为零的平衡或中间位置。只要-a₀x（t）项占支配地位，响应将停留在中间位置左右，并围绕中间位置波动。

当a₀值变小时，随机项Z（t）开始支配变化率X´(t)。噪声Z（t）的符号可能为正或为负，从而可能产生的变化率以随机方式接近或者远离平衡位置。当 -a₀接近于零时，则如式（7）所示，变化率完全由随机项Z（t）支配，从而产生一随机走动，其响应可能长时间偏离平衡位置。式（7）表明，X（t）的导数是随机的。而其采样表达式（2）（即 X_t=a_t）表明，在间隔相等的两次观测之间的差别是随机的。比较式（8a）和（8b）及其后的离散时间随机走动公式清楚地显示了连续和离散过程之间的关系。

为了例示极限情况，试研究IBM股票价格序列。前文曾为此序列拟合了一个ø =0.999和＝52.61的AR（1）模型。由于参数ø为正值，此AR（1）模型也将是一个采样系统模型，所以可由下式求得A（1）模型的参数。如取一天的采样间隔作为时间单位，因而有Δ=1，则

a₀=-（ln ø /△）=-Ln(0.999)=0.001

=(2a_o )/（ 1- ø ² ）= (2×0.001×52.61) /（1-0.999 ²）= 52.66

这样，IBM股价（减去 —— 即股价序列的平均值之后）的A（1）模型为：

X′(t) + 0.001X(t)=Z（t）

这个例子说明了前文所讨论的：当a_O→0时随机走动的极限情况。上述A（1）模型也可近似表为：

X′(t)= Z(t)

或

这是一个连续时间随机走动，而作为股价基础的连续时间过程是一种巴奇莱尔一维纳过程。

二阶模型

最重要和应用最广的随机系统是以常系数二阶线性微分方程表示的系统。下文通过研究弹簧-质量-阻尼系统对连续时间白噪声或扰动力函数的响应来处理作为随机振动提出的系统。与频域法不同。这里是对随机振动进行分析的时域法。对于许多系统。把二阶微分方程的两个系数解释为恢复力和阻尼力是有用的；还要根据所给出的一组离散数据找出以微分方程形式表示的一个模型。

试考虑一个弹簧－质量－阻尼系统：扰动力函数f（t）作用于质量M，f（t）引起的运动受到弹簧和阻尼器的对抗：用X（t）表示质量体对平衡位置的距离，并假设X（0）= 0。如假设对平衡位置的偏移小，则重力的变化可以忽略，由弹簧产生的力可以认为与位移X（t）成比例，而由阻尼器产生的力可以认为与速度X′(t)成比例。沿f（t）方向量测的力及其符号为：f（t）为扰动力系数；－KX（t）为弹簧力，K为弹簧常数； -C X′(t)为阻尼力，C为阻尼常数。

根据牛顿定律，可得质量体M的运动方程

f（t）－KX（t）－C X′(t)　=M

或 M +（C/M）X′(t) +（K/M）X(t)=（1/M）f（t）（9）

令 =K/M或ω_n =（K/M）^1/2 和ζ= = 实际阻尼 / 临界阻尼，则称ω_n为自然频率，ζ为弹簧-质量-阻尼器振动系统的阻尼比。把式（9）化成熟悉的形式

M +2ζω_n X′(t)+ X（t）=（1/M）f（t）

或（D²+2ζω_nD+ ）X(t)=(1/M)f(t) (10)

其中D为微分算子，（10）式表示一个自由度的振动系统受到扰动力函数f（t）作用后的受迫振动。

为使A（n）系统的符号统一，先从（10）式的齐次形式入手，有

（D ²+a₁D+a₀）X（t）=0 (11)

式中a₁=2ζω_n=C/M (12)

a₀ = =K/M (13)

引入扰动力函数Z（t），可得A（2）系统的方程为

（D ²+ a₁D +a₀）X（t）=Z（t） (14)

E[Z（t）]=0

E[Z（t）Z（t-u）]= δ(u)（δ(u)为狄拉克函数）

应该注意，在对数据拟合A（2）模型（11）时，a₀与a₁是作为回归系数求得的。这些系数分离为ζ与ω_n是为了便于把响应作为一种随机振动解释。式（12）、（13）提供了这种分离，且把a₁看作单位质量、单位速度的系统阻尼力，把a₀看作单位质量、单位位移的恢复力。然而，这种类比不能延伸的太远，除非记录是来自真实的机械振动系统，否则基于这种记录的物理解释只是一种抽象的概念，在处理提取数据的系统的参数和特性时应该小心使用。

前文已指出，在取作均值时，随机振动模型能恰当地拟合IBM股价数据。这就证实了巴奇莱尔的假说：股价的变化情况就像随机走动，因此，明天股价的最好预报是今天的价格。前已表明，在估计均值时，AR（1）模型也是合适的。不过ARMA（1，1）模型也可提供一个相当好的拟合，尽管其中θ₁＝-0.0848±0.1030的估计表明，95%的置信区间包括零，并且模型在趋向于一个随机走动模型。由此易见，如果拟合一个A（2）模型，则IBM股价序列将是一个好的实例。

和离散模型拟合的情况一样，对IBM数据，拟合的A（2）模型支持了它是一个随机走动的假说。因此，就预报股价而言，A（2）模型与随机走动两者实际上将给出同样的结果。由于接近于一个随机走动，明于股价的预报将是今天的价格。因此，一旦知道了模型接近于一个随机走动时，不论是离散的或连续的模型都不可能提供比今天的价格好得多的预报。

但通过与有实际意义的振动系统类比，连续的A（2）模型可以增加对股价历史的深入了解。A（2）模型的参数可以导引出有关上市公司生产力的重要信息，它们通常反映在其股价的历史（或时间历程）上。虽然股价不能“有效”地预测出，但它们可用一个A（2）模型来表征。A（2）模型参数显示出的股价历史能表明：有关上市公司的生产力，其股价的稳定性，其可供有利投资的潜力，特别是与其它上市公司的对比等方面的情况。如果简单地用一个随机走动模型拟合股价，那么所有这些问题仍都得不到答案。下面将阐明，通过拟合一个A（2）模型可以设法定量地回答其中的一些问题。

A（2）模型的参数是用使残差a_t的平方和为极小的方法进行估计的。在每次选代中θ₁是作为一个非独立参数计算的。已拟合的离散模型的估计参数具有95%的置信区间。离散模型（X_t表示对均值的偏差）AR（2,1）如下：

X_t-0.9985X_t-1 + 0.00078X_t-2 = a_t + 0.08742a_t-1

ø₁ ø₂ θ₁

均值＝460.0590±7.2117

残差方差：51.999

考虑置信区间，此模型可表示为： X_t=a_t，这与随机走动模型相同。

通过计算分析表明，上述离散模型变为一个随机走动模型所必须的条件都得到满足。于是作为基础的A（2）模型为

+7.155X′(t)+0.016X(t)=Z

对于此式有ω_n = 0.1265和ζ = 28.26 。

因此，IBM股价将用一高阻尼比28.26和相对较低的恢复力 =0.016来表征。这两种情况都是直观易解的。IBM在计算机市场所占的巨大份额和持久不衰的商誉是导致高阻尼比的缘故，高阻尼比表明其股价波动不会有持久的影响。并将很快会被抑制住。另一方面，它的规模庞大，从而引起的灵活性损失则可能是小恢复力或“弱弹簧”作用的原因。ω_n与ζ这两个数值可用于比较两个不同的公司，或同一公司在两个不同时期的股价历史，以其性能和稳定性来表示。

三、小结

本文综述了以ARMA模型作为一般工具对股价波动进行系统分析的主要内容；这是二十世纪九十年代以前的基本成果，它的主要结论有以下几点。

第一，在一定的意义上论证了股价的波动遵循随机走动，或说遵循马尔科夫过程。假设现在IBM股价或大盘指数为100美元，如果股价遵从随机走动或马尔科夫过程，则一个星期以前、一个月以前、或是一年以前的股价并不会影响我们对将来的预测；唯一相关的信息就是股价的现价为100美元。而对将来的预测是不确定的，必须以概率分布的方式表达。随机走动性质隐含了在将来任一特定时刻股价的概率分布仅取决于股票当前的价格100美元。

第二，股价的随机走动性质与弱型市场有效性相一致。也就是说。一种股票的现价已包含了所有的信息，当然包括了所有过去的价格记录。反之，如果弱型市场有效性不正确的话，技术分析师可通过分析股价的过去历史数据图表获得高于平均收益率的收益。事实上，几乎没有什么证据表明他们能做到这一点。

正是有效的市场竞争保证了弱型市场有效性的成立。有许多投资者和投机者紧盯着股市并试图从中获利，这种实际状况导致了在任何指定时刻的股价包含了以往价格的信息。假设已经发现以往股价中某种特殊模式总是给出65%的末来价格上涨机会。这种方式一旦被观察到，众多投资者就会购买股票，从而股票的需求就会突然增加；其结果为股价骤然上涨，过去观察的效应将失效，任何可盈利的交易机会都会如此。

第三，具有n个自由度振动系统的模拟适用于ARMA。例如一个用白噪声激励，由二阶微分方程描述的单自由度弹簧－质量－阻尼系统进行均匀采样，可求得ARMA（2，1）；又如，当对一个用4阶微分方程描述的两自由度系统进行均匀采样时，可求得ARMA（4，3）。

弹簧－质量－阻尼系统的阐述可用于多种非机械的系统。例如，在处理一个股价的模型时，“弹簧”可以解释为商业或企业的策略灵活性，以使商业、企业能对外界冲击作出反应；“阻尼器”可以解释为商业或企业的财政稳定性，这是其商誉、威信及其产品的专利等因素的综合反映，它可以在某种程度上缓冲外界压力对股价的影响。这种联系，使我们可以把关于机械或电路系统振动的大量研究结果用之于股价波动的研究，而不必再从头做起；同时也便于把相关的物理解释转换成相应的经济解释。

自上世纪八十年代至今，特别是在非线性动力学研究方法引入经济学之后，关于股价波动的研究有了很大的进展。相关的内容将在另一综述中给予描述。这里只指出两点，其一股票市场有效性假设成立与否，不一定仅依赖于股价波动是否具有随机走动性质；它还可以由股票市场波动的拟周期性或混沌性来提供。其二，股价波动的研究不再限于线性振动的范围内，而已拓展到非线性振动的领域里。

主要参考文献

[1]（美）S.M.潘迪特、吴宪民著：《时间序列及系统分析与应用》，机械工业出版社，

1998。

[2] 约翰.赫尔著：《期权、期货和衍生证券》，华夏出版社，1997。

[3] 周爱民著：《股市有效性，泡沫与预警》，经济科学出版社，1998。

股票市场分析方法综述：从随机波动到动力学过程股票市场技术分析方法综述：江恩理论第二章随机信号的分析 2.3 平稳随机过程第二章随机信号的分析 2.3 平稳随机过程从股票市场看B2C的价值1——综述台湾股票市场波动研究第二章随机信号分析 2.3.1 平稳随机过程的定义第二章随机信号分析 2.3.2 平稳随机过程的各态历经性第二章随机信号分析 2.3.3 平稳随机过程的自相关函数的性质第二章随机信号分析 2.3.2 平稳随机过程的各态历经性第二章随机信号分析 2.3.1 平稳随机过程的定义第二章随机信号分析 2.3.2 平稳随机过程的各态历经性1 分析：从陈水扁支持率波动解读台湾政治态势股票市场基础分析手册从程序员到软件设计师的过程从VB6到VB.NET的变化综述 Linux启动过程综述项目管理过程中的问题分析方法富有挑战性工作的心理动力学分析 - 富有挑战性工作的心理动力学分析富有挑战性工作的心理动力学分析富有挑战性工作的心理动力学分析影响我国股票市场价格波动的基本因素股票市场基本分析，今日股票行情