股票市场分析方法综述:从随机波动到动力学过程
来源:百度文库 编辑:神马文学网 时间:2024/04/29 02:34:00
股票市场分析方法综述:从随机波动到动力学过程
研究组
在自然界、工程技术科学领域以及经济社会方面,波动现象俯拾皆是。例如河流来水量的年际变化、太阳黑子数量的变化、机械振动、电路振荡、物价指数和GDP的消长、时尚的变化,等等。不同的波动现象服从不同的规律。出于预测、控制和驾驭波动的目的,人们在研究各种波动现象所服从的规律方面,投入了大量的财力、物力和心智;既取得了很大的进展,也打开了更为广阔的有待探索的空间。
本文将对二十世纪八十年代及前有关股价波动的某些研究作出综述,其重点在于数学系统建模方面。
一、随机走动与巴奇莱尔假设
对于一个时间序列数组(横轴为时间t,纵轴为所关心的某一变量的值),它随时间t变化的图象应该如何来表示呢?最易想到是如下的一个回归模型:Xt=β1t+εt(εt是一个随机变量,其均值为零,方差为;对于不同的t值,可以假设εt是正态独立分布的)。
这个模型要求诸εt因而诸Xt是相互独立的。但是,当一个时间序列的诸Xt具有如下性质时:即Xt-1大,Xt也一般趋向大值;如Xt-1小,Xt也趋向于小值;则上述模型对此数组显然是不合适的。因为,Xt可能依赖于Xt-1,Xt-1可能依赖于Xt-2,等等。例如,气候变化常呈现连旱、连涝的图景;而股票市场的价格波动通常也具有连涨连跌的模式(即追涨杀跌)。
在这种情况下,我们宁可要一个表示Xt对Xt-1或Xt-1对Xt-2的这种依赖关系的模型,而不要表示Xt对t的依赖关系的模型。基本统计方法主要基于假设数据在统计上是相互独立的或互不相关的。这不能直接用于上述数据模式,因为它们不是相互独立的。实际上,每一个数据组最重要和最有用的特性是多次观测之间的依赖关系或相关性。依赖关系正是表征作为基础的动态或“记忆”性能的(在力学里称之惯性)。一旦确定依赖关系的量值,则利用系统的依赖关系/动态/记忆性能就可从系统的过去值预测其未来值。依赖关系或动态的本质是使一个系统与另一个系统相互区别开来。
一 阶 模 型
如此,可以把表示Xt与Xt-1关系的模型写成
前式表示在同一时刻,一个变量对另一个变量的依赖关系;(1)式则表示变量在不同时刻对其自身的依赖关系,即变量Xt对其自身回归。因此,(1)式被称为一阶自回归模型,用AR(1)表示。
式(1)的AR(1)模型首先假设:在不同的t值上诸at是相互独立的,且均值为零,为方便起见,也将假设at 的分布是正态的。另外由于(1)式是一阶自回归或自回归的,它就隐含地假定:at不依赖于Xt-2,Xt-3等等。
如有一组数据,怎样用一个AR(1)模型去“拟合”它,并获得ø1和的估计值呢?由于AR(1)模型恰好为条件回归,可以通过使诸at的平方和为极小,用条件最小二乘估计的方法去求ø1和(at的方差)。参数ø1表示Xt对Xt-1之间的依赖程度,如依赖关系较强,则ø1
显然,AR(1)模型并不是适用于每一个平稳的随机系统,但它对许多具有惯性特点的系统是一种近似良好的模型。通过对1961年5月17日至1962年11月2日IBM每日股价的研究便可以清楚地看到这一点(数据和图示见附录)。用条件最小二乘估计可计算上述IBM股价序列的AR(1)模型的参数,由此可求得:ø1=0.999,
Xt=0.999Xt-1+at ,at~NID(0,52.61)可被认为适用于IBM股价序列。
这个AR(1)模型可以非常近似地表示为:
即:Xt-Xt-1=at或 Xt=at,式中表示差分算子。由于ø1接近于1,故(2)式是AR(1)模型的一个有趣的极限形式。首先,它表示系统的特点是惯性极大,即有强依赖关系或记忆性能。除了随机相互独立的增量at之外,当模型从t-1时刻运动至t时,其数值或响应保持不变。如没有这个增量at,系统可能无限期地停留在同一状态。
AR(1)模型的极限形式(2)的一个直接结论是:基于Xt-1预测Xt,即。这样,明天股价的最好预测或预报就是今天的股价,至少对于正在研究的IBM股价来说是如此。
由于Xt-1=Xt-2 +at-1,如将此代入(2),并继续迭代下去,
可得:Xt= at +at-1 +at-2 + … =
如此,Xt就简单地成为许多相互独立的随机变量之和。换言之,序列是每一时刻由随机的一步加到先前的状态上而产生的。由此,式(3)及式(2)被称为“随机走动”模型。也就是说,股价的行为就像随机走动一样,明天价格的最好预报就是今天的价格;这一个推断早在1900年就由巴奇莱尔(Bachelier)提出了。现在称之为巴奇莱尔假说。
股价的波动行为就像随机走动一样,这一观点至今仍在经济研究中占据主流地位;而且,它还成为市场有效性假设的基石。它假设市场价格是不可预测的,其检验方法是通过市场价格遵从随机游走模型等方法来实现的。市场有效性假设的含意是:市场价格的随机波动反映的正是一个功能良好、理性的有效市场,因此,任何人都不可能只依靠信息的分析来获得套利的机会;由于证券价格是随机波动的,任何信息都不能影响市场价格的系统发展趋势。
在后文中,我们将会看到市场价格或股价波动的不可预测性及其程度,不一定只依赖于随机走动模式。
高 阶 模 型
前述AR(1)模型对于IBM股价波动的机理给出了一个定性的说明,即其是随机走动的。然而它是不是一个最合适的模型呢?为了回答这一问题需要把模型的选择推广到ARMA(n,n-1)的范围,即(n阶)自回归(n-1阶)滑动平均模型。
现在产生一个问题,是否总能用一个ARMA(n,n-1)模型去表示或近似表示一组数据呢?换言之,每一随机系统能否用一个ARMA(n,n-1)模型去恰当地表示呢?对于平稳随机系统,包括其极限情况(例如随机走动),这个问题的答案是肯定的。利用希尔伯特空间(无穷维空间)上线性算子的基本理论,可以证明:对于离散的、连续的、标量的以及向量的情况,用一个(n,n-1)阶的自回归滑动平均模型可以把任一平稳随机系统逼近到所要求的精度。另外,所谓求和ARMA模型(即ARIMA)也可以作为ARMA(n,n-1)的特例来得到;例如随机走动 Xt=at,是ø1=1时的AR(1,0);求和随机走动 Xtat是ø1=2,ø2=-1和θ=0时的ARMA(2,1)等等。虽然,对n应为多大没有一个理论的极限,但在实用中,n值通常都是较小的;对于很多情况,n=2实际已足够了。在实际中,大量的随机系统可以恰当地用ARMA(2,1)模型来模拟。在研究连续系统时,ARMA(2,1)模型的重要性将变得特别明显。
ARMA(2,1)模型的方程如下:
Xt= ø1Xt-1+ ø2Xt-2 - θ1at-1+at
IBM股价序列的AR(2,1)模型为:
Xt=1.05 Xt-1-0.05 Xt-2-0.03at
其中ø1接近于1,ø2的值很小。因
参数θ1的估值为:θ1=-0.0848±0.1030,残差平方和=19334.2。
这样,这个极限的ARMA(1,1)模型也可以被认为是合适的;尽管小的θ1值及其置信区间再次显示出AR(1)模型(Ø1→1)或随机走动。但在处理指数平滑法预报股价时,此ARMA(1,1)的结果将是有用的。
二、微分方程与动力学
用常系数微分方程表示的最简单系统是一阶系统,从连续、离散关系的观点来看,一阶系统也是最简单的。因为它的均匀采样系统具有AR(1)模型的离散表达式。对于较高阶系统,这将不再是正确的,例如,均匀采样的二阶连续系统一般不具有AR(2)的离散表达式。
一阶模型
尽管简单,但一阶微分方程仍能表示大量的实际系统,它所依据的基本假设是:在任何时刻,变量的变化率都与其量值成比例。这个假设对于许多实际系统(如转动机械等)都非常接近于真实情况。该假设对于任何处于平衡状态的系统受到小扰动时也是正确的。因此,一阶模型对许多随机系统也是有用的。
X′(t) = -a0X (t)
或X′(t) + a0X(t)=0
上述方程的解为:X(t)=x(0)
通过引入“连续白噪声”扰动力函数Z(t),可把上述齐次微分方程转化为一个非齐次随机微分方程:
X′(t) +a
式(6)表示连续时间一阶自回归系统。为了避免每次都使用连续一词以便与离散AR系统相区别,下文将用A(1)表示它。
这里,输入Z(t)相应于前文中离散形式的at,Z(t)具有零均值,并且在不同时刻是互不相关的。输出X(t)也为一具有零均值的平稳随机过程;X(t)的相关或协方差函数是连续时间的函数,且当正交分解已知时可以推导出来。
应该注意at的方差是;而Z(t)的方差为“无穷大”,这是白噪声不存在这个具体事实的数学解释。然而,在一个有限区间(例如Δ)上,白噪声的积分的确存在,且方差实际上为Δ 。
在前述(6)式中,当a0→0,易见A(1)模型变为
这是连续时间下的随机走动。如同在离散情况已经看到的那样,随机走动简单地就是不相关的变量at的总和(参见(3)式)。自然,在连续情况下,它就是不相关白噪声Z(t)的积分。
当a0趋于零时取极限,可得到上式的等效表达式:
即Xt=at +at-1 +at-2 + ……。
式(7)形式的连续时间随机走动亦称为独立增量过程。因为它在不连贯的间隔内,过程的增量是相互独立的,如两间隔相重叠,则增量将为相关的。
前文已提到,随机走动模型是巴奇莱尔于1900年联系股票价格提出的设想。维纳及其他人在描述粒子悬浮在流体中,受流体分子随击冲击下的布朗运动时曾经使用连续时间随机走动模型(7)。因此,连续时间随机走动也称为巴奇莱尔一维纳过程。
在(5)式中,参数a0表示系统的阻尼、惯性或对平衡位置改变的阻力。参数在概率意义上表示随机扰动力函数、噪声或干扰力Z(t)的力量或强度,它导致发生改变并产生响应X(t)。
下述方程:
X′(t) = -a0x(t)+Z(t)
表示变化率也受随机分量Z(t)的影响。-a0X(t)项的作用就象是恢复或阻尼力,要把系统推回到已假设为零的平衡或中间位置。只要-a0x(t)项占支配地位,响应将停留在中间位置左右,并围绕中间位置波动。
当a0值变小时,随机项Z(t)开始支配变化率X´(t)。噪声Z(t)的符号可能为正或为负,从而可能产生的变化率以随机方式接近或者远离平衡位置。当 -a0接近于零时,则如式(7)所示,变化率完全由随机项Z(t)支配,从而产生一随机走动,其响应可能长时间偏离平衡位置。式(7)表明,X(t)的导数是随机的。而其采样表达式(2)(即 Xt=at)表明,在间隔相等的两次观测之间的差别是随机的。比较式(8a)和(8b)及其后的离散时间随机走动公式清楚地显示了连续和离散过程之间的关系。
为了例示极限情况,试研究IBM股票价格序列。前文曾为此序列拟合了一个ø =0.999和=52.61的AR(1)模型。由于参数ø为正值,此AR(1)模型也将是一个采样系统模型,所以可由下式求得A(1)模型的参数。如取一天的采样间隔作为时间单位,因而有Δ=1,则
a0=-(ln ø /△)=-Ln(0.999)=0.001
=(2ao )/( 1- ø
这样,IBM股价(减去 —— 即股价序列的平均值之后)的A(1)模型为:
这个例子说明了前文所讨论的:当aO→0时随机走动的极限情况。上述A(1)模型也可近似表为:
或
这是一个连续时间随机走动,而作为股价基础的连续时间过程是一种巴奇莱尔一维纳过程。
二 阶 模 型
令
其中D为微分算子,(10)式表示一个自由度的振动系统受到扰动力函数f(t)作用后的受迫振动。
引入扰动力函数Z(t),可得A(2)系统的方程为
Xt-0.9985Xt-1 + 0.00078Xt-2 = at + 0.08742at-1
均值=460.0590±7.2117
考虑置信区间,此模型可表示为: Xt=at
通过计算分析表明,上述离散模型变为一个随机走动模型所必须的条件都得到满足。于是作为基础的A(2)模型为
对于此式有ωn = 0.1265和ζ = 28.26 。
因此,IBM股价将用一高阻尼比28.26和相对较低的恢复力
三、小结
主要参考文献