时间序列为什么需要平稳性
⑴ 时间序列模型拟合时为什么要先进行序列的平稳性检验
楼主提取趋势的原因是想让趋势序列平稳化吧?你说要提取时间序列的周期,那就说明去趋势序列还含有周期变动,这样的话它肯定就不是白噪声序列了。如果这样,则首先要对提取趋势后的序列做单位根检验,检验提取趋势后的序列是否平稳。单位根检验的步骤为(eviews):打开序列,点击view,unit root test ,使用默认选项即可,看输出的P-value,H0为:序列有单位根(不平稳),H1为:没有单位根(平稳)。根据P值做出判断。若去趋势序列平稳了,那就可以对平稳序列建模了,例如ARMA模型,存在周期的话也可以用周期函数拟合,或者使用季节差分的ARMA模型。当这些都完成后,再应该对残差序列做白噪声检验,通过白噪声检验就说明建模完成。白噪声检验的步骤为:打开resid序列,view,correlogram,差分阶数选择level,确定,看q统计量的伴随p值是不是很大就行了。
⑵ 如何深入理解时间序列分析中的平稳性
声明:本文中所有引用部分,如非特别说明,皆引自Time Series Analysis with Applications in R.
接触时间序列分析才半年,尽力回答。如果回答有误,欢迎指出。
对第一个问题,我们把它拆分成以下两个问题:
Why stationary?(为何要平稳?)
Why weak stationary?(为何弱平稳?)
Why stationary?(为何要平稳?)
每一个统计学问题,我们都需要对其先做一些基本假设。如在一元线性回归中(),我们要假设:①不相关且非随机(是固定值或当做已知)②独立同分布服从正态分布(均值为0,方差恒定)。
在时间序列分析中,我们考虑了很多合理且可以简化问题的假设。而其中最重要的假设就是平稳。
The basic idea of stationarity is that the probability laws that govern the behavior of the process do not change over time.
平稳的基本思想是:时间序列的行为并不随时间改变。
正因此,我们定义了两种平稳:
Strict stationarity: A time series {} is said to be strictly stationary if the joint distribution of ,, · · ·, is the same as that of,, · · · ,for all choices of natural number n, all choices of time points ,, · · · , and all choices of time lag k.
强平稳过程:对于所有可能的n,所有可能的,, · · · , 和所有可能的k,当,, · · ·,的联合分布与,, · · · ,相同时,我们称其强平稳。
Weak stationarity: A time series {} is said to be weakly (second-order, or co-variance) stationary if:
① the mean function is constant over time, and
② γ(t, t − k) = γ(0, k) for all times t and lags k.
弱平稳过程:当①均值函数是常数函数且②协方差函数仅与时间差相关,我们才称其为弱平稳。
此时我们转到第二个问题:Why weak stationary?(为何弱平稳?)
我们先来说说两种平稳的差别:
两种平稳过程并没有包含关系,即弱平稳不一定是强平稳,强平稳也不一定是弱平稳。
一方面,虽然看上去强平稳的要求好像比弱平稳强,但强平稳并不一定是弱平稳,因为其矩不一定存在。
例子:{}独立服从柯西分布。{}是强平稳,但由于柯西分布期望与方差不存在,所以不是弱平稳。(之所以不存在是因为其并非绝对可积。)
另一方面,弱平稳也不一定是强平稳,因为二阶矩性质并不能确定分布的性质。
例子:,,互相独立。这是弱平稳却不是强平稳。
知道了这些造成差别的根本原因后,我们也可以写出两者的一些联系:
一阶矩和二阶矩存在时,强平稳过程是弱平稳过程。(条件可简化为二阶矩存在,因为)
当联合分布服从多元正态分布时,两平稳过程等价。(多元正态分布的二阶矩可确定分布性质)
而为什么用弱平稳而非强平稳,主要原因是:强平稳条件太强,无论是从理论上还是实际上。
理论上,证明一个时间序列是强平稳的一般很难。正如定义所说,我们要比较,对于所有可能的n,所有可能的,, · · · , 和所有可能的k,当,, · · ·,的联合分布与,, · · · ,相同。当分布很复杂的时候,不仅很难比较所有可能性,也可能很难写出其联合分布函数。
实际上,对于数据,我们也只能估算出它们均值和二阶矩,我们没法知道它们的分布。所以我们在以后的模型构建和预测上都是在用ACF,这些性质都和弱项和性质有关。而且,教我时间序列教授说过:"General linear process(weak stationarity, linearity, causality) covers about 10% of the real data." ,如果考虑的是强平稳,我觉得可能连5%都没有了。
对第二个问题:
教授有天在审本科毕业论文,看到一个写金融的,用平稳时间序列去估计股票走势(真不知这老兄怎么想的)。当时教授就说:“金融领域很多东西之所以难以估计,就是因为其经常突变,根本就不是平稳的。”
果不其然,论文最后实践阶段,对于股票选择的正确率在40%。连期望50%都不到(任意一点以后要么涨要么跌)。
暑假里自己用了一些时间序列的方法企图开发程序性交易程序。
刚开始收益率还好,越往后就越...后面直接亏损了...(软件是金字塔,第二列是利润率)
亏损的图当时没截,现在也没法补了,程序都删了。
所以应该和平稳没关系吧,毕竟我的做法也没假设是平稳的。如果平稳我就不会之后不盈利了。
(吐槽)自己果然不适合做股票、期货什么的...太高端理解不能...
⑶ 时间序列的平稳性检验的目的是什么
一阶差分平稳说明可以用一阶差分序列进行分析,采用ARMA模型。
为了确定没有随机趋势或确定趋势,否则将会产生“伪回归”问题。伪回归是说,有时数据的高度相关仅仅是因为二者同时随时间有向上或向下的变动趋势,并没有真正联系。这样数据中的趋势项,季节项等无法消除,从而在残差分析中无法准确进行分析。
时间序列
时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。时间序列分析的主要目的是根据已有的历史数据对未来进行预测。
构成要素:长期趋势,季节变动,循环变动,不规则变动。
长期趋势(T)现象在较长时期内受某种根本性因素作用而形成的总的变动趋势。
季节变动(S)现象在一年内随着季节的变化而发生的有规律的周期性变动。
⑷ 时间序列数据回归必须要做平稳性检验吗
一般时间序列数据是需要做单位根检验的(也就是平稳性检验),因为如果数据不平稳,做出来的可能是伪回归。如果X是严格外生的,则用不到OLSE的渐进性质,平稳与否无关紧要;
如果如果X不是严格外生的,则用到OLSE的渐进性质,大数定律和中心极限定理以平稳性(相当于横截面数据的同分布)为条件,故要求进行平稳性检验,否则可能出现虚假回归。