时间序列分析
主要从这三个方面来展开时间序列分析。
时间序列分析是一个有特色的研究领域,始于金融行业,如股市走势预测、投资风险评估等。后来又渗透到其他领域,在未来市场预测、动态定价、用电量预测、生物医药等方面也有它的一席之地。
数学定义一般是描述一个概念的相对简短、严谨、抽象的语言。按时间序列排序的一组随机变量。
表示随机事件的时间序列,缩写为
在时间序列预测中,每一个数据,也就是我们看到的数值,其实都是一个随机变量的观测值,随机变量服从一定的分布。其实我们看到的值也可以叫做观测值,实际上是时间随机序列的一种实现,或者说是一个例子。我们看到的所有历史数据都是一组随机时间序列的样本。
事实上,我们通过分析来把握这种随机时间序列的本质。
因为我们知道每个点都服从整体分布。只要通过数据得到这些随机时间序列的性质,也就是可以掌握随机变量的出现。其实就是一个数理统计的过程,有点类似机器学习中的生成模型。
实际上,时间序列任务的总体方案已经在上面简要描述过了。
有了总体方案,我们一步一步的按照这些步骤来,然后填写需求,完成时间序列预测。
任务的关键步骤是时间序列分析,那么什么是时间序列分析呢?总之,时间序列分析是对时间序列的统计分析。
那么具体的分析方法有哪些呢?主要有两种,即描述性时间序列分析和统计性时间序列分析。
时间序列分析理论中对平稳性有两种定义。
所谓严格性,是指严格性和平稳性的所有统计性质不随时间变化。这是严格平稳的性质,也是严格平稳的定义。
以后可以尝试用数学语言描述一些概念。
也称为协方差平稳、二阶平稳或广义平稳,弱平稳时间序列的一阶和二阶矩不随时间变化。
判断时间序列的平稳性有助于后期模型的选择,所以平稳性是时间序列的一个重要性质,可以用来对时间序列进行分类。
我们会讲严格平稳性和弱平稳性的关系。满足严格平稳性的序列具有弱平稳性,但严格平稳性不能覆盖所有的弱平稳性。为什么严格平稳性不能覆盖所有弱平稳性?这是因为柯西分布是严格平稳的时间序列,但是没有二阶矩或一阶矩,所以柯西分布是严格平稳的不满足弱平稳性。
当时间序列是正态分布序列时,正态分布的所有统计性质都由二阶矩描述,弱平稳正态序列也是严格平稳的。
因为实际上大多数时间序列都是弱平稳的,所以今天我们也将重点讨论弱平稳。
如果时间序列的二阶矩是有限的
我们看到,随着时间的变化,时间序列的平均值是一个常数。
方差和均值一样,是常数,方差是二阶矩。
协方差也是二阶矩,不管不同时刻的点是否规则,因为弱平稳协方差或自相关是时间间隔的函数。当时间间隔协方差相等时,间隔不同时对应的协方差不同,当S变化时也会变化。
事实上,我们正在寻找和之间的关系。在这里,我们用s来表示不同的时间间隔,例如。
那么也就是说,弱平稳时间序列的自相关只与时间延迟s有关,与时间的起始位置t无关。
自相关被缩写为只与时间延迟S相关的一元函数,等价于方差。
平稳时间序列的自相关系数也可以简单地写成与时间延迟s有关的一元函数。
如果一个模型产生的时间序列是平稳的,那么这个模型就是平稳的,否则就是非平稳的。
这里有一段话你可以理解。AR、MA和ARMA模型是常用的平稳序列拟合模型,但并不是所有的AR、MA和ARMA模型都是平稳的。
好了,让我们回到线性差分方程。让我们集中讨论差分方程的两个表达式。其中,我们先说说什么是滞后算子。
假设已知时间序列之和具有以下关系。
其实我们不用y来表示是,而是用b来表示程序中的滞后,以此类推。
因此多项式由滞后算子表示。
典型的P阶线性差分方程为
今天主要讲一些时间序列的推导公式。之前看了一些资料,时间序列中常用的AR模型和MA模型背后的推导比较深,不太好理解。最近看了一些资料,总结的很恰当。
虽然时间序列很简单,但要真正理解它并将其分解为以下几种形式还是需要一些努力的。
这些项用加法模型表示为时间序列,其中趋势项和季节项我们可以用模型拟合,因为它们有规律可循,我们需要用模型来学习。
GPD是一个趋势模型,它随时间呈指数增长。
超市的人流量是周期性的,周末的周人流量比周一到周五多。每天下午的人比早上的人多。
那就意味着我们是对的。我们以前已经讨论过,时间序列是一个随机过程,即联合分布。通常,我们研究的联合分布是一个相对重复的问题。
这是最早的NPL分析之一,当我们在统计模型中时,它使用链规则来表达联合概率。
学过的几乎都知道条件概率,时间序列每个时刻的随机变量都和他之前的随机时间点的概率有关。这就是联合概率,计算这个联合概率需要相当大的计算量。
当a小于1时,表示模型稳定,否则表示模型不稳定。为什么会有这样的结论?我们可以结合球的落地原理来解决这个问题。
事实上,我们的非齐次差分方程
下面是差分方程一般解。
其中,b也是滞后算子L,这里用b表示。这里再演示一遍。
接下来计算特征解,提取左侧。
可以表示无穷变量的和形式,大家应该都很熟悉,也差不多,所以我们用几何级数的和来代替。
关键的相关性研究和可计算性。AR序列的相关性为负指数衰减,MA(q)模型为有限相关。
有限时间序列相关性
根据最小均方误差原则进行预测。
也就是我们讨论的AR模型,那么AR模型可以用于时间序列分析。
这样,时间序列的分布就符合同步距,这样时间序列就是稳定的时间序列。线性过滤器
这是另一个研究时间序列的模型,通过频域来研究。