时间序列分析

我们用机器学习模型来学习历史数据的拟合,从而预测未来。这种分享主要是基于传统。

主要从这三个方面来展开时间序列分析。

时间序列分析是一个有特色的研究领域,始于金融行业,如股市走势预测、投资风险评估等。后来又渗透到其他领域,在未来市场预测、动态定价、用电量预测、生物医药等方面也有它的一席之地。

数学定义一般是描述一个概念的相对简短、严谨、抽象的语言。按时间序列排序的一组随机变量。

表示随机事件的时间序列,缩写为

在时间序列预测中,每一个数据,也就是我们看到的数值,其实都是一个随机变量的观测值,随机变量服从一定的分布。其实我们看到的值也可以叫做观测值,实际上是时间随机序列的一种实现,或者说是一个例子。我们看到的所有历史数据都是一组随机时间序列的样本。

事实上,我们通过分析来把握这种随机时间序列的本质。

因为我们知道每个点都服从整体分布。只要通过数据得到这些随机时间序列的性质,也就是可以掌握随机变量的出现。其实就是一个数理统计的过程,有点类似机器学习中的生成模型。

实际上,时间序列任务的总体方案已经在上面简要描述过了。

有了总体方案,我们一步一步的按照这些步骤来,然后填写需求,完成时间序列预测。

任务的关键步骤是时间序列分析,那么什么是时间序列分析呢?总之,时间序列分析是对时间序列的统计分析。

那么具体的分析方法有哪些呢?主要有两种,即描述性时间序列分析和统计性时间序列分析。

时间序列分析理论中对平稳性有两种定义。

所谓严格性,是指严格性和平稳性的所有统计性质不随时间变化。这是严格平稳的性质,也是严格平稳的定义。

以后可以尝试用数学语言描述一些概念。

也称为协方差平稳、二阶平稳或广义平稳,弱平稳时间序列的一阶和二阶矩不随时间变化。

判断时间序列的平稳性有助于后期模型的选择,所以平稳性是时间序列的一个重要性质,可以用来对时间序列进行分类。

我们会讲严格平稳性和弱平稳性的关系。满足严格平稳性的序列具有弱平稳性,但严格平稳性不能覆盖所有的弱平稳性。为什么严格平稳性不能覆盖所有弱平稳性?这是因为柯西分布是严格平稳的时间序列,但是没有二阶矩或一阶矩,所以柯西分布是严格平稳的不满足弱平稳性。

当时间序列是正态分布序列时,正态分布的所有统计性质都由二阶矩描述,弱平稳正态序列也是严格平稳的。

因为实际上大多数时间序列都是弱平稳的,所以今天我们也将重点讨论弱平稳。

如果时间序列的二阶矩是有限的

我们看到,随着时间的变化,时间序列的平均值是一个常数。

方差和均值一样,是常数,方差是二阶矩。

协方差也是二阶矩,不管不同时刻的点是否规则,因为弱平稳协方差或自相关是时间间隔的函数。当时间间隔协方差相等时,间隔不同时对应的协方差不同,当S变化时也会变化。

事实上,我们正在寻找和之间的关系。在这里,我们用s来表示不同的时间间隔,例如。

那么也就是说,弱平稳时间序列的自相关只与时间延迟s有关,与时间的起始位置t无关。

自相关被缩写为只与时间延迟S相关的一元函数,等价于方差。

平稳时间序列的自相关系数也可以简单地写成与时间延迟s有关的一元函数。

如果一个模型产生的时间序列是平稳的,那么这个模型就是平稳的,否则就是非平稳的。

这里有一段话你可以理解。AR、MA和ARMA模型是常用的平稳序列拟合模型,但并不是所有的AR、MA和ARMA模型都是平稳的。

好了,让我们回到线性差分方程。让我们集中讨论差分方程的两个表达式。其中,我们先说说什么是滞后算子。

假设已知时间序列之和具有以下关系。

其实我们不用y来表示是,而是用b来表示程序中的滞后,以此类推。

因此多项式由滞后算子表示。

典型的P阶线性差分方程为

今天主要讲一些时间序列的推导公式。之前看了一些资料,时间序列中常用的AR模型和MA模型背后的推导比较深,不太好理解。最近看了一些资料,总结的很恰当。

虽然时间序列很简单,但要真正理解它并将其分解为以下几种形式还是需要一些努力的。

这些项用加法模型表示为时间序列,其中趋势项和季节项我们可以用模型拟合,因为它们有规律可循,我们需要用模型来学习。

GPD是一个趋势模型,它随时间呈指数增长。

超市的人流量是周期性的,周末的周人流量比周一到周五多。每天下午的人比早上的人多。

那就意味着我们是对的。我们以前已经讨论过,时间序列是一个随机过程,即联合分布。通常,我们研究的联合分布是一个相对重复的问题。

这是最早的NPL分析之一,当我们在统计模型中时,它使用链规则来表达联合概率。

学过的几乎都知道条件概率,时间序列每个时刻的随机变量都和他之前的随机时间点的概率有关。这就是联合概率,计算这个联合概率需要相当大的计算量。

当a小于1时,表示模型稳定,否则表示模型不稳定。为什么会有这样的结论?我们可以结合球的落地原理来解决这个问题。

事实上,我们的非齐次差分方程

下面是差分方程一般解。

其中,b也是滞后算子L,这里用b表示。这里再演示一遍。

接下来计算特征解,提取左侧。

可以表示无穷变量的和形式,大家应该都很熟悉,也差不多,所以我们用几何级数的和来代替。

关键的相关性研究和可计算性。AR序列的相关性为负指数衰减,MA(q)模型为有限相关。

有限时间序列相关性

根据最小均方误差原则进行预测。

也就是我们讨论的AR模型,那么AR模型可以用于时间序列分析。

这样,时间序列的分布就符合同步距,这样时间序列就是稳定的时间序列。线性过滤器

这是另一个研究时间序列的模型,通过频域来研究。