趋势回归方法

趋势回归分析是用统计方法确定两个或多个变量之间数量关系的统计分析方法。回归分析的目的是通过已知值的输入和输出变量,找到一个链接输入变量和输出变量的最优模型。更确切地说,回归分析是试图从实际数据中寻找某种规律性的方法,建立并分析某一响应Y(因变量)与某一重要因素X(自变量)之间的函数关系。趋势回归分析可分为线性回归和非线性回归。在最简单的情况下,回归采用线性回归的标准统计技术,线性回归的理论已经完善。但现实世界中的大多数问题都无法用简单的线性回归来分析,只能用非线性回归。管道能效的变化非常复杂,无法用简单的线性关系来表示,因此选择非线性回归方法来分析管道能耗的趋势。

非线性回归可分为已知曲线(方程)型和未知曲线(方程)型两种情况。这两种情况需要用不同的方式解决。一般来说,如果知道曲线类型,回归效果会更有保证;同时,在大多数情况下,我们对所研究的对象有一定的了解,可以根据理论或经验给出可能的曲线类型,所以常用已知曲线类型的回归。确定曲线类型的方法主要包括:

1)从专业知识判断。这些公式要么来自一些理论推导,要么来自经验公式。

2)如果没有足够的专业知识来判断变量之间是一种什么样的关系,可以用散点图的方法来判断。

确定曲线类型后,回归的任务就变成了确定曲线公式中的参数。这时常用的回归分析方法有曲线拟合等。回归方程和回归系数也要检验。来检验得到的结果是否反映了x和y的真实关系,比较常用的标准有两个。

1)误差平方和:

其中:yi为实际值;Yi是预测的目标值。

转换前必须用原始数据计算误差平方和。显然,残差平方和越小,回归效果越好。但由于随机误差的影响,不能无限减小,统计检验的阈值也无法确定,因此更适合比较几种不同变换方法的优劣。

2)相关指数:

哪里:;y是实际值的平均值。

相关指数能给人更直观的印象,R2越接近1越好。如果接近0甚至变成负数,说明变换公式使用不当。

趋势回归能效评估法主要采用收集整理油气管道的历史能耗数据,利用趋势回归法确定能耗趋势的对比分析,对比分析的结果以图形化的方式显示,从中可以直观地看到各管道的历史能耗趋势,并对这些能耗数据进行逐月或同比的对比, 并根据输量阶梯进行分析,找出经济运行区间,从而对管道能耗水平做出正确评价。 在此基础上,结合管道的实际工况,分析了能耗变化的主要影响因素。

单变量回归分析模型可分为线性模型、指数模型、多项式模型、对数模型、幂函数模型等。能源消费变化的原因非常复杂,简单的线性关系不能反映能源消费变化的原因。因此,排除线性模型。其他几个模型的图像如图5-2所示。

图5-2回归分析模型图

从以上数学模型来看,指数模型、幂函数模型、对数模型都是单调递增或递减的。但是,管道能耗指标之间的关系不能用简单的增减来表示,影响管道能耗变化的原因很多。能耗指标之间只有小区间的单调关系,而大范围的变化趋势是分段单调的。最适合这个规律的数学模型是多项式模型。多项式模型是管道能耗趋势分析中使用最多的数学模型,其他少数数学模型的相关系数R2不如相同条件下的多项式模型高。因此,能耗分析项目中回归分析的数学模型是多项式模型。回归分析中多项式数学模型的阶数如何选择,需要通过试算来确定,既要考虑回归曲线的相关指标R2值,又要考虑曲线所反映的客观情况。比如生产能耗曲线有负值,就不符合实际情况。

从长输管道(管网)的能耗构成来看,输量的变化对直接用于油气输送的能耗有必然影响,与损耗和辅助能耗(包括辅助生产系统、辅助系统、生产管理等过程的能耗)没有必然联系。考虑到辅助能耗和损耗占生产能耗的比例不大,所以不考虑辅助能耗,只分析管道生产能耗,从管道运行角度分析能耗水平和变化原因。由于不同长输管道(管网)的输送过程差异较大,输送过程中的能耗也有显著差异。即使从管道输送机理分析,也很难直接比较不同管道的能耗。因此,能耗分析应以同一管道的纵向比较为基础,在相同条件下进行分析比较。“相同条件”的含义描述如下。

1)管道物理结构。很明显,不同的长输管道具有不同的物理结构(包括管径、路由方向等。).对于同一条管道,随着能源需求的增加,会对原有管道进行改扩建,如天然气复线管道的建设、管道沿线用户的增加等,都会导致管道物理结构的变化,必然带来工艺输送方案的调整和变化,管道工艺参数、动力设备配置和效率的变化,以及能耗的变化。因此,如果不考虑管道物理结构的变化,很多因素对能耗的影响都会淹没在管道物理结构变化带来的“噪音”中,无法深入分析管道的能耗。因此,对于每个周期的能耗分析,首先要明确管道物理结构的变化信息,确保管道的物理结构在待分析的每个周期内没有发生变化,并考虑新建、改建、扩建管道初始能耗的特殊性。

2)输送流体的差异。管道输送流体的差异对能耗有显著影响。对于天然气管道来说,众所周知,对于富气输送(指输送的天然气富含乙烷、丙烷、丁烷等重组分),由于富气的密度高于常规天然气,因此可以降低其流速,从而减少管道沿线的摩擦损失,提高输送效率;在管道质量流量不变的前提下,提高天然气密度还可以提高气体的可压缩性,降低压缩能耗,提高压缩效率,降低管道能耗。对于原油管道来说,不同区块的原油物性明显不同,粘度不同导致的能耗也明显不同。对于成品油管道来说,油品是分批顺序输送的,油品的物性、输送顺序、输送量都会影响能耗。

3)工艺运输方案的差异。工艺输送方案主要针对液体管道。对于原油管道,主要包括加热输送和加药输送。对于成品油管道,主要是指添加剂的输送。加热输送是指用加热炉加热原油,改善其流动性,降低其粘度,从而减少沿管道的摩擦损失,提高输送效率;由于管道输送中水力和热力的耦合,热力和水力会相互影响。加热输送一方面增加了热耗,但另一方面减少了沿管道的摩擦损失,有助于降低泵组的电耗。在输量不变的情况下,降低了沿管道的压头损失,从而降低了泵机组的功耗。但由于应用经济性的影响,减阻剂不能常年作为大量的减阻或增输手段,而是作为一种短期的、权宜的或特殊的处理手段。在能耗分析过程中,虽然在一定程度上考虑了管道运输经济性,但消耗用量并没有转化为费用,计入整体管道经济性。所以要不要加药剂,要分开讨论。

4)相同的吞吐量或营业额。管道的能耗随着管道吞吐量或周转量的变化而变化。吞吐量反映管道运输负荷,吞吐量越大,负荷率越高。在不同的输量下,管道的能耗是不同的。只有在经济输量的条件下,管道运输的经济性才能得到更好的体现。营业额是运输量和运输距离(输送距离)的反映,是管道输送流体带来的效益。从反映管道负荷的角度来说,吞吐量比营业额更直观。从反映管道收入的角度来看,营业额更合理。

5)同一个季节。在不同的季节,不同的环境温度(包括气温和地温等。)会引起管道输送方案的变化(比如原油管道冬季经常需要加热输送)。因此,在对比分析管道能耗时,还需要附加相同的季节条件,使对比更加明显。在上述相同条件下,通过分析动力设备和管道的工艺参数,进一步分析能耗变化的原因。

能效分析采用趋势回归法,对比分析的主要内容如下:

1)对比期。对比分析周期主要包括周分析、月分析、季分析、年分析四类分析周期,其中周分析只做环比分析,不做同期对比。月度分析、季度分析和年度分析应包括同比和环比分析。

2)对比法。对比方式有横向对比和纵向对比。其中,横向比较是指不同管道之间能耗水平的比较,纵向比较是指同一管道历史能耗数据的比较。根据管道类型,具体如下:①天然气管道。由于管径等基本物性参数不同,不同天然气管道的输气能力差异较大,管道沿线的环境温度也会因线路走向不同而有所差异。另外,目前天然气管道是联网的,通过联络线互相调配天然气。因此,不同天然气管道的横向对比分析意义不大,从管网角度进行分析更为实际。②成品油管道。对于液体管道来说,管径和线路走向不同造成的能耗差异是很明显的。所以不同的产品管道没有可比性。③原油管道。对于原油管道来说,除了管径、走向等基本物性参数的差异外,由于原油本身物性的差异,不同的原油管道不具有可比性。即使是同一条管道,也需要综合考虑运输工艺等方面的差异。因此,考虑到纵向对比对于管道能耗管理更为实用,对比分析将侧重于纵向对比,尽可能在相同条件下对同一管道不同历史时期的能耗数据进行环比和同比对比分析。对于横向比较,由于不同管道之间在基本物性参数、输送工艺、动力设备等方面存在差异,不具有可比性,横向比较分析意义不大,因此横向比较法只考虑单台设备效率和有用功的比较。

3)对比对象。比较对象主要是管道和管网。其中,管道对象包括“比较范围”中描述的十个一级管道。对比分析将侧重于管道,而管网分析将取决于现状。天然气管道已经联网,可以对比分析。但成品油管道不具备管网条件,待兰正昌等后续成品油管道投产后再进行扩建,现阶段不考虑。原油管道不考虑管网形式的对比分析。

4)对比条件。比较分析条件应遵循同季节、同吞吐量的比较原则(即相同条件下的比较)。考虑到原油管道输送过程中由于季节不同,环境温度和地温差异较大,采用的输送工艺也有很大差异。所以不同季节的能耗数据对比意义不大。然而,不同的吞吐量(周转量)也直接影响管道的工艺参数和能耗水平。将不同吞吐量(周转量)下的能耗数据相互比较,在一定程度上不能满足对比分析的需要。因此,比较条件应以季节相同、吞吐量(或营业额)相同为原则。

5)比较基准。一方面要根据输量和输量台阶进行对比分析,另一方面要考虑环境温度和地温对管道能耗的影响。其中,对于成品油管道,不考虑温度的影响,只考虑与相同条件(相同输量)下历史最低能耗的比较。对于原油管道,需要综合考虑地温、输送工艺(如加热、加药)等因素,并与相同条件下(相同季节、相同输送工艺、相同输量)的历史最低能耗进行比较。对于天然气管道,需要考虑气温和压缩机比,并与同等条件下(同季节、同输量、同转供)的历史最低能耗进行比较。

采用趋势回归能效评价方法,通过划分能效等级,可以增加比较的可操作性。

(1)能效等级分类标准

能耗水平分类遵循正态分布原则,分别以生产单耗的平均值、最大值和最小值为基础,将管道能耗水平分为高、高、中、低、低五个等级。分类标准如图5-3所示。

图5-3能耗数据的正态分布

正态分布的概率密度函数为:

其中:x是所述的随机变量;μ是随机变量的均值;σ是随机变量的标准差。

正态分布函数满足“3σ法则”,即正态分布随机变量的值落在[μ-σ,μ+σ]区间内的概率为68.27%;落在[μ-2σ,μ+2σ]范围内的概率为95.45%;落在[μ-3σ,μ+3σ]范围内的概率为99.73%,即几乎可以确定正态随机变量的值落在[μ-3σ,μ+3σ]范围内。

随机变量分布函数参数的估计方法主要有矩估计、极大似然估计和贝叶斯估计。本研究采用矩估计方法计算正态分布的均值μ和标准差σ。对于n个样本x1,x2,…,xn,可使用以下公式计算上述力矩指数:

油气管道的能效管理

分布函数的检验方法主要有正态概率值检验、Pearson x2拟合检验、安德雷·柯尔莫哥洛夫-斯米尔诺夫检验、Shapiro WilkW检验和D'Agostino D检验,其中W检验和D检验均为正态检验,已被定为国家标准。w检验要求样本量n在3到50之间,D检验要求样本量n在50到1000之间。

d检验步骤如下:

试题为:H0,人口服从正态分布;H1,总体不服从正态分布。

观测值按非降序排列:X(1)≤X(2)≤…≤X(n)。

定义统计数据:

油气管道的能效管理

在HO下,d的近似标准化变量为:

油气管道的能效管理

在H0下,y渐近地接近正态分布N(0,1)。因此,当H0成立时,y的值不能太大或太小。因此,对于给定的显著性水平A,当y < Zα/2或y >时,zα/2和z 1-可从统计Y. /2的分位数表中找到;当z1-α/2时,拒绝H0;当zα/2 ≤ y ≤ z1-α/2时,不得拒收Ho。

(2)根据能效偏离指数确定能耗水平。

根据能效偏离指数确定能耗水平,如表5-9所示。

表5-9能耗偏离指数Di

表中:ε为历史生产单耗的拟合平均值,kgce/(107 m3·km);μ为相同条件下生产单耗离散数据的统计平均值,kgce/(107 m3·km);σ为相同条件下生产单耗离散数据的均方差,kgce/(107 m3·km)。

(3)根据能源效率的相对指数确定能源消耗水平。

根据能源效率相对指数确定能源消耗水平,确定原则如表5-10所示。

表5-10能耗相对指数Ri

表中:εmax为历史生产单耗的最大拟合值,kgce/(107 m3·km);εmin为历史生产单耗的最小拟合值,kgce/(107 m3·km);μ为相同条件下生产单耗离散数据的统计平均值,kgce/(107 m3·km);σ为相同条件下生产单耗离散数据的均方差,kgce/(107 m3·km)。

采用趋势回归能效评价法分析能效变化的原因,就是将上述对比分析结果与相应管道(管网)的实际生产运行情况相结合,综合可能影响管道能耗的因素,找出导致能效变化的原因,并将这些原因逐一列出并排序,尽可能找出影响管道能耗的主要因素。原因分析要以每条管道为基础,对每条对比结果进行详细分析,并根据不同管道的实际情况和对比分析的空间和时间范围,正确分析判断可能影响能耗的原因。此外,每条管道的能耗原因分析应考虑其生产寿命。

利用趋势回归能效评价方法进行能效变化分析的主要研究内容如下:

(1)天然气管道

对于管道输送距离长、压气站多、用户大、配气切换复杂的输气管道,分析原因时主要考虑以下因素:①切换能力。即其他管道通过联络线向本管道提供的运输量(运输量和周转量)。②上下游营业额比例。对于相同(或接近)的营业额,需要考虑上下游用户供气量的差异所带来的能耗差异。③吞吐步骤。与管道容量和压缩机比率有关。④压缩机的比例。考虑不同压缩机配比对能耗的影响,包括气驱和电驱的成本差异(如电、油、气标准煤换算系数的变化)。

输气管道生产单耗的变化规律较差,除了开工方案、输量等主要因素外,还有很多其他影响因素,如储存、季节、压比、电驱动和气驱动压缩机的使用率等。目前,天然气管道已经连成一个网络,它们之间的供应转移很复杂。单根管道运行工况的变化可能导致相邻管道运行工况和能耗的变化。而且气体具有很强的可压缩性,变化规律会表现出一定的滞后性,进一步增加了分析的难度。针对以上问题,我们在分析过程中采取了以下措施:①分析措施:尽可能多地考虑影响天然气管道能耗的因素,通过理论计算定量分析某一影响因素对能耗的影响程度,假设其他影响因素不变。详见《能耗水平分析与评价标准研究报告-过程理论分析部分》。②评价措施:评价能耗时,不仅要评价单根管道的能耗水平,还要评价整个天然气管网的能耗水平。

(2)成品油管道

成品油管道能耗的主要影响因素有输量、泵组匹配、调节阀节流、输油比例(如汽柴油比)等。分析原因时,主要考虑以下因素:①吞吐量。考虑报告期内吞吐量与设计吞吐量和经济吞吐量的关系,考虑吞吐量对能耗的影响。②泵机组比例。考虑泵机组的不同组合。③油门情况。调节阀或减压阀的节流情况。④输送油品的汽柴比。考虑不同密度和粘度的油品的输送比。⑤添加剂。主要考虑减阻剂对能耗的影响。

(3)原油管道

原油管道的情况和成品油管道类似,但要考虑的主要因素除了节流、输送油品的差异、泵组和添加剂的匹配外,还要考虑加热和输送工艺对能耗的影响。