北极星

搜索历史清空

  • 水处理
您的位置:电力配售电售电服务评论正文

基于灰度算法的中长期电量预测方法

2020-06-23 08:49来源:朗新研究院作者:赵志磊关键词:电力市场改革全社会用电量电力需求侧管理收藏点赞

投稿

我要投稿

导语

近年来,随着大数据与人工智能技术快速发展及深入应用,电网企业不断探索中长期电量预测业务,以期进一步提升在电网规划、负荷控制及需求侧管理等方面的科学决策水平。本文围绕中长期电量预测长期困扰的准确性难题,基于灰度算法,从原始月度电量数据着手,对中长期电量预测展开探究与论证,提出解决思路与方法,结果表明,与一般常用的方法相比,在模型运行效率与预测精度方面有着较为明显的提升。

(来源:微信公众号“朗新研究院”ID:Longshine-R 作者:赵志磊)

01

背景

中长期电量预测是电网调峰及电力需求侧管理等工作的基础,在电力市场改革持续推进、电力企业不断深入发展的背景下,开展中长期电量预测工作,能够为电网企业合理制订电网规划、优化客户用电、提高线损管理智能化与精益化水平提供辅助决策支撑。

不同于短期预测,中长期电量预测由于预测周期较长、模型结果受中间异常数据干扰较大,从而导致很多模型预测效果不够理想。

02

数据特点分析

以某网省全社会用电量为例,时间跨度:2008年1月-2019年2月。

(1)全社会用电量整体趋势

5.png

图1 用电量趋势图

(2)历年每月全社会用电量趋势

6.png

图2 历年月用电量趋势图

观察历年用电量数据,每年2月份是用电的最低谷,每年的7、8月份是用电的高峰期,历年每月用电量的波动规律大致相同。

03

中长期电量预测现状

目前,中长期电量的预测应用相对比较成熟,通过查阅相关文献,基于某网省全社会用电量历史数据分别使用神经网络、随机森林、ARIMA时间序列算法对未来18期电量进行预测,对比运行效率和误差。

7.jpg

表1 不同算法运行效率和误差比对

从结果可以看出,由于算法内部计算逻辑复杂程度较高,导致模型运行效率较低,并且三种模型的预测精度尚未达到最优状态。

由于灰度算法计算工作量小,模型运行速度快,同时能够淡化误差累积的影响,预测精度高,下文基于灰度算法展开中长期电量预测的探究与论证。

04

灰度算法预测模型探究

用一阶线性微分方程GM(1,1)模型的解,来逼近数据呈现的规律,以2015年12月之前的数据为训练集,2016年1月至2017年6月的数据为测试集,进行了模型构建。

8.png

图3 模型整体构建思路

灰度算法模型验证含月度预测模型、年度预测模型、季节调整后的预测模型、马尔科夫残差修正、多模型稳定性验证、模型参数确认与优化,最终找出最优的预测模型及其参数。

9.png

图4 灰度算法模型验证

(1)原数据GM(1,1)模型月度预测

对2015年12月之前的月度用电量数据,从静态、动态两种维度使用灰度模型进行训练得到灰度模型参数,预测2016年1月到2017年6月间的用电量,输出了不同长度训练集下结果。

10.jpg

表2 gm(1,1)月度预测模型级比检验和误差结果

级比检验是通过原数据序列计算出级比值,判断该级比值是否落在合理区间内进而确定该序列数据能否用来做灰度预测建模。

无论训练样本的数量是多少期,参数公式均不能通过级比检验,模型的可行性不充分;静态预测下MAPE属于波动状态,16期总体误差最小时对应训练样本为15期时,滚动预测在训练样本为8期时误差最小。(注释:MAPE(平均绝对百分比误差)=sum(|y*-y|*100 / y)/n,其中n是样本量,y是实际值,y*是预测值)

分别以静态15期训练样本和动态8期训练样本为例,测试18期的真实值和预测值。

11.png

图5 静态、动态18期预测值与真实值对比

静态15期预测和动态8期预测的结果相差不多;真实值的变动趋势是波动的(非单调的),静态15期预测值的结果是一直单调增加的,动态8期预测结果在模型中含有真实训练数据时呈现波动状态,之后一直单调增加;从短时期(如半年)来看,静态15期预测结果更优。

上述第二个结论与GM(1,1)模型有关,该模型假定为序列的累计趋势为指数增长,即累计用电量为时间的指数函数,但观测发现,二者的关系更倾向于线性正相关,由于指数函数的关系,未考虑到季节影响及政策影响等,故有些月份的偏差异常大。

结论:由于原数据是基于累计序列指数分布进行的静态和动态GM(1,1)模型不能通过级比检验,且未考虑到季节因素的影响,故该方法得到的模型效果误差较大。

(2)年度数据GM(1,1)模型

原数据GM(1,1)月度预测由于时间周期的存在导致不能通过级比检验且预测曲线拟合不贴近,思路调整为预测年的全社会总用电量,再利用同样本周期下各月历史同期的用电占比作为权重,最终获得各个月份的预测值。

1.年度预测

在预测年度用电量时,同样采用静态预测和滚动预测两种方式,二者均通过级比检验:

12.jpg

表3 gm(1,1)年度预测模型级比检验和误差结果

在进行年度预测的时候,没有季节因素,从整体上看,可以通过级比检验进行灰度预测;静态预测和动态预测结果有偏差,静态预测在训练样本为7年时最优,滚动预测的误差基本随着训练样本的增加越来越小,最小为3.82%;综合而言,静态预测以7年进行预测效果最好,预测误差为3.68%。

2.训练样本为7年时进行月度预测

针对训练样本为7年时进行18期预测结果进行具体分析:

13.png

图6 静态、动态18期预测值与真实值对比

真实值与预测值均具备周期性,二者均不单调;由于是预测年度再按照月份占比进行计算,因此第一年静态预测和滚动预测效果相同,而后产生偏差;

按照年度计算2年的预测总偏差,前两年为0.83%左右;该方法路径适用,误差较小,在实际应用过程中,中期预测更有价值。

3.季度调整后的GM(1,1)模型

原始数据是月度数据,具有季节周期性规律,引入季节调整思想,对原始月度数据做季节调整,再进行GM(1,1)模型预测,最后通过季节调整因子返回原值。

其中,季节调整因子以训练样本最近的日期前推5个自然年后计算各月用电量占比,参考文献1中季节调整的做法:

①计算多年同期(月)的平均用电量;

②计算所有月份的平均用电量,即总平均用电量;

③将各期平均用电量除以总平均用电量得到各期的季节指数;

④最后将月度用电量数据序列除以对应月份的季节指数,得到季节指数修正的月度用电量序列。

该预测同样分为静态预测和滚动预测:

14.jpg

表4 季节调整后gm(1,1)预测模型级比检验和误差结果

静态预测和滚动预测在周期48个月之前均能通过级比检验,而后不能;季节调整后的GM(1,1)模型,静态预测效果整体比滚动预测的效果更好;

静态预测在训练样本为18期时,预测的误差最小为3.28%;

滚动预测的效果在训练样本为24期时效果最好,误差为 3.38%;灰度预测的时间周期并不是越长越好。

分别观测静态18期预测和滚动24期预测的结果:

15.png

图7 静态、动态18期预测值与真实值对比

经过季节调整后对数据进行预测,真实值和还原的预测值均是波动的;静态预测的18期误差逐渐增加,但差别不大;

滚动预测的误差则体现出前期小后期大的现象,这与反复训练模型,导致快速指数增长有关系;通过季节调整后的GM(1,1)模型比前述章节的模型更加贴合真实水平,误差更小;同时,静态18预测得出更优的结果。

4.基于马尔科夫法的残差修正

由于模型在训练过程中会形成参数,为了进一步优化、提升模型的结果,将训练集得到的残差序列取绝对值后再次进行灰度预测得出18期的预测残差,并通过马尔科夫链的方式预测残差的正负方向,从而得出残差预测结果,进而将前述得到的预测结果与残差预测结果结合,以达到更为准确的预测效果。

对于残差修正而言,只有静态预测能够得到训练样本的唯一误差样本;而滚动预测的误差样本版本较多,不适宜进行误差修正。

本次残差修正针对季节调整后的GM(1,1)模型训练结果,其中最优的静态18期训练样本基础进行研究。

结论:将误差与原预测结果相加获取最新的预测结果后,18期MAPE为6.01%,比原预测结果3.28%和3.38%相比,结果变差。

结果表明该模型存在的主要问题为:马尔科夫的残差的结果受最后一期训练样本的影响,模型的稳定性差;其次,该修正并不能改善原有结果,反而使效果更差。季节调整后的静态18期训练预测获得最优结果,但是残差预测并无帮助。

5.多模型稳定性验证

变换训练模型为2016年2月及之前的用电量,预测2016年3月-2017年8月,进而进行效果评优。

原数据月度预测稳定性评估

训练数据调整后,无论训练样本的期数与静态/滚动模型,模型均不能通过级比检验,月度预测结果和最初走势一致,随着日期推移,最优训练样本数量也会改变,模型稳定性差,最终无法确认最好的训练样本数量。

年度数据预测稳定性评估

对于月占比的计算,以近N年(自然年)进行计算(由于原年度预测模型采用7年数据,为了方便对比,此处N=7),模型均可以通过级比检验:

静态预测在训练样本7年时MAPE为3.70%(原为3.68%)

滚动预测在训练样本7年时MAPE为3.85%(原为3.82%)

由此可见,该模型在时间周期改变时,模型依然相对稳定,且静态预测取得效果更好。

季度调整后的月度数据预测稳定性评估

训练数据调整后,静态/滚动模型训练样本超过19期后不能通过级比检验(原47期);静态预测在训练21期最优,MAPE为4.404%(原来为18期3.28%);

滚动预测在训练27期最优,MAPE为4.95%(原来为24期3.38%)。随着日期推移,最优训练样本数量也会改变,模型稳定性差,同时取得的最优训练样本数量不再能通过级比检验,故无法确认最好的训练样本数量。

6.模型参数确认及优化

通过稳定性对比,在模型参数选择上,选择静态年度预测乘以月占比以获得18个月的预测值。但月占比的时间窗口与训练样本年数根据训练结果进一步验证为7年和8年的情况。

16.jpg

表5 季节调整后gm(1,1)预测模型级比检验和误差结果

1月占比时间窗口选择

月占比采用5年和7年时间窗口计算时误差相差无几,同样的训练样本下,误差大小实际上说明未来3年的用电波动情况跟历史多少年平均情况更为相似,在实际部署过程中采用5年。

①用多年数据排除单一年度的异常值;

②考虑政策、结构等的变动影响,周期不宜过长,以5年历史周期较为合适。

训练样本年数选择

在不同的训练样本和测试样本下,训练样本周期为7年和8年的误差存在差异,从误差更小倾向性而言无法确定哪个最优。

但考虑到样本量较大时模型较稳定的问题,实际中更倾向于选择8年历史周期进行预测。

05

结语

本文研究对象为中长期电量预测,和传统算法对比,该算法在精度与效率方面均有更好表现,且电力数据真实、完整,目前已在某网省进行了电量预测应用。该算法主要基于时序数据进行预测,在更长预测周期且含较大噪音数据情况下,如何保证预测效果需要进一步探索。

【赵志磊|朗新科技集团 管理分析业务部】

【参考文献】

1、月度用电量灰色预测改进模型[J]. 詹卫许,钱淑钗,印鉴. 南方电网技.术. 2012(05)

原标题:【电力大数据】基于灰度算法的中长期电量预测方法
投稿与新闻线索:陈女士 微信/手机:13693626116 邮箱:chenchen#bjxmail.com(请将#改成@)

特别声明:北极星转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。

凡来源注明北极星*网的内容为北极星原创,转载需获授权。

电力市场改革查看更多>全社会用电量查看更多>电力需求侧管理查看更多>