多跳D2D组网下基于数据驱动的配电网在线异常检测

【www.zhangdahai.com--其他范文】

张章煌,夏炳森,周钊正

(国网福建省电力有限公司 经济技术研究院,福州 350012)

配电网作为电力网络中直接向用户供电的重要环节,其运行状态直接影响着电力用户的用电质量和用电体验。当前电力用户对供电可靠性的要求随着社会经济的快速发展变得越来越高,而快速高效的异常检测方式是保证供电可靠性的重要手段之一[1-2]。现阶段,随着智能电表的普及以及用电信息采集系统的升级和完善,配电网数据信息急剧增长。因此,如何根据智能电表测量出的参数和用电信息采集系统采集到的信息进行数据分析,实现快速精确的异常配电行为检测是当前电力网络管理中急需解决的关键问题之一。

随着配电网侧数据量的急剧增加,可将配电网数据传输到通信网边缘具有较强计算和存储能力的服务器中进行实时数据分析,实现快速精确的异常配电行为检测[3]。为了达到这一目的,可在配电网和基站间建立多跳D2D网络进行数据传输[4],如图1所示。然而,在多跳D2D网络中,若D2D设备遭遇大量的突发访问、阻断式服务攻击、端口扫描或蠕虫传播,会造成D2D设备的流量异常,而流量异常会对D2D组网的服务性能造成严重影响[5]。因此,实现对多跳D2D网络的流量异常检测是保证D2D设备正常传输数据的重要前提。

图1 多跳D2D组网下基于数据驱动的配电网监测架构Fig.1 Data-driven anomaly detection architecture for power distribution networks under multi-hop D2D networking

机器学习是实现快速异常行为检测的重要方式。针对配电网传统监督机制适应性较差的问题,文献[6]通过分析局部异常因子大小实现对配电网运行状态的智能监测。针对网络数据的高维度特征,LIAO等[7]设计了一种基于主成分分析和模糊分类的基站异常运行检测方法。基于大数据中的质量分析理论,文献[8]提出了采用挖掘分析与统计分析的海量电力信息数据的质量分析方法。ONIRETI等[9]针对可用数据信息量的不同,提出了基于K最近邻和灰度预测这2种不同的异常小区检测方法。然而,上述异常检测方法都需要存储一段时间内的相关测量数据进行离线训练,这种方式不仅检测速度慢且会占用大量的存储空间,同时无法定位异常配电的具体时刻。

为了实现多跳D2D组网下针对配电网络的在线异常检测,本文提出了一种基于一类支持向量机(one-class support vector machine, OCSVM)的配电网运行状态实时检测算法和一种基于双边主成分分析(principle component analysis, PCA)的流量异常实时检测算法,在正常数据和异常数据严重不均衡的情况下快速训练出精确的异常检测模型。

本文的主要工作和创新点可总结如下。首先,本文提出了一种基于OCSVM的在线异常检测算法推断特定区域配电网的工作状态,该算法可根据该区域智能电表上报的测量数据进行模型参数更新,并在每个时间周期判定上报数据的异常情况,从而推断该区域配电网的实时运行状态;
其次,为了实现对多跳D2D网络中流量异常的实时检测,设计了一种双边PCA方法在线分析D2D设备的流量监督数据,从2个主方向检测新到达数据中是否包含异常数据,在降低计算存储成本的同时提高检测精确度;
最后,本文通过仿真验证了基于OCSVM和双边PCA的在线异常检测算法的有效性和鲁棒性。

假设配电网包含K个区域,则第k(1≤k≤K)区域内智能电表的测量数据可表示为Sk=(xkn,ykn),n=1,2,…,Nk,其中,Nk表示采样数据的个数,ykn=+1表示训练数据均是在配电网络处于正常运行状态时采集的。一般情况下,采样数据的分布较为复杂且线性不可分,为了解决这一问题,OCSVM算法使用特征映射函数φ:Rd→Rd′将原始数据从输入空间Rd投影到高维特征空间Rd′,输入空间和高维特征空间均为实数空间。使得投影后的数据在新的空间里是线性可分的[10]。定义φ(xk)为数据xk的特征映射函数,然后利用核函数k(xk1,xk2)计算数据xk1和xk2的特征映射函数的内积。本文使用最常用的高斯核函数,表示为

(1)

基于上述推理,本文将用于k区域内配电网异常检测的问题建立为以下优化目标。

s.t.wTφ(xkn)≥ρk-ξkn,n=1,2,…,Nk

ξkn≥0,n=1,2,…,Nk

(2)

(3)

智能电表上报的测量数据xkn可以根据g(xkn)的结果来判定它的正常与否,若g(xkn)≥0,则判定xkn为正常数据,否则判定其为异常数据。

对于每一个区域的配电网来说,智能电表的测量数据在每个时间周期都会进行更新,若边缘服务器将每个智能电表上报的历史测量数据都存储下来进行离线训练,不仅检测速度较慢,且会占用大量的存储资源。因此,希望服务器能够根据智能电表上报的时间顺序对数据进行实时处理。基于上述分析,本文提出了基于OCSVM的配电网在线异常检测算法。

首先,引入拉格朗日乘子K对问题(2)进行转化,表示为

s.t.ξkn≥0,n=1,2,…,Nq

(4)

离线训练过程要求观测周期内每个智能电表上报的所有测量数据都是可用的,而这会给边缘服务器的存储空间带来巨大负担。鉴于此,本文定义了OCSVM的实时成本函数,具体表示为

s.t.ξk(t)≥0

(5)

(5)式中:t为在线学习的时间点;
xk(t)为智能电表k在时间t上的测量数据;
ξk(t)代表测量数据xk(t)的松弛变量。然而,在(5)式中,φ(xk(t))的值是未知的,在所有采集数据均可用的情况下会直接计算k(xk(l),xk(m))=〈φ(xk(l)),φ(xk(m))〉∀timel,m,而不是φ(xk(t))。为了实现OCSVM算法的在线学习,本文选择采用随机近似的方法通过z(xk(t))来近似φ(xk(t))[11]。

在随机近似方法中,首先使用随机近似函数z:Rd→RD将输入数据投影到随机特征空间,其中,D是随机特征空间的维度,其值满足D>d。基于该方法,φ(xk(t))可使用z(xk(t))来近似表示。定义z(xk(t))=[zω1(xk(t)) ,… ,zωD(xk(t))]T,其中,zωi(xk(t))代表实值映射函数,表示为

i=1,2,…,D

(6)

(6)式中:ϑi服从[0,2π]上的均匀分布;
ωi的值则会从高斯核函数的傅里叶变换p(ω)=(2π)-(D/2)e-[‖ω‖2/2]中获取[11]。

将φ(xk(t))用z(xk(t))近似后,OCSVM的在线成本函数的最终表示形式为

s.t.ξk(t)≥0

(7)

(7)式中,zk(t)=[zω1(xk(t)),…,zωD(xk(t))]T,其中,xk(t)为智能电表k在时间t上的测量数据。

此时可以使用随机梯度下降方法求解问题(7)。该方法不仅可以在节省存储资源的同时继承网络的历史信息,还可以充分使用新上报的测量数据进行参数更新,更新方法如下

wk(t+1)=wk(t)-α1(t)∇wkfk(t)

(8a)

ρk(t+1)=ρk(t)-α2(t)∇ρkfk(t)

(8b)

ξk(t+1)=(ξk(t)-α3(t)∇ξkfk(t))+

(8c)

(9a)

(9b)

(9c)

基于OCSVM的配电网在线异常检测算法的详细步骤如下。

初始化:总时间周期T,随机特征空间维度D,随机初始化参数值wk(t),ρk(t)和ξk(t)。

1)fort=0,1,2,…,Tdo

2)智能电表k上报新的测量数据xk(t),计算φ(xk(t))的近似值zk(t)

3)分别使用(9a),(9b)和(9c)计算∇wkfk(t),∇ρkfk(t)和∇ξkfk(t)

4)分别使用(8a),(8b)和(8c)计算wk(t),ρk(t)和ξk(t)

5)计算判别式:g(xk(t))=sgn(wkT(t)·zk(t)-ρ(t))

6)ifg(xk(t))==1 then

7)判定区域k内的配电网处于正常工作状态,更新参数wk(t),ρk(t)和ξk(t)

8) else

9)判定区域k内的配电网的工作状态出现异常,保留t-1时刻参数值,丢弃当前值;

10) end for

因离线训练算法需要采集大量的测量数据才能取得较好的检测性能,而基于OCSVM的在线异常算法可以在每个时间周期上进行判定并丢弃异常参数以避免其可能带来的负面影响,因此,本文提出的在线异常检测算法可在节约存储空间的同时保持较高的检测水平。

在多跳D2D网络中,若D2D设备遭遇大量的突发访问、阻断式服务攻击、端口扫描或蠕虫传播,D2D设备会出现流量异常,而流量异常会对D2D组网的服务性能造成严重影响。因此,实现对多跳D2D网络的流量异常检测是保证D2D设备正常传输数据的重要前提。

现有的流量异常检测模型通常会将一个时隙内的流量监督数据建模为一个矢量,并使用一个矩阵来记录一段时间内的流量监督数据。基于这些观测数据,现有研究通常将观测流量数据划分为正常数据矩阵和异常稀疏矩阵2部分来检测异常。基于数据划分的异常检测技术包括PCA[12]、 kernel-PCA[13]、因子分解[14]等方法。但上述基于离线学习的异常检测方法需要存储一段时间内的监督数据,不仅存储和计算成本较高,而且会破坏异常的实时检测。

假设多跳D2D网络中包含N个D2D设备,定义At∈RN×N表示时间周期t上的监督数据,其中,第(ij)项At(ij)表示从设备i到设备j的监督数据,RN×N表示监督数据均为实数。在线数据分析示意图如图2所示,监督数据集{A1,A2,…,Ak,…,At}形成了一个张量,其中每一层Ak∈RN×N,1≤k≤t表示一个时间周期上的监督数据。给定已经收集到的t个时间周期的监督数据A1,A2,…,At,为了实现对多跳D2D网络的实时异常检测,需要快速精确地检测出新收集的数据At+1是否为异常数据。

图2 在线数据分析示意图Fig.2 Online data analysis diagram

给定数据统计集合A={A1,A2,…,At},对数据集进行数据集中化处理得到

{B1,B2,…,Bt}

(10)

(11)

(11)式中,‖·‖F为矩阵的Frobenius范数。

根据文献[15]可知,上述目标等价于以下问题

(12)

(13)

因此,可使用迭代方法计算投影矩阵U和V,直到2次迭代之间U和V的变化量均小于设定门限值为止。

因为迭代过程所需计算量较大且花费时间较长,所以为了提高检测效率,本文采用一种近似算法以快速得到投影矩阵。

(14)

异常检测原理:为了检测时间t+1上收集的数据是否为异常数据,需要检查行主成分和列主成分是否有较大的方向变化。为了同时利用2个方向变化,本文提出使用2个连续时隙t和t+1上的联合投影矩阵Mt=[Ut,Vt],Mt+1=[Ut+1,Vt+1],定义度量标准

(15)

来判断新到达的监督数据对主方向的影响。

(15)式中,Vec(A)表示对矩阵A进行矢量化。越小的Cosine值对应越大的方向变化。基于双边PCA的多跳D2D网络在线流量异常检测算法的详细步骤如下。

输出:At+1是否为异常数据。

2)初始化l=1,r=1;

5)l=l+1;

6)end while

7)将前l个特征值对应的l个特征矢量组成行投影矩阵Vt;

9)r=r+1;

10) end while

11)将前r个特征值对应的r个特征矢量组成列投影矩阵Ut;

12)构建联合投影矩阵Mt=[Ut,Vt],Mt+1=[Ut+1,Vt+1]

13)根据(15)式计算cosine的值

14) If cosine≥scorethen

15) 判定At+1为正常数据

16) else

17) 判定At+1为异常数据

本文选用某小区低压配电网络的用电数据进行算法验证,该小区的每个居民区和对应的低压配电台区相连接,用于算法验证的测量数据主要来源于每个配电台区的智能电表。为了证明本文提出的基于OCSVM和双边PCA的在线异常检测算法的有效性,设定智能电表上报数据的间隔时间为20 s,智能电表上报的测量数据包括每个时间周期的电压、电流、有功功率以及从属线路等。

3.1 评估标准

为了评估本文提出的在线异常检测算法的有效性,本文选用召回率(Recall)和精确率(Precision)作为检测性能的评估标准[16]。Recall和Precision可通过混淆矩阵构建得到,如表1所示。

表1 混淆矩阵Tab.1 Confusion matrix

Recall表示正确预测的异常数据在实际总异常数据中所占比例,定义为

(16)

Precision表示正确预测的异常数据在被判定为异常的总数据中所占比例,定义为

(17)

3.2 基于OCSVM的配电网在线运行状态检测算法评估

为了验证本文提出的基于OCSVM的配电网在线运行状态检测算法的性能,将所提算法和3种经典异常检测算法在Recall、Precision、所需执行时间和所需存储空间4个方面进行了详细对比,对比结果如图3所示。对比的3种经典算法分别为k-最近邻(k-nearest neighbor,KNN)[17]、局部异常因子(local outlier factor,LOF)[18]以及基于离线训练的OCSVM异常检测算法[19]。在该次仿真中,设置特征空间维度D=100,参数K=20,C=30,为了方便对比,4种方法在同一数据集上进行模型训练。从图3可以看出,和经典异常检测算法相比,本文提出的基于OCSVM的在线检测算法可在花费较少的CPU执行时间和存储空间的同时取得较好的检测性能。同时,经典的异常检测算法基于离线训练得到检测参数,其检测性能和数据集的大小密切相关。观察图3可知,本文提出的在线异常检测算法的性能几乎不受数据集大小的影响,可在可用数据较少时依然保持较高的检测性能。此外,经典异常检测算法所需的CPU执行时间和存储空间会随着数据集的增大呈指数增加,这不仅会给边缘服务器带来较大的计算和存储负担,而且还会使得配电网异常检测效率较低,影响电力用户体验。对比之下,本文所提的基于OCSVM的配电网在线运行状态检测算法不仅可以实现对配电网运行状态的实时检测,而且还可在节约计算和存储资源的同时定位特定配电区域出现异常的时刻。

图3 在线运行状态检测算法性能对比图Fig.3 Performance comparison between different online working state detection algorithms

3.3 基于双边PCA的在线流量异常检测算法评估

为了在基于双边PCA的在线流量异常检测算法中选取合适的参数设置,本文首先针对不同参数设置对算法的影响进行了仿真,双边PCA算法中的不同参数设定和影响如图4所示。

1)Score。根据表2给出的算法,如果新产生的数据使得主方向改变较大,则Cosine的值会低于预先设定的Score值,此时会判定新产生的数据为异常数据。因此,Score值的设定会影响本文提出的在线流量异常检测算法的性能。本文基于多跳D2D网络的正常流量数据刻画了Cosine的累积分布函数(cumulative distribution function,CDF),见图4a。已知CDF描述的是随机变量X≤x的概率,也即是F(x)=p(X≤x)。从图4a可以看出,几乎所有的Cosine值均大于0.98,因此,本文设定Score=0.98用于区分正常和异常流量数据。

图4 双边PCA算法中的不同参数设定和影响Fig.4 Influence of different parameter settings in bilateral PCA

为了验证本文提出的基于双边PCA的在线网络流量异常检测算法的性能,将所提算法、经典PCA算法和基于迭代的双边PCA算法在Recall、Precision、所需执行时间和所需存储空间4个方面进行了性能对比,3种算法的保留信息率均设置为ϑ=98%,对比结果如图5所示。观察图5可知,和PCA算法以及基于迭代的双边PCA算法相比,本文算法可在花费较少的CPU执行时间和存储空间的同时取得较好的检测性能。从图5可以看出,经典PCA算法的性能和多跳D2D网络的设备数相关,在网络的设备数量较少时,PCA算法所需CPU执行时间和存储空间都较少,但检测性能也相对较差。对比之下,本文算法性能几乎不受设备数的影响。此外,因为基于迭代的双边PCA算法需要保留迭代过程中的所有历史数据,虽然其检测性能几乎不受设备数的影响,但其所需的CPU执行时间比基于双边PCA的在线流量检测算法长,同时存储空间会随着设备数的增加而指数增加。本文算法不仅可以实现对多跳D2D网络的实时检测,且可节约大量的计算时间和存储空间。

随着配电网侧数据量的急剧提升,本文提出使用多跳D2D组网将配电网数据传输到通信网边缘具有较强计算和存储能力的服务器中进行实时数据分析。为了实现多跳D2D组网下针对配电网络的在线异常检测,首先提出了一种基于OCSVM的在线异常检测算法推断特定区域配电网的工作状态;
其次,为了实现对多跳D2D网络中流量异常的实时检测,设计了一种双边PCA方法在线分析D2D设备的流量监督数据;
最后,本文通过仿真实例验证了本文提出的基于数据驱动的配电网在线异常检测算法可在提高检测速率和精确度的同时节约大量的计算时间和存储空间。

虽然本文提出的算法能够快速精确地判定出每个区域内的配电网是否存在异常情况,却无法确定引起配电网异常的具体原因,因此,为了快速恢复出现异常的配电网,需在本文研究的基础上进一步设计故障诊断方法,在检测到配电网异常后,迅速定位出造成异常的故障设备,以便制定有效的恢复措施。

猜你喜欢 存储空间电表双边 基于多种群协同进化算法的数据并行聚类算法智能计算机与应用(2021年6期)2021-12-17苹果订阅捆绑服务Apple One正式上线综艺报(2020年21期)2020-11-30双边投资协定与外商直接投资经济数学(2020年1期)2020-06-24用好Windows 10保留的存储空间电脑爱好者(2019年17期)2019-10-30与2018年全国卷l理数21题相关的双边不等式福建中学数学(2018年7期)2018-12-24“蹦叭”跳动电表数数学大王·低年级(2018年5期)2018-11-01法国人抗议智能电表或监控隐私环球时报(2018-09-11)2018-09-11基于不确定性严格得分下双边匹配决策方法智富时代(2017年4期)2017-04-27基于不确定性严格得分下双边匹配决策方法智富时代(2017年4期)2017-04-27停电那点事儿新作文·小学低年级版(2016年12期)2016-09-10

推荐访问:在线 组网 异常

本文来源:http://www.zhangdahai.com/shiyongfanwen/qitafanwen/2023/0428/590824.html

  • 相关内容
  • 04-28 军训一开始心得体会8篇(2023年)

    军训一开始心得体会8篇军训一开始心得体会篇1我的军训生活是艰苦的,更是美好的。虽然,它已经像黎明那绚丽的云霞,早被太阳拖走了,却留给我一个美好的回忆,让我一次次的回味。军训的第一天,

  • 04-28 一种基于强化学习的车联网边缘计算卸载策略

    张家波,吕洁娜,甘臣权,张祖凡(1 重庆邮电大学通信与信息工程学院,重庆400065;2 移动通信技

  • 04-28 农户林地承包权退出意愿及影响因素分析——基于南方四省400个农户调查数据

    曾玉林,朱玉玺,赵继锋(1 湖南理工学院经济与管理学院,湖南岳阳414006;2 湖南省林业事务中心

  • 04-28 大学刚军训心得700字

    大学刚军训心得700字大学刚军训心得700字篇1进大学,就意味着必须接受军训考验。对我们这些一直生活在父母羽翼下的人来说,无疑是一种挑战——————一种自我挑战。在这短短的军训期间,

  • 04-28 幼儿园月安全工作报告8篇

    幼儿园月安全工作报告8篇幼儿园月安全工作报告2022年篇1在20xx年的一年里,绿森林幼儿园在上级领导的关心指导下,在广大幼儿园家长及社会各界的大力支持下,认真贯彻《幼儿园教育指导纲要

  • 热门专题
  • 网站地图- 手机版
  • Copyright @ www.zhangdahai.com 大海范文网 All Rights Reserved 黔ICP备2021006551号
  • 免责声明:大海范文网部分信息来自互联网,并不带表本站观点!若侵害了您的利益,请联系我们,我们将在48小时内删除!