一种用电主体行为画像构建方法

专利2026-02-17  9


本发明属于电力领域,具体涉及一种用电主体行为画像构建方法。


背景技术:

1、当前,电网的特点是负荷增长较快、新能源接入比例较高。由此产生的源、荷两侧的不确定性,给电网的安全稳定运行和经济运行带来了严重影响。除了从发电侧寻找解决方案外,加强负荷可控性的研究也非常重要。同时,大量智能计量终端投入使用,使得用户用电数据得以实时采集。这些数据的相似性和相关性反映了用户的用电习惯。这些数据可以用来构建用电特征,为需求侧响应提供决策依据。用户画像作为真实用户的虚拟代表,是建立在一系列真实数据基础上的用户模型。由数据组成的用户画像可以再现用户的特征,因此用户画像是企业挖掘用户需求和价值、进行用户细分、实施精准营销的基础。

2、近年来,关于超级用户画像的研究逐渐兴起,研究可分为两类。一类是整体框架式研究。此类研究构建了不同的用户画像技术框架,并介绍了关键实现技术和具体应用。另一类是用户画像分类模型的研究。此类研究侧重于用户分类,但其特征选择依赖于专家经验,可靠性较低。用户用电特征的选取是电力用户画像的本质。因此,选择满足简单性要求、最大限度反映用户用电行为特征的特征是绘制准确可靠的用户画像的重要基础。为了提高特征选择的可靠性,互信息和相关系数被用作特征有效性和相关性指标。基于这两个客观指标构建特征评价函数,为特征量的选择提供了可靠的依据。

3、最大相关性和最小冗余准则可以用来寻找满足与目标类别相关性并且与特定特征集冗余度最小的特征子集。以这个准则为准则,可以综合考虑特征的有效性和冗余性,从而选择与用户类别关系最密切的最紧凑的标签集。因此,本技术将该准则应用到用户用电特性的选择中。


技术实现思路

1、本发明目的在于设计一种用电主体行为画像构建方法,选取用户历史用电数据,按照目标长度划分子序列集,考虑其时序数据的错位匹配,采用动态时间规整衡量子序列间的相似性,然后基于相似性计算结果采用k-means聚类算法将子序列集划分为合适的簇数,得到用户用电行为的类别标签。然后基于直观描述和隐含的碳排放量两种类型构建初始特征集。利用最大相关性和最小冗余标准采取枚举法得到最优特征集,形成用户用电行为的行为标签。然后根据评分法,对不同类别的每个特征进行赋分,直观地刻画出用户的用电行为。

2、本发明的目的通过以下的技术方案实现:

3、一种用电主体行为画像构建方法,包括以下步骤:

4、步骤1,收集用户历史用电负荷数据,对其进行预处理;

5、步骤2,通过动态时间规整和k-means聚类确定用户的用电行为的类别标签;

6、步骤3,构建初始特征集,并将最大相关最小冗余准则作为特征选择方法构建最优特征集,得到用户用电行为的行为标签;

7、步骤4,利用评分法对用户的每个特征进行打分,直观展示每个用户的特征。

8、进一步地,所述步骤1中的预处理包括:将用户历史用电负荷数据集x,对长度为l目标序列按时间间隔t进行切分得到子序列集其中xsub表示被切分的子序列集,然后并对缺失值进行平均值填充。

9、进一步地,所述步骤2具体包括:

10、步骤2.1,考虑时序数据的错位匹配对切分的子序列集进行动态时间规整计算,首先计算两条序列各个点间的距离矩阵d,然后基于动态规划的思想寻找一条从d左下角到右上角元素之和最小的路径p,得到时间序列相似性;

11、步骤2.2,在完成动态时间规整计算后,采用k-means算法进行时序轨迹聚类,首先确定一个合适的聚类簇数k,然后通过不断的迭代将子序列集划分为k个簇,并使得划分结果对应的代价函数最小,代价函数定义为各样本与簇中心之间的距离平方和e,表示为:

12、

13、其中x表示属于簇ci的用电负荷数据,是簇ci的均值向量,上式反映了簇内样本围绕着簇均值向量的紧密程度,e值大小与簇内样本相似程度成反比。

14、进一步地,所述步骤3具体包括:

15、步骤3.1,得到用户的用电行为类别标签后构建初始特征集,将特征集分为两类,一类是直观描述型,包括日用电量、日最大负荷、日最小负荷、日平均负荷、日峰谷差中的一种或多种;另一类是隐含的碳排放量型,包括碳排放量和/或碳效益这种评价指标,原始特征集由以上两类特征组合构成;

16、步骤3.2,采用最大相关最小冗余准则作为特征选择方法,特征和分类变量之间的相关性是以特征和分类变量之间的互信息值作为测量指标,它代表特征已知时分类不确定性的降低程度。首先对特征进行归一化,然后将变量区间均匀分散,得到各个特征变量的概率分布,进而完成各个特征与用户类别的互信息计算,至此得到最优特征集的最大相关性指标:

17、

18、其中s表示最优特征集,ns表示最优特征集中包含的特征数量,ti表示s中的第i个特征,d表示用户行为类别,i(ti;d)表示s中的第i个特征与用户类别d之间的互信息,d(s,d)表示最优特征集的最大相关性指数;

19、步骤3.3,利用相关系数来表征特征之间的重复性,计算每两个特征之间的相关系数的平均值作为所有特征的冗余,至此,得到最优特征集的最小冗余指数r(s):

20、

21、其中ti和tj表示最优特征集s中的第i和j个特征;和分别表示特征ti和tj的标准差;表示两个特征的相关系数;

22、步骤3.4,将最大相关性指数和最小冗余指数结合,得到最大的相关性和最小的冗余度,求解得到满足最大相关性最小冗余准则的特征集,即最优特征集;

23、步骤3.5,最优特征集的解可以转化为优化问题,考虑到用户用电行为的初始特征数量并不多,因此本发明采用遍历的方法来获得全局最优解。

24、进一步地,所述步骤4具体包括:

25、步骤4.1,用户用电行为标签由类别标签和行为标签两部分组成,类别标签是由聚类分析结果得到的,行为标签是前面得到的高质量特征。用户用电行为数据大部分是数值型数据,需要转换成业务人员容易理解的标签通过一定的转换规则来理解。这里本发明采用评分系统,通过每类用户每个标签的得分来衡量每类用户的用电特征。假设满分为m,可以得到每类用户每个标签的得分:

26、

27、其中gi,j是第i个用户的第j个标签的得分,是属于第i个类别的所有用户的第j个标签的平均值,tjmax和tjmin分别是第j个标签的最大值和最小值;

28、步骤4.2,为了使业务人员能够更加直观地掌握各类用户的用电特征,将获取到的用户用电标签进行直观展示,形成不同类型用户的用电行为画像。视觉显示分为两部分:类内用户行为的画像和类间电气特性的比较。两者的结合,可以让业务人员更准确、更方便地了解电力用户用电行为的共性和个性。

29、与现有技术相比,本发明具有以下创新优势:

30、1)将动态时间规整算法和k-means融合,以实现对用户不同用电行为特征的准确直观刻画;

31、2)将用户的用电行为特征按照评分系统进行打分,更直观地展示了每个用户的用电行为习惯;

32、3)将用电行为中的碳排放量纳入特征集的构建中,更关注于用电行为刻画的本意,为引导用户低碳用电提供了理论支持;

33、4)本发明不仅反映出用户的用电情况,并且还挖掘了隐藏在用电行为下的碳排放情况,实现用户特征的全面刻画,具有实用价值,扩展性强。


技术特征:

1.一种用电主体行为画像构建方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种用电主体行为画像构建方法,其特征在于,所述步骤1中的预处理包括:将用户历史用电负荷数据集x,对长度为l目标序列按时间间隔t进行切分得到子序列集其中xsub表示被切分的子序列集,然后并对缺失值进行平均值填充。

3.根据权利要求2所述的一种用电主体行为画像构建方法,其特征在于,所述步骤2具体包括:

4.根据权利要求1所述的一种用电主体行为画像构建方法,其特征在于,所述步骤3具体包括:

5.根据权利要求1所述的一种用电主体行为画像构建方法,其特征在于,所述步骤4具体包括:


技术总结
本发明属于电力领域,公开了一种用电主体行为画像构建方法,包括以下步骤:步骤1,收集用户历史用电负荷数据,对其进行预处理;步骤2,通过动态时间规整和K‑means聚类确定用户的用电行为的类别标签;步骤3,构建初始特征集,并将最大相关最小冗余准则作为特征选择方法构建最优特征集,得到用户用电行为的行为标签;步骤4,利用评分法对用户的每个特征进行打分,直观展示每个用户的特征。本发明将动态时间规整算法和K‑means融合,以实现对用户不同用电行为特征的准确直观刻画。本发明将用户的用电行为特征按照评分系统进行打分,更直观地展示了每个用户的用电行为习惯。

技术研发人员:杨秦敏,蒋学俊,王宋炎,李超
受保护的技术使用者:浙江大学湖州研究院
技术研发日:
技术公布日:2024/6/26
转载请注明原文地址:https://doc.8miu.com/read-1827727.html

最新回复(0)