模型的训练方法及装置、存储介质及电子装置与流程

专利2026-02-26 35

本技术涉及电力领域，具体而言，涉及一种模型的训练方法及装置、存储介质及电子装置。

背景技术：

1、电力市场化改革已在国内多个省份展开，在电力市场环境下，对电价预测问题的研究有着十分重要的现实意义。有效的电价预测可以向市场主体发出电力系统调节信号，有效调节电力系统平衡，建立电力系统的稳定和可持续发展，其对发电侧、需求侧、投资者以及市场监管机构等各方都具有重要的影响。

2、现在常用的电价预测方法主要分为统计学方法、机器学习方法和深度学习方法。与传统机器学习方法需要手动设计特征不同，深度学习可以自动学习特征表示。深度学习模型通过多层次的神经网络，可以从原始数据中学习到更加高级和抽象的特征表示，自动提取有用的特征，从而避免了复杂的特征工程。在电价预测场景中，与传统的时间序列方法相比，深度网络模型能够更好地捕捉到电价的复杂变化趋势。

3、尽管神经网络模型的具有较好的特征提取能力，但如果输入维度过高，可能会导致过拟合问题。

4、针对现有技术中，在模型训练的过程中，会存在过拟合的问题，目前尚未提出有效的解决方案。

5、因此，有必要对相关技术予以改良以克服相关技术中的所述缺陷。

技术实现思路

1、本技术实施例提供了一种模型的训练方法及装置、存储介质及电子装置，以至少解决现有技术中在模型训练的过程中，会存在过拟合的问题。

2、根据本技术实施例的一方面，提供了一种模型的训练方法，包括：将样本数据集中的第一样本数据输入至预测模型的第一降维模块，以及将所述样本数据集中的第二样本数据输入至所述预测模型的第二降维模块，其中，所述第一样本数据包括：第一日期的每个预设时间段的时间特征、所述第一日期的每个预设时间段的电力特征和第二日期的每个预设时间段的电力特征，所述第二日期为所述第一日期在目标时长之前的日期；第二个样本数据包括：第三日期的每个预设时间段的时间特征、所述第三日期的每个预设时间段的电力特征和第四日期的每个预设时间段的电力特征，所述第四日期为所述第三日期在目标时长之前的日期；通过所述第一降维模块将所述第一样本数据映射到表征空间，以及通过所述第二降维模块将所述第二样本数据映射到所述表征空间，以得到降维后的第一向量和降维后的第二向量；根据所述第一向量和所述第二向量对所述预测模型进行训练，以得到训练好的预测模型。

3、在一个示例性实施例中，根据所述第一向量和所述第二向量对所述预测模型进行训练，以得到训练好的预测模型之后，所述方法还包括：在所述第二样本数据为所述样本数据集中的第一个样本数据的情况，输入步骤：将所述第一样本数据输入至预测模型的第一降维模块，以及将所述样本数据集中的第j个样本数据输入至所述预测模型的第二降维模块；映射步骤：通过所述第一降维模块将所述第一样本数据映射到表征空间，以及通过所述第二降维模块将所述第j个样本数据映射到所述表征空间，以得到降维后的第一向量和降维后的第j个向量；训练步骤：根据所述第一向量和所述第j个向量对所述预测模型进行训练；在j依次取值2，3，……，2n的情况下，循环执行所述输入步骤，所述映射步骤和所述训练步骤，直至得到根据所述第一向量和第2n个向量对所述预测模型进行训练。

4、在一个示例性实施例中，通过所述第一降维模块将所述第一样本数据映射到表征空间，以及通过所述第二降维模块将所述第j个样本数据映射到所述表征空间，以得到降维后的第一向量和降维后的第j个向量之后，所述方法还包括：将所述第一向量输入至所述预测模型的第一映射网络，以及将所述第j个向量输入至所述预测模型的第二映射网络，以通过所述第一映射网络将所述第一向量映射至单位超椭球面，通过所述第二映射网络将所述第j个向量映射至所述单位超椭球面；获取所述第一映射网络输出的第三向量和所述第二映射网络输出的第四向量；将所述第一向量输入至所述预测模型的预测模块，以获取所述预测模块输出的第一预测电价。

5、在一个示例性实施例中，根据所述第一向量和第2n个向量对所述预测模型进行训练之后，所述方法还包括：根据所述第三向量、所述第四向量和所述第一预测电价确定所述预测模型的损失函数是否收敛；在所述损失函数未收敛的情况下，基于优化算法对所述预测模型中的第一降维模块、第二降维模块和所述预测模块的网络参数进行调整。

6、在一个示例性实施例中，根据所述第三向量、所述第四向量和所述第一预测电价确定所述预测模型的损失函数是否收敛，包括：根据所述第三向量和所述第四向量确定所述第一样本数据对应的对比损失，以及根据所述第一预测电价确定所述第一样本数据对应的回归损失；根据所述对比损失和所述回归损失确定所述预测模型的损失函数是否收敛。

7、在一个示例性实施例中，根据所述第三向量和所述第四向量确定所述第一样本数据对应的对比损失，包括：通过以下公式确定所述第一样本数据对应的对比损失

8、其中，z1为所述第一样本数据的第三向量，zk为所述样本数据集中的第k个样本数据的第四向量，k∈[1,2n]，simi1为所述第一样本数据的相似日库，τ为温度系数超参数,i为指示函数；

9、根据所述第一预测电价确定所述第一样本数据对应的回归损失，包括：通过以下公式确定所述第一样本数据对应的回归损失

10、其中，ya为所述第一日期中第a个时间段对应的真实电价，为所述第a个时间段对应的第一预测电价。

11、在一个示例性实施例中，根据所述第一向量和所述第二向量对所述预测模型进行训练，以得到训练好的预测模型之后，所述方法还包括：将预测日期的每个预设时间段的电力特征和延时电力特征输入至所述预测模型的第一降维模块中，以使所述第一降维模块将所述预测日期的每个预设时间段的电力特征和延时电力特征到所述表征空间，以得到降维后的第五向量；将所述第五向量输入至所述预测模型的预测模块中，以使所述预测模块根据所述第五向量输出所述预测日期的第二预测电价。

12、根据本技术实施例的另一方面，还提供了一种模型的训练装置，包括：输入模块，用于将样本数据集中的第一样本数据输入至预测模型的第一降维模块，以及将所述样本数据集中的第二样本数据输入至所述预测模型的第二降维模块，其中，所述第一样本数据包括：第一日期的每个预设时间段的时间特征、所述第一日期的每个预设时间段的电力特征和第二日期的每个预设时间段的电力特征，所述第二日期为所述第一日期在目标时长之前的日期；第二个样本数据包括：第三日期的每个预设时间段的时间特征、所述第三日期的每个预设时间段的电力特征和第四日期的每个预设时间段的电力特征，所述第四日期为所述第三日期在目标时长之前的日期；映射模块，用于通过所述第一降维模块将所述第一样本数据映射到表征空间，以及通过所述第二降维模块将所述第二样本数据映射到所述表征空间，以得到降维后的第一向量和降维后的第二向量；训练模块，用于根据所述第一向量和所述第二向量对所述预测模型进行训练，以得到训练好的预测模型。

13、根据本技术实施例的又一方面，还提供了一种计算机可读的存储介质，该计算机可读的存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述模型的训练方法。

14、根据本技术实施例的又一方面，还提供了一种电子装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，上述处理器通过计算机程序执行上述模型的训练方法。

15、根据本技术实施例的又一方面，还提供了一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行上述模型的训练方法。

16、通过本技术实施例，将样本数据集中的第一样本数据输入至预测模型的第一降维模块，以及将所述样本数据集中的第二样本数据输入至所述预测模型的第二降维模块，其中，所述第一样本数据包括：第一日期的每个预设时间段的时间特征、所述第一日期的每个预设时间段的电力特征和第二日期的每个预设时间段的电力特征，所述第二日期为所述第一日期在目标时长之前的日期；第二个样本数据包括：第三日期的每个预设时间段的时间特征、所述第三日期的每个预设时间段的电力特征和第四日期的每个预设时间段的电力特征，所述第四日期为所述第三日期在目标时长之前的日期；通过所述第一降维模块将所述第一样本数据映射到表征空间，以及通过所述第二降维模块将所述第二样本数据映射到所述表征空间，以得到降维后的第一向量和降维后的第二向量；根据所述第一向量和所述第二向量对所述预测模型进行训练，以得到训练好的预测模型。也就是说，本技术实施例中，将输入特征映射到低维空间，因此可以更好地泛化到新的数据上，提高模型的泛化能力和预测准确性，解决了现有技术中在模型训练的过程中，会存在过拟合的问题。

技术特征：

1.一种模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的模型的训练方法，其特征在于，根据所述第一向量和所述第二向量对所述预测模型进行训练，以得到训练好的预测模型之后，所述方法还包括：

3.根据权利要求2所述的模型的训练方法，其特征在于，通过所述第一降维模块将所述第一样本数据映射到表征空间，以及通过所述第二降维模块将所述第j个样本数据映射到所述表征空间，以得到降维后的第一向量和降维后的第j个向量之后，所述方法还包括：

4.根据权利要求3所述的模型的训练方法，其特征在于，根据所述第一向量和第2n个向量对所述预测模型进行训练之后，所述方法还包括：根据所述第三向量、所述第四向量和所述第一预测电价确定所述预测模型的损失函数是否收敛；

5.根据权利要求4所述的模型的训练方法，其特征在于，根据所述第三向量、所述第四向量和所述第一预测电价确定所述预测模型的损失函数是否收敛，包括：

6.根据权利要求5所述的模型的训练方法，其特征在于，根据所述第三向量和所述第四向量确定所述第一样本数据对应的对比损失，包括：

7.根据权利要求1所述的模型的训练方法，其特征在于，根据所述第一向量和所述第二向量对所述预测模型进行训练，以得到训练好的预测模型之后，所述方法还包括：

8.一种模型的训练装置，其特征在于，包括：

9.一种计算机可读的存储介质，其特征在于，所述计算机可读的存储介质包括存储的程序，其中，所述程序运行时执行上述权利要求1至7任一项中所述的方法。

10.一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行所述权利要求1至7任一项中所述的方法。

11.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7任一项中所述的方法。

技术总结
本申请公开了一种模型的训练方法及装置、存储介质及电子装置，其中，上述方法包括：将样本数据集中的第一样本数据输入至预测模型的第一降维模块，以及将样本数据集中的第二样本数据输入至预测模型的第二降维模块，其中，第一样本数据包括：第一日期的每个预设时间段的时间特征、第一日期的每个预设时间段的电力特征和第二日期的每个预设时间段的电力特征，第二日期为第一日期在目标时长之前的日期；通过第一降维模块将第一样本数据映射到表征空间，以及通过第二降维模块将第二样本数据映射到表征空间，以得到降维后的第一向量和降维后的第二向量；根据第一向量和第二向量对预测模型进行训练，以得到训练好的预测模型。

技术研发人员：杨雪,黄思皖,史鉴恒,王宝岳,钟明,安娜,王春森,薛丽,张慧君
受保护的技术使用者：中国华能集团清洁能源技术研究院有限公司
技术研发日：
技术公布日：2024/6/26

转载请注明原文地址:https://doc.8miu.com/read-1828177.html

专利

最新回复(0)