基于组合模型的网络流量预测方法与流程

专利2022-05-09 233

本发明涉及计算机网络领域，具体涉及一种基于灰狼优化支持向量机和双向长短期记忆循环神经网络组合模型的网络流量预测方法。

背景技术：

进入二十一世纪后，互联网不断的更新升级，网络及其相关设施作为信息化的基础，具有的规模不断扩增，已经成为了现代社会发展的重要标志，更是国家实力强大的象征。世界各国将建设网络提高到了国家战略发展层面。中国也十分关注网络建设。伴随着网络的普及和多网融合的快速发展，网络己经渗透到人民生活、社会生产、国家安全的各个方面，它在国民经济和社会发展中所占的地位越来越大。因此，是否能够准确、快速的掌握网络运行的情况、优化提高网络性能、尽可能提供安全的网络将会对生活、教育、政治、经济等许多方面产生巨大的影响。

网络的管理、设计和规划全都依托于准确的网络流量预测。然而，随着异构网络不断融合，网络服务和用户数量的大幅增加，网络流量数据互换方式的变化，特别是与网络相关技术和应用的崛起，使得网络流量的组成和构造都产生了巨大的改变，传统的网络流量预测方法已难以满足在保证网络安全的前提下，优化网络协议设计，同时增强网络运行效率的需求。因此，为了满足新时期互联网的发展和网络结构的升级，迫切的需要对网络流量特性进行分析和开展网络流量预测研究。

不同的网络流量预测模型具备不完全相同的预测能力，以模型自身的核心思想为基础，结合自身的结构特点，获取各自所需的有用信息，从而得到不完全相同的预测结果。但无论哪一种预测模型都难以精确地反映出整个系统所有的变化规律。如支持向量机模型容错能力较差，面对网络流量变化复杂的情况预测能力有所欠缺；双向长短期记忆循环神经网络有一定风险会过拟合，失去泛化能力，只能得到局部最优解。

技术实现要素：

针对以上问题，本发明目的是提供基于组合模型的网络流量预测方法，发挥双向长短期记忆循环神经网络处理非线性问题和容错能力强的优势，同时利用支持向量机泛化能力较强且依据结构化风险最小的思想进行求解获得全局最优解，使两者优势互补。

为实现上述目的，本申请的技术方案为：基于组合模型的网络流量预测方法，包括训练阶段和预测阶段，所述训练阶段在对双向长短期记忆循环神经网络训练的同时，对灰狼优化支持向量机模型也进行训练；所述预测阶段以双向长短期记忆循环神经网络和灰狼优化支持向量机模型的预测结果残差平方和最小为目标，根据各自上一次预测结果误差调整对应的权重值，动态加权后得到两个组合模型的预测结果。

进一步的，对双向长短期记忆循环神经网络训练的方法为：

step1：使用滑动窗口技术处理采集得到的原始网络流量数据，完成归一化和数据化分后，得到网络流量训练集；

step2：确定训练样本数，设置训练目标值与最大训练次数；

step3：初始化双向长短期记忆循环神经网络的各个参数；

step4：判断训练计数值是否大于最大训练次数，如果大于，执行step9，否则继续往下，执行step5；

step5：将所述网络流量训练集的数据输入到双向长短期记忆循环神经网络中，进行前向计算；

step6：所述双向长短期记忆循环神经网络中的正向和反向输出进行加权融合得到预测结果；

step7：将预测结果与真实值进行比较，获取预测误差值；

step8：如果预测误差值小于目标误差值，继续执行step9；否则执行基于时间的反向传播算法对网络参数值进行更新，同时训练计数值加1，返回step4；

step9：完成对双向长短期记忆循环神经网络的训练。

进一步的，对灰狼优化支持向量机模型进行训练的方法为：

step1：使用滑动窗口技术处理采集得到的原始网络流量数据，完成归一化和数据化分后，得到网络流量训练集；

step2：设定训练目标值同时选定支持向量机所用核函数；

step3：初始化灰狼算法的各个参数，其包括狼群总体的个数、进行循环迭代的最大次数、参数边界范围；

step4：将支持向量机的惩罚因子c和核函数参数g转化为狼群各位的参数坐标，从而初始化α、β和δ狼的位置和目标函数值；

step5：遍历每个狼，如果搜索位置超出了搜索空间，则重新回到搜索空间，同时获取狼群初始适应度；

step6：根据适应度最好的狼所在位置来进一步调整更新三只头狼，同时根据三只头狼最新的位置对狼群所在的位置进行优化；

step7：如果迭代次数小于设定值，返回step5；否则得到最优的惩罚因子c和核函数参数g；

step8：训练得到最优的灰狼优化支持向量机模型；

step9：完成对支持向量机的训练。

进一步的，预测阶段具体实现方法为：

step1：使用滑动窗口技术处理采集得到的原始网络流量数据，完成归一化和数据化分后，得到网络流量测试集；

step2：将网络流量测试集的数据输入到双向长短期记忆循环神经网络中进行前向计算，同时也将网络流量测试集的数据输入到灰狼优化支持向量机模型中；

step3：分别得到双向长短期记忆循环神经网络和灰狼优化支持向量机模型的预测结果；

step4：根据双向长短期记忆循环神经网络和灰狼优化支持向量机模型各自上一次预测结果误差获取对应的权重值，进行动态加权；

step5：得到最终的预测结果。

本发明由于采用以上技术方案，能够取得如下的技术效果：本申请发挥双向长短期记忆循环神经处理非线性问题和容错能力强的优势克服了支持向量机容错能力较差以及当网络流量出现复杂变化时支持向量机预测结果难以达到预期要求的问题，同时利用支持向量机泛化能力较强且依据结构化风险最小的思想进行求解，获得全局最优解的优势来解决双向长短期记忆循环神经网络有一定的风险会产生过拟合，失去泛化能力，只能得到局部最优解的问题，从而克服了单一模型固有缺陷，达到了优势互补的目的。

附图说明

图1为本申请组合模型原理图；

图2为本申请组合模型训练流程图；

图3为本申请组合模型预测流程图；

图4为网络流量原始数据图；

图5为1s时间尺度下测试集上预测结果图；

图6为0.1s时间尺度下测试集上预测结果图。

具体实施方式

本发明的实施例是在以本发明技术方案为前提下进行实施的，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述实施例。

从对网络流量特征提取和利用的角度来看，正常情况下单一预测模型所能提取到的特征信息量明显少于由多种预测模型综合而成的组合预测模型。通过组合模型进行网络流量预测可以更加全面和系统的展现出网络流量整个过程潜在的变化规律。组合模型预测方法不仅可以避免因单一模型固有缺陷导致特征信息流失的问题，而且能够充分利用自身所具有的优势，降低在进行高精度网络流量预测时的随机性，从而得到更好的预测结果。

本发明提出的基于灰狼优化支持向量机和双向长短期记忆循环神经网络组合模型的预测方法，预测模型原理如图1所示。在利用双向长短期记忆循环神经网络进行预测的同时，利用灰狼算法寻优得到最佳参数的支持向量机模型同步进行预测，以组合模型预测结果残差平方和最小为目标，依据两种方法上一次预测结果的误差调整下一次的权重值，动态加权后得到组合模型的预测结果。

基于灰狼优化支持向量机和双向长短期记忆循环神经网络组合模型的预测方法包括训练和预测两个阶段。训练阶段，流程图如图2所示。预测阶段，流程图如图3所示。

实施例1：实验所用的网络流量原始数据集来自widebackbone数据库，从该数据库下载了2019年1月1日到1月8日，每天13时00分00秒到13时15分00秒的网络流量原始数据。使用wireshark网络封包分析软件，依照时间间隔1s和0.1s分别提取和统计每天的网络流量数据，得到多个时间尺度下原始网络流量数据。之后将原始网络流量数据利用滑动窗口方法进行截取处理。为了消除网络流量指标之间的量纲影响，对网络流量真实数据进行归一化处理，将每个样本的特征向量除以其长度，长度通常使用l2范数来度量，从而消除特征间单位和尺度差异带来的影响。在多个时间尺度下测试，从而证明提出方法的有效性。网络流量部分原始数据如图4所示。实验所使用的电脑环境为intel(r)core(tm)i7-4790cpu@3.60ghz，16.00gbramdell，matlab2019b。

经过大量实验，选定基于灰狼优化支持向量机和双向长短期记忆循环神经网络组合模型的参数为：狼群数量50，灰狼优化算法迭代次数200，惩罚影子c和核函数参数g上边界为50，下边界为0.01，支持向量机选用径向基核函数。双向长短期记忆循环神经网络参数为：输入层神经元个数60，隐含层神经元个数100，输出层神经元个数10，学习速率0.001。组合模型中初始权重值为0.5，之后根据双向长短期记忆循环神经网络和灰狼优化支持向量机上次一预测结果的误差值动态调整当前时刻的权重值。在1s和0.1s两个时间尺度的数据集下，分别选用3500组样本数据训练组合模型，在测试集上，对比灰狼优化支持向量机、长短期记忆循环神经网络、双向长短期记忆循环神经网络以及本发明所提出的方法连续预测500个点得到的预测结果，从而证明本发明提出的基于灰狼优化支持向量机和双向长短期记忆循环神经网络组合模型预测方法的真实有效性。在1s和0.1s两个时间尺度下，测试集上，四种方法的预测结果分别如图5和图6所示：

图5中绘制出了1s时间尺度下，在测试集上不同方法连续预测500个点的结果，图6中绘制出了0.1s时间尺度下，在测试集上不同方法连续预测500个点的结果。灰狼优化支持向量机模型的预测结果相比真实值起伏较大，预测效果最差。长短期记忆循环神经网络预测结果相对比较平稳，预测效果强于灰狼优化支持向量机方法。基于双向长短期记忆循环神经网络的预测方法，充分利用了网络流量的双向特征，其预测值更加收敛于真实值，预测效果强于长短期记忆循环神经网络。本发明提出的基于灰狼优化支持向量机和双向长短期记忆循环神经网络组合模型预测方法，以组合模型预测结果残差平方和最小为目标，根据两种方法上一次预测结果的误差调整下一次的权重值，动态加权后得到预测结果，该方法发挥了组合模型的优势，克服了单一模型的固有缺陷。相比于其他几种预测方法，所提出预测方法可以更加准确的进行网络流量预测。

为了能够更加直观且有效的对所提出的组合模型网络流量预测方法进行评估，现将本发明所提出预测方法分别与灰狼优化支持向量机、长短期记忆循环神经网络、双向长短期记忆循环神经网络三种方法进行对比，在1s和0.1s不同时间尺度下，计算不同方法在测试集上连续预测500个点得到预测结果的平均相对误差、平均绝对误差和最小均方误差值。不同时间尺度下对比结果如表1和表2所示，详细计算过程如公式(1)、公式(2)和公式(3)所示，其中yt为真实网络流量数据，为网络流量预测结果，n代表预测步长。

表11秒时间尺度下网络流量预测结果

表20.1秒时间尺度下网络流量预测结果

表1和表2对比了在1s和0.1s两个时间尺度下，测试集上四种预测方法，分别连续预测500个点得到的结果，与真实值比较后，计算得到各自预测结果的平均相对误差、平均绝对误差和最小均方误差值。通过对比多个时间尺度下，不同预测方法的评价指标后可以看出，灰狼优化支持向量机预测方法预测效果最差，长短期记忆循环神经网络方法预测方法预测效果强于灰狼优化支持向量机预测方法，双向长短期记忆循环神经网络预测方法充分利用了网络流量的双向特征，在单一模型预测方法中预测效果最好。而本发明所提出的预测方法，充分发挥了组合模型的优势，在一定程度上克服了单一模型存在的缺陷，在所有预测方法中效果最好。与单一模型预测方法相比较，最终预测结果平均相对误差值提升了0.5％，平均绝对误差和最小均方误差值相比原算法提升了15％和30％。

综上分析，本发明针对支持向量机容错能力较差，面对网络流量变化复杂的情况预测能力有所欠缺，双向长短期记忆循环神经网络有一定的风险会产生过拟合，失去泛化能力，得到局部最优解的问题，将两种模型进行组合，发挥双向长短期记忆循环神经网络处理非线性问题和容错能力强的优势来克服支持向量机容错能力较差以及当网络流量出现复杂变化时支持向量机预测结果难以达到预期要求的问题，同时利用支持向量机泛化能力较强且依据结构化风险最小的思想进行求解，获得全局最优解的优势来解决双向长短期记忆循环神经网络有一定的风险会产生过拟合，失去泛化能力，只能得到局部最优解的问题，从而进行优势互补。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外，应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

技术特征：

1.基于组合模型的网络流量预测方法，其特征在于，包括训练阶段和预测阶段，所述训练阶段在对双向长短期记忆循环神经网络训练的同时，对灰狼优化支持向量机模型也进行训练；所述预测阶段以双向长短期记忆循环神经网络和灰狼优化支持向量机模型的预测结果残差平方和最小为目标，根据各自上一次预测结果误差调整对应的权重值，动态加权后得到两个组合模型的预测结果。

2.根据权利要求1所述基于组合模型的网络流量预测方法，其特征在于，对双向长短期记忆循环神经网络训练的方法为：

step1：使用滑动窗口技术处理采集得到的原始网络流量数据，完成归一化和数据化分后，得到网络流量训练集；

step2：确定训练样本数，设置训练目标值与最大训练次数；

step3：初始化双向长短期记忆循环神经网络的各个参数；

step4：判断训练计数值是否大于最大训练次数，如果大于，执行step9，否则继续往下，执行step5；

step5：将所述网络流量训练集的数据输入到双向长短期记忆循环神经网络中，进行前向计算；

step6：所述双向长短期记忆循环神经网络中的正向和反向输出进行加权融合得到预测结果；

step7：将预测结果与真实值进行比较，获取预测误差值；

step8：如果预测误差值小于目标误差值，继续执行step9；否则执行基于时间的反向传播算法对网络参数值进行更新，同时训练计数值加1，返回step4；

step9：完成对双向长短期记忆循环神经网络的训练。

3.根据权利要求1所述基于组合模型的网络流量预测方法，其特征在于，对灰狼优化支持向量机模型进行训练的方法为：

step1：使用滑动窗口技术处理采集得到的原始网络流量数据，完成归一化和数据化分后，得到网络流量训练集；

step2：设定训练目标值同时选定支持向量机所用核函数；

step3：初始化灰狼算法的各个参数，其包括狼群总体的个数、进行循环迭代的最大次数、参数边界范围；

step4：将支持向量机的惩罚因子c和核函数参数g转化为狼群各位的参数坐标，从而初始化α、β和δ狼的位置和目标函数值；

step5：遍历每个狼，如果搜索位置超出了搜索空间，则重新回到搜索空间，同时获取狼群初始适应度；

step6：根据适应度最好的狼所在位置来进一步调整更新三只头狼，同时根据三只头狼最新的位置对狼群所在的位置进行优化；

step7：如果迭代次数小于设定值，返回step5；否则得到最优的惩罚因子c和核函数参数g；

step8：训练得到最优的灰狼优化支持向量机模型；

step9：完成对支持向量机的训练。

4.根据权利要求1所述基于组合模型的网络流量预测方法，其特征在于，预测阶段具体实现方法为：

step1：使用滑动窗口技术处理采集得到的原始网络流量数据，完成归一化和数据化分后，得到网络流量测试集；

step3：分别得到双向长短期记忆循环神经网络和灰狼优化支持向量机模型的预测结果；

step4：根据双向长短期记忆循环神经网络和灰狼优化支持向量机模型各自上一次预测结果误差获取对应的权重值，进行动态加权；

step5：得到最终的预测结果。

技术总结
本发明公开了基于组合模型的网络流量预测方法，包括训练阶段和预测阶段，所述训练阶段在对双向长短期记忆循环神经网络训练的同时，对灰狼优化支持向量机模型也进行训练；所述预测阶段以双向长短期记忆循环神经网络和灰狼优化支持向量机模型的预测结果残差平方和最小为目标，根据各自上一次预测结果误差调整对应的权重值，动态加权后得到两个组合模型的预测结果。本申请发挥双向长短期记忆循环神经网络处理非线性问题和容错能力强的优势，同时利用支持向量机泛化能力较强且依据结构化风险最小的思想进行求解获得全局最优解，使两者优势互补。

技术研发人员：杜秀丽;范志宇;吕亚娜;邱少明;陶帆
受保护的技术使用者：大连大学
技术研发日：2021.04.22
技术公布日：2021.08.03

转载请注明原文地址:https://doc.8miu.com/read-619.html

专利

最新回复(0)