本发明涉及ssd(solid state drive,固态硬盘),尤其涉及一种基于多维度监测数据的ssd寿命预测方法、装置及介质。
背景技术:
1、作为一种高性能存储介质,ssd因其高性能、低功耗、高可靠等特点被广泛应用于高性能计算机系统、数据中心等场景,例如lustre并行文件系统中的ost(数据存储对象)、mdt(元数据存储对象)等部分均采用了ssd来提高性能。但是,与传统机械硬盘相比,ssd呈现出更复杂的故障机理与独特的故障外在表现形式。以高性能计算机系统中的lustre并行文件系统为例,由于ssd故障导致的单点故障将使整个存储系统崩溃无法使用,会对系统用户带来无法弥补的损失。因此,对于ssd的故障预测以及寿命管理,在高性能计算机系统中是意义重大且急需解决的问题。
2、针对ssd的寿命预测,现有技术中通常是利用状态记录软件smart(self-monitoring,analysis,and reporting technology)获取的循环读写次数、写放大系数等数据,基于计算ssd内部闪存单元的平均擦写周期采用单一的静态公式预测出寿命,例如预测的寿命通常是与ssd容量、循环读写次数成正比,与每天写入文件大小、ssd写放大系数成反比。但是,由于存在各种各样复杂的ftl(ssd闪存控制固件)内部操作以及各种涉及ssd可靠性的算法,通过访问smart直接得到的数据往往并不准确,且单一的静态公式也无法准确地反应设备使用过程中的动态特征,直接使用单一的静态公式就难以精准预测出ssd寿命。另外,循环读写次数、写放大系数等数据均为短时间周期的监测数据,目前预测方法大多都是基于该类型短周期的监测数据,然而,短时间周期的监测数据只能反映较短时间内ssd的健康状况,大多数的ssd故障可能并不会反映在短期的本地信息中,而是隐藏在长期的信息中,利用短期数据就无法直接有效诊断出大部分的ssd故障和错误。
技术实现思路
1、本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种实现简单、成本低、预测效率以及精度高、灵活性强的基于多维度监测数据的ssd寿命预测方法、装置及介质。
2、为解决上述技术问题,本发明提出的技术方案为:
3、一种基于多维度监测数据的ssd寿命预测方法,步骤包括:
4、对ssd进行状态监控,获取多维度故障监测数据dl以及ssd在运行过程中监测到的无法纠正的错误计数值ucer,所述多维度故障监测数据dl包括多种影响ssd寿命的故障参数的累计监测数据;
5、从获取的所述多维度故障监测数据dl中分别提取出关键数据形成多维度故障关键数据dj;
6、将所述多维度故障监测数据dl、所述多维度故障关键数据dj以及所述无法纠正的错误计数值ucer输入至预先构建的寿命预测模型中对ssd进行寿命预测,得到寿命预测结果输出,所述寿命预测模型为ssd使用寿命与ssd监控数据中多维度故障监测数据dl、多维度故障关键数据dj以及无法纠正的错误计数值ucer之间的关系模型。
7、进一步的,所述多维度监测数据包括smart系统监控到的写入错误、擦除错误、可更正错误、不可纠正的错误、循环冗余校验错误、性能抖动、设备故障中任意多种故障参数的监测数据,所述性能抖动的故障参数根据ssd发生性能异常的数量计算得到,所述设备故障的故障参数为导致工作负载停止的硬盘故障参数。
8、进一步的,从获取的所述多维度故障监测数据dl中通过多项式拟合的方式提取出关键数据形成多维度故障关键数据dj,其中从t时刻第i种故障监测数据中提取出的关键数据的计算表达式为:
9、
10、其中,为在t时刻第i种故障监测数据,w0~wt为权重系数。
11、进一步的,所述寿命预测模型为:
12、
13、其中,st是标准化的剩余寿命,ucer为用于反映无法纠正的错误数目的布尔值,分别是t时刻第i种故障监测数据、提取出的关键数据,fli、fji分别是关于函数变量的权重方程,wl、wj是权重参数,s0为ssd最健康寿命值。
14、进一步的,还包括使用粒子群优化算法对所述寿命预测模型进行参数调优,步骤包括:
15、初始化粒子群及参数设置后进行循环迭代;
16、在每一轮迭代中,将寿命预测模型中需要调优的参数wi视作粒子群算法中的个体,首先计算当前个体的速度和方向:
17、
18、其中,z、c1以及c2为权重参数,为个体i在第k次迭代之后的位置,为个体i在第k次迭代之后的历史最优解,即在第k次迭代后,第i个粒子搜索得到的最优解,为群体在第k次迭代之后的历史最优解,即在第k次迭代后,整个粒子群体中的最优解;
19、使用当前个体的速度和方向决定第k+1次迭代之后个体的路径,并求得在第k+1次迭代之后的最优解当满足迭代条件时输出参数wi的最优解。
20、进一步的,个体i在第k次迭代之后的历史最优解群体在第k次迭代之后的历史最优解的计算方式分别为:
21、
22、
23、进一步的,还包括将寿命预测结果转换为所需数据格式后进行可视化显示,当寿命预测结果低于预设值时发出预警信息。
24、一种基于多维度监测数据的ssd寿命预测装置,包括:
25、状态监控模块,用于对ssd进行状态监控,获取多维度故障监测数据dl以及无法纠正的错误计数值ucer,所述多维度故障监测数据dl包括多种影响ssd寿命的故障参数的监测数据;
26、关键数据提取模块,用于从获取的所述多维度故障监测数据dl中分别提取出关键数据形成多维度故障关键数据dj;
27、寿命预测模块,用于将所述多维度故障监测数据dl、所述多维度故障关键数据dj以及所述无法纠正的错误计数值ucer输入至预先构建的寿命预测模型中对ssd进行寿命预测,得到寿命预测结果输出,所述寿命预测模型为ssd使用寿命与ssd监控数据中多维度故障监测数据dl、多维度故障关键数据dj以及无法纠正的错误计数值ucer之间的关系模型。
28、一种电子设备,包括处理器以及存储器,所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序以执行如上述方法。
29、一种存储有计算机程序的计算机可读存储介质,所述计算机程序被处理器执行时实现如上述方法。
30、与现有技术相比,本发明的优点在于:本发明通过由多维度故障监测数据、关键数据以及错误计数值共同作为预测数据输入至寿命预测模型中,比直接获取的smart数据更准确、可靠,结合长周期累计的监测数据与关键数据的组合方式,还能够避免短周期参数在一个ssd整个生命周期中可能会有很大变化的情况,能更全面、准确地反应设备使用过程中的动态特征,还能够避免ssd生命周期不同的阶段对ssd产生不同程度的磨损效果,从而能够更准确地预测ssd寿命。同时,所采用的寿命预测模型是综合多维度故障监测数据、关键数据以及无法纠正的错误计数值确定预测寿命,能够充分融合长时间周期内多维度ssd故障运行信息动态预测出ssd的剩余寿命,可以避免如传统静态公式方式需要计算内部闪存单元的平均擦写周期,还可以避免其他因素及其相关性对于ssd寿命的影响,实现快速、精准的ssd寿命预测。
1.一种基于多维度监测数据的ssd寿命预测方法,其特征在于,步骤包括:
2.根据权利要求1所述的基于多维度监测数据的ssd寿命预测方法,其特征在于,所述多维度监测数据包括smart系统监控到的写入错误、擦除错误、可更正错误、不可纠正的错误、循环冗余校验错误、性能抖动、设备故障中任意多种长周期故障参数的监测数据,所述性能抖动的故障参数根据ssd发生性能异常的数量计算得到,所述设备故障的故障参数为导致工作负载停止的硬盘故障参数。
3.根据权利要求1所述的基于多维度监测数据的ssd寿命预测方法,其特征在于,从获取的所述多维度故障监测数据dl中通过多项式拟合的方式提取出关键数据形成多维度故障关键数据dj,其中从t时刻第i种故障监测数据中提取出的关键数据的计算表达式为:
4.根据权利要求1所述的基于多维度监测数据的ssd寿命预测方法,其特征在于,所述寿命预测模型为:
5.根据权利要求4所述的基于多维度监测数据的ssd寿命预测方法,其特征在于,还包括使用粒子群优化算法对所述寿命预测模型进行参数调优,步骤包括:
6.根据权利要求5所述的基于多维度监测数据的ssd寿命预测方法,其特征在于,个体i在第k次迭代之后的历史最优解群体在第k次迭代之后的历史最优解的计算方式分别为:
7.根据权利要求1~6中任意一项所述的基于多维度监测数据的ssd寿命预测方法,其特征在于,还包括将寿命预测结果转换为所需数据格式后进行可视化显示,当寿命预测结果低于预设值时发出预警信息。
8.一种基于多维度监测数据的ssd寿命预测装置,其特征在于,包括:
9.一种电子设备,包括处理器以及存储器,所述存储器用于存储计算机程序,其特征在于,所述处理器用于执行所述计算机程序以执行如权利要求1~8中任意一项所述方法。
10.一种存储有计算机程序的计算机可读存储介质,其特征在于,所述计算机程序被处理器执行时实现如权利要求1~8中任意一项所述的方法。