一种固态存储的健康状况检测方法及装置与流程

专利2025-03-22  9


本发明属于存储领域,具体涉及一种固态存储的健康状况检测方法及装置。


背景技术:

1、在当前固态存储技术飞速发展的时代,固态存储器(solid state drives,ssds)因其高速度、低功耗、抗震性以及体积小等显著优势,逐渐成为主流存储解决方案,广泛应用于数据中心、个人计算机系统乃至移动设备中。然而,固态存储技术的快速发展也伴随着数据可靠性与健康管理的新挑战,特别是频繁读写密集型应用场景下,如何准确监控和管理存储块的健康状态,成为了至关重要的议题。

2、传统固态存储器的数据可靠性管理策略往往侧重于硬件层面的被动响应,如错误检测与纠正机制,对于存储块状态的主动监控及早预测性较弱,特别是在数据保持时间、读取干扰等因素的预测上。这类方法依赖于静态阈值设定,缺乏对存储块个体差异性和环境变化的适应性理解,容易导致误报错率与漏检问题,影响数据安全性和系统性能,即存在“精确度与误报错率平衡”的问题,针对这一挑战,业界迫切需求一种更为智能化、动态化的存储块健康监控机制,能够实时评估存储块状态,精准预测潜在风险,优化数据管理策略,同时解决传统方法存在的阈值设置主观性与实际应用脱节问题。


技术实现思路

1、本发明的目的在于提供一种固态存储的健康状况检测方法及装置,以解决上述背景技术中提出的问题。

2、为了解决上述技术问题,本发明提供如下技术方案:

3、固态存储的健康状况检测方法,包括步骤:

4、步骤s1、从存储块的历史使用数据中收集读写/擦除次数、数据保持时间、错误率、读取干扰关键指标;

5、步骤s2、提取存储块的年龄、读取次数、擦除次数、实际错误率特征;

6、步骤s3、构建lstm深度学习模型,输入特征为存储块状态特征,输出为健康状态预测及预期错误率;

7、步骤s4、设定初始阈值,预警阈值y1和回收阈值y2;

8、步骤s5、在线学习循环:周期性,对所有存储块使用深度学习模型实时预测健康状态及错误率;根据预测结果和实际回收验证结果反馈,动态调整预警阈值y1和回收阈值y2;若预测正确率高于阈值但误报也高于阈值,逐步提高y1;若漏检比例高于阈值,逐步降低y2;否则两者平衡良好,则保持预警阈值y1和回收阈值y2;

9、步骤s6、定时器周期性激活,存储块状态管理模块调用深度学习模型评估存储块状态;

10、步骤s7、若模型预测某存储块接近风险阈值y1,启动抽样检测,读取少量页面,计算实际错误率q;

11、决策执行:实际错误率q与回收阈值y2比对,决定是否回收;若实际错误率q≥回收阈值y2,执行数据回收,状态无效化存储块;否则,更新存储块状态管理模块继续监控。

12、进一步,步骤s1还包括识别并处理异常数据,数据一致性检查:确保不同来源的数据在时间戳、存储块标识方面的一致性。

13、进一步,步骤s2:基于存储块的编程完成时间戳,计算至当前时刻的时间差,以此作为存储块的年龄;从日志或数据库中直接提取每个存储块的累计读取次数和擦除次数;对读取次数和擦除次数进行归一化处理;定义错误率包括逻辑错误和物理错误,逻辑错误率依据纠错码的修正次数来计算;物理错误率通过定期的读取验证得到;特征矩阵构建:将提取到的存储块年龄、读取次数、擦除次数、实际错误率特征整合成特征矩阵,每一行代表一个存储块,每一列对应一个特征。

14、进一步,步骤s2还包括使用递归特征消除来评估每个特征对预测目标的贡献度,去除冗余或无关特征。

15、进一步,步骤s3包括:将整理好的特征矩阵划分为训练集、验证集和测试集;

16、设计lstm模型结构,考虑存储块状态的时序特性,设置的lstm层数量,每层单元数量;输入层维度与特征矩阵的列数一致,反映存储块的所有关键特征,输出层设计为二分类和连续值的复合输出,通过多任务学习实现模型同时学习两个不同的输出;在lstm层之后加入一个或多个全连接层,用于进一步提取特征并映射到输出空间,健康状态预测使用sigmoid激活函数输出概率值,预期错误率使用线性激活函数直接输出数值。

17、进一步,步骤s3包括采用组合损失函数,针对健康状态预测采用二元交叉熵损失,针对预期错误率预测采用均方误差损失,加权求和以平衡两个任务的重要性。

18、进一步,步骤s6包括根据存储系统的实时负载、历史故障率以及存储块活动模式动态调整评估周期;在低负载时段增加评估频率,而在高负载时段延长周期。

19、进一步,步骤s7抽样检测策略,优先抽取过去错误率较高区域或近期频繁访问但长期未被校验的页面,根据存储块的不同状态采用不同的抽样密度,基于存储块接近风险阈值y1的程度,距离阈值越近,抽样量越多,反之则减少抽样量。

20、进一步,步骤s7实际错误率计算优化:

21、为提高实际错误率q的准确性,执行多轮抽样读取并计算平均错误率,计算错误率时,考虑采用时间窗口内的平均值而非单一时间点数据,以平滑短期波动。

22、进一步,步骤s7渐进式数据迁移:若实际错误率q≥回收阈值y2决定回收存储块前,启动渐进式数据迁移策略,先将关键数据迁移到其他健康存储块,再进行数据回收,确保数据安全性与业务连续性。

23、有益效果:本申请在实际应用中展现出显著的效果,不仅提升了存储系统性能与数据管理的可靠性,还优化了资源利用率,具体体现在以下几个方面:

24、精准预测与早期干预:深度学习模型通过对存储块健康状态的精准预测,能够在数据错误率上升初期识别潜在风险,及时启动干预,防止数据损坏前的真正发生,显著降低了数据丢失或损坏的风险。

25、个性化阈值优化:动态阈值调整策略依据实时数据反馈,为不同存储块定制化预警与回收阈值,减少了误报错与漏检问题,提高了决策的精确度,保障了数据的长期稳定可靠存储。

26、资源优化:智能抽样与渐进式数据迁移策略显著减少了不必要的数据处理与存储块的频繁回收,节约了系统资源,降低了能耗,提升了整体存储系统的运行效率。

27、负载适应性增强:根据存储块活跃度动态调整的预测周期,以及在低负载时段的高频检测,高负载时段的周期延长,使得系统能够灵活应对各种工况,维持高效稳定运行。

28、综上所述,本申请的技术方案不仅解决了固态存储健康状况检测中“精确度与误报错率平衡”的关键问题,而且通过智能化与动态管理显著提升了存储块数据的可靠性和系统效率,降低了资源消耗,适应了复杂多变的业务需求,推动了存储技术的智能化进程,对数据中心、云计算、个人与移动设备的存储领域带来显著的性能改善与成本效益。



技术特征:

1.固态存储的健康状况检测方法,其特征在于,包括步骤:

2.根据权利要求1所述的固态存储的健康状况检测方法,其特征在于,步骤s1还包括识别并处理异常数据,数据一致性检查:确保不同来源的数据在时间戳、存储块标识方面的一致性。

3.根据权利要求1所述的固态存储的健康状况检测方法,其特征在于,步骤s2:基于存储块的编程完成时间戳,计算至当前时刻的时间差,以此作为存储块的年龄;从日志或数据库中直接提取每个存储块的累计读取次数和擦除次数;对读取次数和擦除次数进行归一化处理;定义错误率包括逻辑错误和物理错误,逻辑错误率依据纠错码的修正次数来计算;物理错误率通过定期的读取验证得到;特征矩阵构建:将提取到的存储块年龄、读取次数、擦除次数、实际错误率特征整合成特征矩阵,每一行代表一个存储块,每一列对应一个特征。

4.根据权利要求1所述的固态存储的健康状况检测方法,其特征在于,步骤s2还包括使用递归特征消除来评估每个特征对预测目标的贡献度,去除冗余或无关特征。

5.根据权利要求1所述的固态存储的健康状况检测方法,其特征在于,步骤s3包括:将整理好的特征矩阵划分为训练集、验证集和测试集;

6.根据权利要求1所述的固态存储的健康状况检测方法,其特征在于,步骤s3包括采用组合损失函数,针对健康状态预测采用二元交叉熵损失,针对预期错误率预测采用均方误差损失,加权求和以平衡两个任务的重要性。

7.根据权利要求1所述的固态存储的健康状况检测方法,其特征在于,步骤s6包括根据存储系统的实时负载、历史故障率以及存储块活动模式动态调整评估周期;在低负载时段增加评估频率,而在高负载时段延长周期。

8.根据权利要求1所述的固态存储的健康状况检测方法,其特征在于,步骤s7抽样检测策略,优先抽取过去错误率较高区域或近期频繁访问但长期未被校验的页面,根据存储块的不同状态采用不同的抽样密度,基于存储块接近风险阈值y1的程度,距离阈值越近,抽样量越多,反之则减少抽样量。

9.根据权利要求1所述的固态存储的健康状况检测方法,其特征在于,步骤s7实际错误率计算优化:

10.根据权利要求1所述的固态存储的健康状况检测方法,其特征在于,步骤s7渐进式数据迁移:若实际错误率q≥回收阈值y2决定回收存储块前,启动渐进式数据迁移策略,先将关键数据迁移到其他健康存储块,再进行数据回收,确保数据安全性与业务连续性。


技术总结
本发明具体涉及一种固态存储的健康状况检测方法及装置,包括步骤:构建LSTM深度学习模型;设定初始阈值,预警阈值Y1和回收阈值Y2;在线学习循环:周期性,对所有存储块使用深度学习模型实时预测健康状态及错误率;根据预测结果和实际回收验证结果反馈,动态调整预警阈值Y1和回收阈值Y2;若预测正确率高于阈值但误报也高于阈值,逐步提高Y1;若漏检比例高于阈值,逐步降低Y2;否则两者平衡良好,则保持预警阈值Y1和回收阈值Y2;定时器周期性激活,存储块状态管理模块调用深度学习模型评估存储块状态;若模型预测某存储块接近风险阈值Y1,启动抽样检测,读取少量页面,计算实际错误率Q;决策执行。

技术研发人员:方东
受保护的技术使用者:深圳市天创伟业科技有限公司
技术研发日:
技术公布日:2024/6/26
转载请注明原文地址:https://doc.8miu.com/read-1817495.html

最新回复(0)