基于强化学习的图像检索方法

专利2026-02-27 31

本发明属于图像检索，更为具体地讲，涉及一种基于强化学习的图像检索方法。

背景技术：

1、近似最近邻检索(approximate nearest neighbor search，anns)是计算机科学中的一项重要技术，特别是在处理大规模数据集时。它的目标是快速找到数据集中与给定查询最相似的元素。ann在多种领域，包括图像检索、推荐系统和机器学习中，都有广泛的应用。

2、为了高效执行anns算法，通常需要一个索引结构来组织数据。索引结构的设计对于查询的效率和准确性至关重要。常见的索引结构包括kd树、r树和球树等。球树索引(balltree index)是一种特别适用于高维数据的索引结构。它通过将数据点分组到多个嵌套的超球体中来组织数据。球树的关键优势在于其能够适应数据的内在维度结构，从而在高维空间中有效地进行搜索。尽管球树是一种有效的索引结构，但其性能极大地依赖于多个参数的设置，如树的深度、分支因子和叶节点大小。这些参数的最优值通常依赖于具体的数据集和查询特性，因此，找到最佳参数配置是一个挑战。

3、目前，球树索引参数的优化主要依赖于经验设置或通过简单的贪心方法。这些方法可能无法充分利用特定数据集的特性，从而导致在查询效率和准确性略差。此外，在图像检索等领域，随着数据集的规模和复杂性日益增加，传统的参数优化方法逐渐显得不足。因此，需要进一步研究如何通过更智能的方法自动优化这些参数，以适应不同的数据和查询需求。

技术实现思路

1、本发明的目的在于克服现有技术的不足，提供一种基于强化学习的图像检索方法，利用强化学习来自动优化球树索引参数的方法，并将优化后的球树索引用于近似图像检索领域，从而提高图像检索的性能。

2、为了实现上述发明目的，本发明基于强化学习的图像检索方法包括以下步骤：

3、s1：根据实际需要收集n张图像，得到图像集合a；

4、s2：根据实际需要构建真实近邻分布估计模型，其中输入为球树索引分布因子b、叶节点大小l和查询近邻数量k所构成的参数向量(b,l,k)，输出为w维的分布向量，该分布向量中每个维度对应一个叶子分区，对应元素值表示在相应分区内找到k个真实近邻的比例；

5、分别确定分布因子b、叶节点大小l和查询近邻数量k的取值范围，随机取值得到若干个参数向量，根据每个参数向量中分布因子和叶节点大小对图像集合a构建球状索引，然后获取对应的分布向量，从而得到训练样本；采用训练样本对真实近邻分布估计模型进行训练，得到训练好的真实近邻分布估计模型；

6、s3：采用强化学习确定球树索引的分布因子b和叶节点大小l，强化学习中的参数设置如下：

7、设置状态st＝(bt,lt,δtt-1,pt-1)，其中t表示时刻，bt表示时刻t的分布因子，lt表示时刻t的叶节点大小，δtt-1表示时刻t-1的查询时延，pt-1表示时刻t-1的查准率；

8、设置动作at＝(δbt,δlt)，δbt表示时刻t的分布因子调整量，且bt+1＝bt+δbt∈[bmin,bmax]，bt+1表示时刻t+1的分布因子，bmin、bmax表示分布因子的最小值和最大值，δlt表示时刻t的叶节点大小调整量，且lt+1＝lt+δlt∈[lmin,lmax]，lt+1表示时刻t+1的叶节点大小，lmin、lmax表示叶节点大小的最小值和最大值；

9、奖励函数的计算方法如下：

10、采用如下公式计算查询时延δtt：

11、

12、其中，λ表示预设的常数；

13、然后将当前参数向量(bt+δbt,lt+δlt,k)输入训练好的真实近邻分布估计模型，得到w维的分布向量，采用如下公式计算查准率pt：

14、pt＝log(w)-h

15、其中，h表示分布向量的熵，其计算公式为：

16、

17、其中，pw表示分布向量中第w维元素值，即第w个叶子节点的分区内找到k个真实近邻的比例；

18、然后采用如下公式计算得到当前的奖励函数rt：

19、rt＝δtt+pt

20、s4：根据步骤s3确定的分布因子和叶子节点大小对图像集合a构建球树索引；

21、s5：采用构建的球树索引对待检索图像进行检索，得到由相似度最高的k个图像构成的检索结果。

22、本发明基于强化学习的图像检索方法，构建并训练用于测算关键参数组合查准率的真实近邻分布估计模型，采用强化学习确定球树索引的分布因子和叶节点大小，其中奖励函数基于关键参数组合的查询时延和查准率计算得到，根据确定的分布因子和叶节点大小构建图像集合的球树索引，然后基于球树索引进行图像检索。

23、本发明具有以下有益效果：

24、1)本发明利用强化学习来自动优化球树索引参数，通过自主探索参数空间，自动学习最佳的参数配置，以提高查询时延和准确性；

25、2)本发明确定球树索引的方法属于自适应方法，与现有的静态或启发式方法相比，这种方法能更好地适应不同的数据集和查询特性，从而提供更优越的性能；

26、3)本发明通过强化学习得到球树索引的参数，可以有效提升图像检索效率，同时减少一定的资源开销。

技术特征：

1.一种基于强化学习的图像检索方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的图像检索方法，其特征在于，所述真实近邻分布估计模型采用多层感知机。

3.根据权利要求1所述的图像检索方法，其特征在于，所述步骤s3中强化学习采用基于q-learning算法的强化学习，包括以下步骤：

技术总结
本发明公开了一种基于强化学习的图像检索方法，构建并训练用于测算关键参数组合查准率的真实近邻分布估计模型，采用强化学习确定球树索引的分布因子和叶节点大小，其中奖励函数基于关键参数组合的查询时延和查准率计算得到，根据确定的分布因子和叶节点大小构建图像集合的球树索引，然后基于球树索引进行图像检索。本发明利用强化学习来自动优化球树索引参数的方法，并将优化后的球树索引用于近似图像检索领域，从而提高图像检索的性能。

技术研发人员：李剑楠,王晓玲
受保护的技术使用者：华东师范大学
技术研发日：
技术公布日：2024/6/26

转载请注明原文地址:https://doc.8miu.com/read-1828201.html

专利

最新回复(0)