基于强化学习的图像检索方法

专利2026-02-27  9


本发明属于图像检索,更为具体地讲,涉及一种基于强化学习的图像检索方法。


背景技术:

1、近似最近邻检索(approximate nearest neighbor search,anns)是计算机科学中的一项重要技术,特别是在处理大规模数据集时。它的目标是快速找到数据集中与给定查询最相似的元素。ann在多种领域,包括图像检索、推荐系统和机器学习中,都有广泛的应用。

2、为了高效执行anns算法,通常需要一个索引结构来组织数据。索引结构的设计对于查询的效率和准确性至关重要。常见的索引结构包括kd树、r树和球树等。球树索引(balltree index)是一种特别适用于高维数据的索引结构。它通过将数据点分组到多个嵌套的超球体中来组织数据。球树的关键优势在于其能够适应数据的内在维度结构,从而在高维空间中有效地进行搜索。尽管球树是一种有效的索引结构,但其性能极大地依赖于多个参数的设置,如树的深度、分支因子和叶节点大小。这些参数的最优值通常依赖于具体的数据集和查询特性,因此,找到最佳参数配置是一个挑战。

3、目前,球树索引参数的优化主要依赖于经验设置或通过简单的贪心方法。这些方法可能无法充分利用特定数据集的特性,从而导致在查询效率和准确性略差。此外,在图像检索等领域,随着数据集的规模和复杂性日益增加,传统的参数优化方法逐渐显得不足。因此,需要进一步研究如何通过更智能的方法自动优化这些参数,以适应不同的数据和查询需求。


技术实现思路

1、本发明的目的在于克服现有技术的不足,提供一种基于强化学习的图像检索方法,利用强化学习来自动优化球树索引参数的方法,并将优化后的球树索引用于近似图像检索领域,从而提高图像检索的性能。

2、为了实现上述发明目的,本发明基于强化学习的图像检索方法包括以下步骤:

3、s1:根据实际需要收集n张图像,得到图像集合a;

4、s2:根据实际需要构建真实近邻分布估计模型,其中输入为球树索引分布因子b、叶节点大小l和查询近邻数量k所构成的参数向量(b,l,k),输出为w维的分布向量,该分布向量中每个维度对应一个叶子分区,对应元素值表示在相应分区内找到k个真实近邻的比例;

5、分别确定分布因子b、叶节点大小l和查询近邻数量k的取值范围,随机取值得到若干个参数向量,根据每个参数向量中分布因子和叶节点大小对图像集合a构建球状索引,然后获取对应的分布向量,从而得到训练样本;采用训练样本对真实近邻分布估计模型进行训练,得到训练好的真实近邻分布估计模型;

6、s3:采用强化学习确定球树索引的分布因子b和叶节点大小l,强化学习中的参数设置如下:

7、设置状态st=(bt,lt,δtt-1,pt-1),其中t表示时刻,bt表示时刻t的分布因子,lt表示时刻t的叶节点大小,δtt-1表示时刻t-1的查询时延,pt-1表示时刻t-1的查准率;

8、设置动作at=(δbt,δlt),δbt表示时刻t的分布因子调整量,且bt+1=bt+δbt∈[bmin,bmax],bt+1表示时刻t+1的分布因子,bmin、bmax表示分布因子的最小值和最大值,δlt表示时刻t的叶节点大小调整量,且lt+1=lt+δlt∈[lmin,lmax],lt+1表示时刻t+1的叶节点大小,lmin、lmax表示叶节点大小的最小值和最大值;

9、奖励函数的计算方法如下:

10、采用如下公式计算查询时延δtt:

11、

12、其中,λ表示预设的常数;

13、然后将当前参数向量(bt+δbt,lt+δlt,k)输入训练好的真实近邻分布估计模型,得到w维的分布向量,采用如下公式计算查准率pt:

14、pt=log(w)-h

15、其中,h表示分布向量的熵,其计算公式为:

16、

17、其中,pw表示分布向量中第w维元素值,即第w个叶子节点的分区内找到k个真实近邻的比例;

18、然后采用如下公式计算得到当前的奖励函数rt:

19、rt=δtt+pt

20、s4:根据步骤s3确定的分布因子和叶子节点大小对图像集合a构建球树索引;

21、s5:采用构建的球树索引对待检索图像进行检索,得到由相似度最高的k个图像构成的检索结果。

22、本发明基于强化学习的图像检索方法,构建并训练用于测算关键参数组合查准率的真实近邻分布估计模型,采用强化学习确定球树索引的分布因子和叶节点大小,其中奖励函数基于关键参数组合的查询时延和查准率计算得到,根据确定的分布因子和叶节点大小构建图像集合的球树索引,然后基于球树索引进行图像检索。

23、本发明具有以下有益效果:

24、1)本发明利用强化学习来自动优化球树索引参数,通过自主探索参数空间,自动学习最佳的参数配置,以提高查询时延和准确性;

25、2)本发明确定球树索引的方法属于自适应方法,与现有的静态或启发式方法相比,这种方法能更好地适应不同的数据集和查询特性,从而提供更优越的性能;

26、3)本发明通过强化学习得到球树索引的参数,可以有效提升图像检索效率,同时减少一定的资源开销。



技术特征:

1.一种基于强化学习的图像检索方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的图像检索方法,其特征在于,所述真实近邻分布估计模型采用多层感知机。

3.根据权利要求1所述的图像检索方法,其特征在于,所述步骤s3中强化学习采用基于q-learning算法的强化学习,包括以下步骤:


技术总结
本发明公开了一种基于强化学习的图像检索方法,构建并训练用于测算关键参数组合查准率的真实近邻分布估计模型,采用强化学习确定球树索引的分布因子和叶节点大小,其中奖励函数基于关键参数组合的查询时延和查准率计算得到,根据确定的分布因子和叶节点大小构建图像集合的球树索引,然后基于球树索引进行图像检索。本发明利用强化学习来自动优化球树索引参数的方法,并将优化后的球树索引用于近似图像检索领域,从而提高图像检索的性能。

技术研发人员:李剑楠,王晓玲
受保护的技术使用者:华东师范大学
技术研发日:
技术公布日:2024/6/26
转载请注明原文地址:https://doc.8miu.com/read-1828201.html

最新回复(0)