本发明涉及货币识别清分,具体涉及一种基于自适应k值的k-means聚类算法的纸币序列号自动标定方法及系统。
背景技术:
1、
2、在纸币识别时需要对纸币进行序列号标定,现有的纸币序列号标定工作中,对每一个面额版本的每一个面向进行多次批量标号,批量标号结束后,将默认的序列号的识别结果作为参数给每一张纸币进行标注。当其中混有一部分错误的标号时,为了找到这些错误并改正过来,就需要进行单张标号,对每一张已经批量标号过的图片再进行人工单张标号,但是,人工标号不仅效率低,而且易出错,需要进行多次核查。
技术实现思路
1、有鉴于此,有必要提供一种能够自动检错、且方法简单速度快捷的基于自适应k值的k-means聚类算法的纸币序列号自动标定方法及系统。
2、一种基于自适应k值的k-means聚类算法的纸币序列号自动标定方法,所述方法包括以下步骤:
3、步骤一,获取并保存原图片和识别结果,获取单字符图片并保存,建立原图片与单字符图片的对应关系;
4、步骤二,提取单字符图片的特征值,以每类单字符图片的平均值为中心点,采用k-means聚类算法查找错误图像;
5、步骤三,获得正确和错误的单字符图片后,依据识别结果与原图片名称对应关系,得到正确和错误的原图,建立正确原图、错误原图和识别结果对应关系。
6、优选地,所述步骤一,获取原图片和识别结果,获取单字符图片并保存,建立原图片与单字符图片的对应关系的步骤具体包括:
7、步骤1-1,采集并保存纸币图像,识别纸币序列号,建立识别结果与原图片名称的对应关系表;
8、步骤1-2,将原图片中的纸币序列号分割为单字符图片并保存,建立识别结果与单字符图片名称的对应关系表;
9、步骤1-3,通过识别结果,建立原图片与单字符图片的对应关系。
10、优选地,所述原图片名称中包括币种名、面额版本、面向、币种代号、套别和识别结果,所述单字符图片名称中包括面额版本、面向、识别结果、位数和图片名称,其中,
11、所述币种名是待检测纸币的货币名称;
12、所述面额版本是待识别纸币的冠字所表示的面额和版本;
13、所述面向是纸币扫描时的放置方向,纸币的放置方向包括正面正向、正面反向、反面正向和反面反向;
14、所述币种代号是用于区别相像外币符号的货币标识;
15、所述套别是用于区分同一币种在不同时期发行的具有不同币面图案或主题的货币的代码;
16、所述识别结果是对图片进行识别后得到的字母或数字;
17、所述位数是所述识别结果在纸币序列号中所处的位置;
18、所述图片名称用于区别不同的纸币扫描图片。
19、优选地,所述步骤1-1,采集并保存纸币图像,识别纸币序列号的步骤具体包括:
20、步骤1-1-1,采集待标定纸币图像;
21、步骤1-1-2,对纸币图像进行归一化处理;
22、步骤1-1-3,对纸币图像中的序列号区域进行边界探测和图像切割,得到纸币序列号的原图片;
23、步骤1-1-4,识别并保存纸币序列号。
24、优选地,所述步骤1-2,将原图片中的纸币序列号分割为单字符图片并保存的步骤具体包括:
25、步骤1-2-1,对序列号的原图片进行归一化处理;
26、步骤1-2-2,对原图片进行图像切割,得到纸币序列号的单字符图片;
27、步骤1-2-3,保存单字符图片,并在单字符图片名称中注明该单字符图片在原图片中的位置。
28、优选地,所述步骤二,提取单字符图片的特征值,以每类单字符图片的平均值为中心点,采用k-means聚类算法查找错误图像的步骤具体包括:
29、步骤2-1,按照识别结果对全部单字符图片进行分类,在同一类单字符图片中,取该类字符图片的前20张提取特征值,以特征值的均值作为中心点;
30、步骤2-2,对同一类图片中的单字符图片做判断,将距离中心点较近的前20张图片加入模板训练;
31、步骤2-3,遍历全部单字符图片,将每一张单字符图片逐一分配至与中心点之间的距离最小的簇中;
32、步骤2-4,判断单字符图片的聚类结果与识别结果是否相同,若相同则判定为正确图片,否则判定为错误图片。
33、优选地,所述步骤三,获得正确和错误的单字符图片后,依据识别结果与原图片名称对应关系,得到正确和错误的原图,建立正确原图、错误原图和识别结果对应关系的步骤具体包括:
34、步骤3-1,依据原图片与单字符图片的对应关系,找到正确图片和错误图片所对应的原图片和识别结果;
35、步骤3-2,将正确图片和错误图片的单字符图片名称、原图片名称和识别结果分别汇总于不同文件中;
36、步骤3-3,依据错误图片的汇总文件中的内容,更正错误的识别结果。
37、优选地,所述步骤3-3,依据错误图片的汇总文件中的内容,更正错误的识别结果中,对于错误图片的更正采用两种方法:
38、方法一,依据错误图片的聚类结果,自动更正错误图片的识别结果;
39、方法二,参考聚类结果,人工更正错误图片的识别结果。
40、优选地,所述步骤三,获得正确和错误的单字符图片后,依据识别结果与原图片名称对应关系,得到正确和错误的原图,建立正确原图、错误原图和识别结果对应关系的步骤后,还包括以下步骤:
41、依据正确图片、及错误图片更正后的识别结果,对纸币序列号进行自动标定。
42、以及,一种纸币序列号自动标定系统,用于实现如上所述的基于自适应k值的k-means聚类算法的纸币序列号自动标定方法,所述自动标定系统包括:
43、图像采集及处理模块,用于处理纸币的原图片,以获取单字符图片;
44、k-means聚类算法模块,用于实现单字符特征提取、字符模板生成和模板匹配,以得到识别错误的单字符图片;
45、错误图片处理模块,用于更正识别错误的单字符图片;
46、序列号标定模块,用于实现纸币的序列号自动标定。
47、上述基于自适应k值的k-means聚类算法的纸币序列号自动标定方法及系统中,获取原图片后,将原图片切割为多个单字符图片,并建立原图片与多个单字符图片的对应关系,将从原图片的序列号中检错的任务转换为寻找单字符图片中的错误,只需按照识别结果对所有单字符图片分类,对每一类字符图片进行聚类处理,将复杂的问题简单化。然后,使用k-means聚类算法进行单字符图片的检错,能够快速将所有存在错误的图片筛选出来,并对筛查出来的错误图片,更正相应的识别结果。最后,按照更正后的识别结果进行序列号标定。所述自动标定方法中使用单字符检错取代序列号的一个长字符串的检错,将问题简化,通过聚类算法完成检错后,只需处理错误图片,提高了号码标定效率,减少了人工操作。本发明的方法简单,易于实现,成本低廉,便于推广。
1.一种基于自适应k值的k-means聚类算法的纸币序列号自动标定方法,其特征在于,所述方法包括以下步骤:
2.如权利要求1所述的基于自适应k值的k-means聚类算法的纸币序列号自动标定方法,其特征在于,所述步骤一,获取原图片和识别结果,获取单字符图片并保存,建立原图片与单字符图片的对应关系的步骤具体包括:
3.如权利要求2所述的基于自适应k值的k-means聚类算法的纸币序列号自动标定方法,其特征在于,所述原图片名称中包括币种名、面额版本、面向、币种代号、套别和识别结果,所述单字符图片名称中包括面额版本、面向、识别结果、位数和图片名称,其中,
4.如权利要求2所述的基于自适应k值的k-means聚类算法的纸币序列号自动标定方法,其特征在于,所述步骤1-1,采集并保存纸币图像,识别纸币序列号的步骤具体包括:
5.如权利要求4所述的基于自适应k值的k-means聚类算法的纸币序列号自动标定方法,其特征在于,所述步骤1-2,将原图片中的纸币序列号分割为单字符图片并保存的步骤具体包括:
6.如权利要求3所述的基于自适应k值的k-means聚类算法的纸币序列号自动标定方法,其特征在于,所述步骤二,提取单字符图片的特征值,以每类单字符图片的平均值为中心点,采用k-means聚类算法查找错误图像的步骤具体包括:
7.如权利要求6所述的基于自适应k值的k-means聚类算法的纸币序列号自动标定方法,其特征在于,所述步骤三,获得正确和错误的单字符图片后,依据识别结果与原图片名称对应关系,得到正确和错误的原图,建立正确原图、错误原图和识别结果对应关系的步骤具体包括:
8.如权利要求7所述的基于自适应k值的k-means聚类算法的纸币序列号自动标定方法,其特征在于,所述步骤3-3,依据错误图片的汇总文件中的内容,更正错误的识别结果中,对于错误图片的更正采用两种方法:
9.如权利要求1所述的基于自适应k值的k-means聚类算法的纸币序列号自动标定方法,其特征在于,所述步骤三,获得正确和错误的单字符图片后,依据识别结果与原图片名称对应关系,得到正确和错误的原图,建立正确原图、错误原图和识别结果对应关系的步骤后,还包括以下步骤:
10.一种纸币序列号自动标定系统,用于实现如权利要求1-9任一项所述的基于自适应k值的k-means聚类算法的纸币序列号自动标定方法,其特征在于,所述自动标定系统包括: