本公开涉及计算机视觉处理技术,尤其涉及一种基于图像识别的信息提示方法、装置、电子设备和计算机存储介质。
背景技术:
在相关技术中,可以采用防丢贴片来提示物体遗失,在具体实施时,可以将防丢贴片粘贴在物体上,然后利用终端的蓝牙技术感应防丢贴片,从而判断物体是否在终端的蓝牙感应范围内;然而,这种方案仅仅能提示物体是否超出蓝牙感应范围,功能较为单一,使用价值较低。
技术实现要素:
本公开实施例期望提供基于图像识别的信息提示的技术方案。
本公开实施例提供了一种基于图像识别的信息提示方法,所述方法包括:
获取包含目标对象的场景图像;
确定所述场景图像中所述目标对象的信息;
基于所述目标对象的信息,确定待提示信息;
在响应于用户的触发指令的情况下,根据待提示信息对所述用户进行信息提示。
在一些实施例中,所述目标对象的信息包括所述场景图像中所述目标对象的位置;
所述确定所述场景图像中所述目标对象的信息,包括:
对所述场景图像进行静态物体的检测,得到所述场景图像中的静态物体的检测框;对所述场景图像进行目标检测,得到所述场景图像中所述目标对象的检测框;
根据所述静态物体的检测框和所述目标对象的检测框在所述场景图像中的位置,确定所述目标对象相对于所述静态物体的位置;将所述目标对象相对于所述静态物体的位置作为:所述场景图像中目标对象的位置。
可以看出,由于静态物体可以反映环境信息,因而,通过确定目标对象相对于静态物体的位置,可以建立目标对象与环境之间的位置关系,从而,有利于准确得出目标对象的位置信息。
在一些实施例中,所述基于所述目标对象的信息,确定待提示信息,包括:
基于所述目标对象的信息,生成以下至少一种待提示信息:所述目标对象当前的位置信息、表征目标对象处于第一设定范围之外的预警信息。
可以看出,本公开实施例通过生成目标对象当前的位置,可以使用户确定目标对象的位置,或者可以使用户根据目标对象处于第一设定范围之外的提示信息及时寻找目标对象,从而有利于用户能够及时准确地寻找目标对象,与相关技术中仅仅能提示物体是否超出蓝牙感应范围的方案相比,本公开实施例的技术方案的使用价值更高。
在一些实施例中,所述目标对象的信息包括所述目标对象的位置变化信息,所述场景图像包括多帧图像;
所述确定所述场景图像中所述目标对象的信息,包括:对所述多帧图像的目标对象进行目标跟踪,确定所述目标对象的位置变化信息。
可以看出,本公开实施例可以通过目标跟踪确定目标对象的位置变化信息,因而,有利于准确获取目标对象的位置变化路径。
在一些实施例中,所述基于所述目标对象的信息,确定待提示信息,包括:
基于所述目标对象的信息,生成以下至少一种待提示信息:所述目标对象当前的位置信息、表征所述目标对象位置变化的路径信息、表征目标对象处于第一设定范围之外的预警信息。
可以看出,本公开实施例通过生成目标对象当前的位置和/或目标对象位置变化的路径信息,可以使用户确定目标对象的位置,或者可以使用户根据目标对象处于第一设定范围之外的提示信息及时寻找目标对象,从而有利于用户能够及时准确地寻找目标对象,与相关技术中仅仅能提示物体是否超出蓝牙感应范围的方案相比,本公开实施例的技术方案的使用价值更高。
在一些实施例中,所述基于所述目标对象的信息,确定待提示信息,包括:
基于所述目标对象的位置,对处于第二设定范围内的目标对象的数量进行统计,得到统计结果;
根据所述统计结果生成以下至少一种待提示信息:预警信息、所述目标对象的购买推荐信息。
可以看出,本公开实施例可以根据统计结果生成预警信息或所述目标对象的购买推荐信息,从而有利于根据预警信息进行后续针对性地处理,或者,有利于根据目标对象的购买推荐信息决策如何购买目标对象,提升了统计结果的使用价值。
在一些实施例中,获取终端的图像采集设备采集的人脸图像;对所述人脸图像进行人脸识别,确定所述人脸图像对应的身份信息;获取利用所述身份信息注册的目标对象。
这里,目标对象与身份信息之间的关系可以反映目标对象的归属用户,如此,本公开实施例通过对目标对象与用户的归属关系,确定用户注册的目标对象,从而针对用户注册的目标对象进行信息提示,在用户注册的目标对象为用户感兴趣的目标对象时,可以针对用户感兴趣的目标对象进行信息提示,进而可以更加符合实际需求。
本公开实施例还提供了一种基于图像识别的信息提示装置,所述装置包括:
获取模块,用于获取包含目标对象的场景图像;
第一处理模块,确定所述场景图像中所述目标对象的信息;
第二处理模块,基于所述目标对象的信息,确定待提示信息;在响应于用户的触发指令的情况下,根据待提示信息对所述用户进行信息提示。。
本公开实施例还提供了一种电子设备,包括处理器和用于存储能够在处理器上运行的计算机程序的存储器;其中,
所述处理器用于运行所述计算机程序以执行上述任意一种信息提示方法。
本公开实施例还提供了一种计算机存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任意一种信息提示方法。
本公开实施例提出的基于图像识别的信息提示方法、装置、电子设备和计算机存储介质中,获取包含目标对象的场景图像;确定所述场景图像中所述目标对象的信息;基于所述目标对象的信息,确定待提示信息;在响应于用户的触发指令的情况下,根据待提示信息对所述用户进行信息提示。
可以看出,本公开实施例中,可以通过对场景图像进行处理,得到场景图像中目标对象的信息,并且可以根据用户的触发指令进行信息提示,因而,与相关技术中仅仅能提示物体是否超出蓝牙感应范围的方案相比,本公开实施例通过进行图像分析并进行信息提示,有利于获取关于目标对象的更多信息。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。
图1为本公开实施例的基于图像识别的信息提示方法的流程图;
图2为本公开实施例中与计算机设备进行交互的一种界面示意图;
图3为本公开实施例中与计算机设备进行交互的另一种界面示意图;
图4为本公开实施例中建立位置关系模型的示意图;
图5为本公开实施例和采用防丢贴片来提示物体遗失的方案的效果对比示意图;
图6为本公开实施例的基于图像识别的信息提示装置的结构示意图;
图7为本公开实施例的电子设备的结构示意图。
具体实施方式
以下结合附图及实施例,对本公开进行进一步详细说明。应当理解,此处所提供的实施例仅仅用以解释本公开,并不用于限定本公开。另外,以下所提供的实施例是用于实施本公开的部分实施例,而非提供实施本公开的全部实施例,在不冲突的情况下,本公开实施例记载的技术方案可以任意组合的方式实施。
需要说明的是,在本公开实施例中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的方法或者装置不仅包括所明确记载的要素,而且还包括没有明确列出的其他要素,或者是还包括为实施方法或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括该要素的方法或者装置中还存在另外的相关要素(例如方法中的步骤或者装置中的单元,例如的单元可以是部分电路、部分处理器、部分程序或软件等等)。
例如,本公开实施例提供的基于图像识别的信息提示方法包含了一系列的步骤,但是本公开实施例提供的基于图像识别的信息提示方法不限于所记载的步骤,同样地,本公开实施例提供的基于图像识别的信息提示装置包括了一系列模块,但是本公开实施例提供的装置不限于包括所明确记载的模块,还可以包括为获取相关信息、或基于信息进行处理时所需要设置的模块。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括a、b、c中的至少一种,可以表示包括从a、b和c构成的集合中选择的任意一个或多个元素。
本公开实施例的应用场景中,可以利用图像采集设备采集图像,图像采集设备可以将采集到的图像发送到计算机设备中,然后,可以利用计算机设备对图像进行识别,得到图像识别结果,然后基于图像识别结果进行信息提示。这里,图像采集设备可以是摄像头、抓拍机等设备,本公开实施例中,并不对图像采集设备和计算机设备的数量进行限定。
本公开实施例可以应用于计算机设备中;计算机设备可以是采用人工智能(artificialintelligence,ai)技术的智能设备;在一些实施例中,上述计算机设备可以包括边缘计算节点和/或服务器,边缘计算节点可以是基于微处理器的系统、个人电脑、小型计算机系统,等等,服务器可以是服务器计算机系统、小型计算机系统﹑大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。
边缘计算节点、服务器等设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
本公开实施例提出了一种基于图像识别的信息提示方法,可以适用于个人、家庭、企业、政府机构、移动区域等各类消费人群、场景和客户。
图1为本公开实施例的基于图像识别的信息提示方法的流程图,如图1所示,该流程可以包括:
步骤101:获取包含目标对象的场景图像。
本公开的一些实施例中,可以至少一个图像采集设备采集包含目标对象的场景图像。
本公开实施例中,图像采集设备可以是个人或家庭的摄像头,也可以是公共区域的摄像头;图像采集设备均可以通过无线连接方式或有线连接方式与计算机设备形成通讯连接。
在一些实施例中,可以将上述至少一个图像采集设备设置于固定位置,利用处于固定位置的图像采集设备采集场景图像;在另一些实施例中,图像采集设备的位置的拍摄角度可以根据实际需求进行更改,即,可以移动图像采集设备和/或更改图像采集设备的拍摄角度,使图像采集设备的拍摄范围发生更改。
在一些实施例中,场景图像可以包括当前时刻采集的图像,在这种情况下,图像采集设备可以将当前时刻采集的场景图像实时发送至计算机设备中,在一些实施例中,场景图像可以包括图像采集设备采集的历史图像,此时,图像采集设备可以将历史图像发送至计算机设备中。
在一些实施例中,图像采集设备在向计算机设备发送场景图像的同时,可以向计算机设备发送场景图像的图像采集时间;示例性地,图像采集设备可以在场景图像中添加时间标记信息,以标记场景图像的图像采集时间,这样,图像采集设备可以向计算机设备发送添加时间标记信息的场景图像。
在一些实施例中,在计算机设备获取场景图像后,可以存储该场景图像,即,可以将场景图像存储在边缘计算节点和/或服务器中,以便于后续使用。
本公开实施例中,目标对象可以是图像采集设备的拍摄范围内的任意物体,目标对象可以是静止物体,也可以是位置发生变化的可移动物体,本公开实施例并不对目标对象的种类、大小等进行限定。
本公开实施例中,目标对象的数量可以是一个,也可以是多个;对于多个目标对象中的每个目标对象,均可以进行目标识别,从而确定场景图像中每个目标对象的位置等信息。
步骤102:确定场景图像中目标对象的信息。
本公开实施例中,目标对象的信息可以包括以下至少之一:位置信息、位置变化信息、数量信息。
在一些实施例中,可以通过对场景图像进行目标检测,从而确定场景图像中目标对象的信息。
在一些实施例中,在计算机设备中,可以预先训练目标对象的检测模型,目标对象的检测模型用于从场景图像中检测目标对象;在得到训练完成的检测模型后,可以将场景图像输入至目标对象的检测模型,利用目标对象的检测模型对场景图像进行处理,得到检测结果;如果检测结果中包括目标对象的检测框,则说明场景图像中包含目标对象,如果检测结果中不包括目标对象的检测框,则说明场景图像中不包含目标对象。
本公开实施例并不对目标对象的检测模型的网络结构进行限定,目标对象的检测模型的网络结构可以是两阶段检测网络结构,例如,目标对象的检测模型的网络结构为快速区域卷积神经网络(faster-regionswithconvolutionalneuralnetwork,fasterrcnn)等;目标对象的检测模型的网络结构也可以是单阶段检测网络结构,例如,目标对象的检测模型的网络结构为retinanet等。
示例性地,在目标对象包括钥匙时,可以预先训练钥匙检测模型,在得到训练完成的钥匙检测模型后,可以利用训练完成的钥匙检测模型对场景图像进行处理,得到检测结果,如果检测结果中包括钥匙的检测框,则可以确定场景图像中包含钥匙的图像,如果检测结果中不包括钥匙的检测框,则说明场景图像中不包含钥匙图像。
本公开实施例中,在得到目标对象的检测框后,可以将检测框的位置作为场景图像中目标对象的位置。
在一些实施例中,在计算机设备接收到当前时刻采集的场景图像的情况下,可以确定当前时刻场景图像中目标对象的位置;在一些实施例中,在场景图像包括图像采集设备采集的历史图像,且计算机设备接收到历史图像的图像采集时间时,计算机设备可以确定目标对象在历史图像的采集时刻在历史图像中的位置。
在一些实施例中,在计算机设备接收的多幅场景图像均包含目标对象的检测框时,可以基于多幅场景图像的图像采集时间,确定目标对象的多个位置与时间的对应关系;示例性地,在目标对象的多个位置包括不同位置时,可以确定目标对象的位置变化路径。
在一些实施例中,可以根据一个场景图像包含多个目标对象的检测框时,可以根据检测框的数量,确定场景图像中目标对象的数量。
步骤103:基于目标对象的信息,确定待提示信息。
本公开实施例中,待提示信息可以是目标对象的信息,也可以是对目标对象的信息进行处理后得到的信息,例如,可以在目标对象的数量较少时,生成购买推荐信息或告警信息,该购买推荐信息或告警信息为上述待提示信息。
步骤104:在响应于用户的触发指令的情况下,根据待提示信息对用户进行信息提示。
本公开实施例中,触发指令用于请求针对目标对象进行信息提示;用户的触发指令可以是用户通过人机交互方式向计算机设备输入的指令;在一些实施例中,触发指令可以是语音指令、文字输入指令、触摸操作指令等。
在一些实施例中,计算机设备在确定待提示信息后,可以在计算机设备的显示界面展示待提示信息,也可以通过语音或其它方式进行信息提示。
可以看出,本公开实施例可以根据触发指令对用户进行信息提示,即,通过人机交互方式方便地获取到目标对象的信息。
在一些实施例中,计算机设备可以是手机或其它智能硬件,用户可以通过语音交互向计算机设备输入触发指令,示例性地,计算机设备可以通过语音识别确定接收到的指令的内容。
在一些实施例中,计算机设备在接收触发指令后,可以生成位置提示信息,并将位置提示信息通过图像和/或文字展示。
参照图2,在计算机设备接收的“我的蓝色卡包在哪里”的文字信息后,计算机设备可以将蓝色卡包的位置通过图像和文字显示。
在一些实施例中,计算机设备在接收触发指令后,可以生成目标对象的数据分析结果,并将数据分析结果通过图像和/或文字展示。
在一些实施例中,上述数据分析结果可以包括根据目标对象的数量统计结果生成的预警信息或目标对象的购买推荐信息。
参照图3,在计算机设备接收的“餐巾纸哪里还有”的语音信息后,计算机设备的显示界面可以显示“餐巾纸家里没有了哦,需要购买了”的文字信息,并且,计算机设备的显示界面还可以显示购买推荐信息,图3中的购买推荐信息包括购买链接和相应的餐巾纸图像。
本公开实施例通过图像采集设备和计算机设备,并采用目标检测等方式,对处于拍摄范围内的目标对象进行信息分析,并可以通过用户与计算机设备的人机交互,实现针对目标对象的信息提示。
在实际应用中,步骤101至步骤104可以利用上述计算机设备中的处理器实现,上述处理器可以为特定用途集成电路(applicationspecificintegratedcircuit,asic)、数字信号处理器(digitalsignalprocessor,dsp)、数字信号处理装置(digitalsignalprocessingdevice,dspd)、可编程逻辑装置(programmablelogicdevice,pld)、现场可编程门阵列(field-programmablegatearray,fpga)、中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器中的至少一种。
可以看出,本公开实施例中,可以通过对场景图像进行处理,得到场景图像中目标对象的信息,并且可以根据用户的触发指令进行信息提示,因而,与相关技术中仅仅能提示物体是否超出蓝牙感应范围的方案相比,本公开实施例通过进行图像分析并进行信息提示,有利于获取关于目标对象的更多信息。
在一些实施例中,可以获取终端的图像采集设备采集的人脸图像;对人脸图像进行人脸识别,确定人脸图像对应的身份信息;获取利用身份信息注册的目标对象。
本公开实施例中,在采集到人脸图像后,可以采用训练完成的人脸识别模型对人脸图像进行人脸识别,从而确定相应的身份信息;在人脸图像对应的身份信息后,该身份信息对应的用户可以通过人机交互在终端注册目标对象,即,通过用户注册可以确定用户感兴趣的目标对象。
示例性地,用户感兴趣的目标对象可以是钻戒、手机等物体。
示例性地,终端可以与上述计算机设备进行通信,以获取待提示信息。
这里,目标对象与身份信息之间的关系可以反映目标对象的归属用户,如此,本公开实施例通过对目标对象与用户的归属关系,确定用户注册的目标对象,从而针对用户注册的目标对象进行信息提示,在用户注册的目标对象为用户感兴趣的目标对象时,可以针对用户感兴趣的目标对象进行信息提示,进而可以更加符合实际需求。
在一些实施例中,目标对象的信息包括场景图像中目标对象的位置。相应地,确定场景图像中目标对象的信息,可以包括:
对所述场景图像进行静态物体的检测,得到场景图像中的静态物体的检测框;对场景图像进行目标检测,得到场景图像中目标对象的检测框;
根据静态物体的检测框和目标对象的检测框在场景图像中的位置,确定目标对象相对于所述静态物体的位置;将目标对象相对于静态物体的位置作为:场景图像中目标对象的位置。
本公开实施例中,静态物体可以是预先设定的反应环境信息的物体,例如,静态物体可以是衣柜、办公桌、沙发等,在通常情况下,静态物体的位置不发生变化。
在一些实施例中,在计算机设备中,可以预先训练静态物体的检测模型,静态物体的检测模型用于从场景图像中检测静态物体;在得到训练完成的静态物体的检测模型后,可以将场景图像输入至静态物体的检测模型,利用静态物体的检测模型对场景图像进行处理,得到静态物体的检测框。
可以看出,由于静态物体可以反映环境信息,因而,通过确定目标对象相对于静态物体的位置,可以建立目标对象与环境之间的位置关系,从而,有利于准确得出目标对象的位置信息。
在一些实施例中,在目标对象的信息包括场景图像中目标对象的位置的情况下,基于目标对象的信息,确定待提示信息,可以包括:基于目标对象的信息,生成以下至少一种待提示信息:目标对象当前的位置信息、表征目标对象处于第一设定范围之外的预警信息。
在一些实施例中,第一设定范围可以是根据实际需求确定的空间范围,例如,第一设定范围可以是办公室内空间、车辆内部空间等等。
在另一些实施例中,第一设定范围可以是以参考对象为中心的设定距离范围,这里,参考对象可以是静止物体、人体或可移动的物体,对场景图像中参考对象的检测方式可以参照步骤102中对目标对象的检测方式,这里不再赘述。
需要说明的是,上述记载的内容仅仅是对第一设定范围的示例性说明,本公开实施例对此并不进行限定。
在一个示例中,目标对象为身份证,这样,可以根据位置提示信息,确定身份证当前的位置的信息,有利于及时寻找到身份证;在另一个示例中,目标对象为钥匙,参考对象为人体f,在钥匙与人体f的距离超过设定距离范围时,可以生成提示信息,以提示钥匙处于远离人体f的位置。
可以看出,本公开实施例通过生成目标对象当前的位置,可以使用户确定目标对象的位置,或者可以使用户根据目标对象处于第一设定范围之外的提示信息及时寻找目标对象,从而有利于用户能够及时准确地寻找目标对象,与相关技术中仅仅能提示物体是否超出蓝牙感应范围的方案相比,本公开实施例的技术方案的使用价值更高。
在一些实施例中,目标对象的信息包括目标对象的位置变化信息,场景图像包括多帧图像;相应地,确定所述场景图像中目标对象的信息,可以包括:对多帧图像的目标对象进行目标跟踪,确定目标对象的位置变化信息。
示例性地,上述多帧图像可以是不连续的图像,也可以是连续的多帧图像;在场景图像包括连续的多帧图像时,可以及时准确地对目标对象进行跟踪。
可以看出,本公开实施例可以通过目标跟踪确定目标对象的位置变化信息,因而,有利于准确获取目标对象的位置变化路径。
在一些实施例中,基于所述目标对象的信息,确定待提示信息,可以包括:基于目标对象的信息,生成以下至少一种待提示信息:目标对象当前的位置信息、表征目标对象位置变化的路径信息、表征目标对象处于第一设定范围之外的预警信息。
可以看出,本公开实施例通过生成目标对象当前的位置和/或目标对象位置变化的路径信息,可以使用户确定目标对象的位置,或者可以使用户根据目标对象处于第一设定范围之外的提示信息及时寻找目标对象,从而有利于用户能够及时准确地寻找目标对象,与相关技术中仅仅能提示物体是否超出蓝牙感应范围的方案相比,本公开实施例的技术方案的使用价值更高。
参照图4,在一些实施例中,可以通过目标检测和目标跟踪确定图像中的动态物体,通过人脸识别确定图像中的人脸的身份信息,通过静态物体的检测确定图像中的静态物体,然后,可以利用身份信息注册目标对象,确定目标对象与归属者的归属关系;在一些实施例中,还可以对身份信息对应的人体与静态物体的位置进行分析,并对目标对象与静态物体的位置进行分析,从而建立目标对象、归属者的人体、以及静态物体之间的位置关系模型。例如,在在居家场景下,可以针对遥控器、家庭环境、以及家庭成员建立位置关系模型。
在采用防丢贴片来提示物体遗失的技术方案中,并未建立动态物体、环境以及归属者之间的关系,而在本公开实施例中,通过建立上述位置关系模型,可以准确分析目标对象、静态物体与人体之间的位置关系,进而,有利于得到关于目标对象的更多信息。
在一些实施例中,上述基于所述目标对象的信息,确定待提示信息,可以包括:基于目标对象的位置,对处于第二设定范围内的目标对象的数量进行统计,得到统计结果;根据统计结果生成以下至少一种待提示信息:预警信息、目标对象的购买推荐信息。
本公开实施例中,第二设定范围表示根据实际需求确定的空间范围,例如,第二设定范围可以是仓库的空间范围。统计结果表示对目标对象进行数据分析得到的数据分析结果。
在一些实施例中,可以根据目标对象的位置,判断目标对象是否处于第二设定范围内,进而可以确定出处于第二设定范围内的目标对象的数量。
在一些实施例中,通过不断地对处于第二设定范围内的目标对象的数量进行统计,可以确定第一设定时长内进入第二设定范围的目标对象的数量进行统计,也可以对第二设定时长内离开第二设定范围的目标对象的数量进行统计,这里,第一设定时长和第二设定时长均可以根据实际需求设置,第一设定时长与第二设定时长可以相同,也可以不同。
示例性地,可以对5天内进入药品仓储库的特定类型的药品的数量进行统计,或者,可以对6天内离开药品仓储库的特定类型的药品的数量进行统计。
在一些实施例中,计算机设备在得到统计结果后,可以在计算机设备的显示界面展示统计结果,也可以通过语音播报方式播报统计结果,这样,有利于用户直观地获取关于目标对象的统计结果。
示例性地,可以在处于第二设定范围内的目标对象的数量小于第一设定值,或者在处于第二设定范围内的目标对象的数量大于第二设定值时,生成预警信息;本公开实施例中,第一设定值、第二设定值和设定数值范围可以根据实际需求确定。
在一个示例中,目标对象为药品d,第二设定范围为药品仓储库,在当前时刻处于药品仓储库内的药品d的数量小于10时,可以生成预警信息;在另一个示例中,目标对象为危险品e,第二设定范围为危险品仓库,在当前时刻处于危险品仓库的危险品e的数量大于50时,可以生成预警信息。
示例性地,在处于第二设定范围内的目标对象的数量小于第三设定值时,生成目标对象的购买推荐信息;本公开实施例中,第三设定值可以根据实际需求确定。
在一个示例中,目标对象为药品g,第二设定范围为药品仓储库,在当前时刻处于药品仓储库内的药品g的数量小于15时,可以生成药品g的购买推荐信息。
本公开实施例中,购买推荐信息可以包括目标对象的购买数量、目标对象的购买平台、推荐购买的目标对象的品牌等;在一些实施例中,在处于第二设定范围内的目标对象的数量小于第三设定值时,可以生成目标对象的购买推荐信息。
可以看出,本公开实施例可以根据统计结果生成预警信息或所述目标对象的购买推荐信息,从而有利于根据预警信息进行后续针对性地处理,或者,有利于根据目标对象的购买推荐信息决策如何购买目标对象,提升了统计结果的使用价值。
下面通过图5对本公开实施例的技术效果进行示例性说明。图5中,方案1为上述采用防丢贴片来提示物体遗失的方案,方案1实现的功能较为单一,即,仅能提示物体是否超出蓝牙感应范围;方案1仅支持一对一地对物体进行感应,感应范围为5m的蓝牙感应范围,感应范围较小;实现方案1的硬件成本较高,并且使用时需要在手机等终端上进行复杂繁琐的操作;进一步地,由于需要不断进行蓝牙搜索,在一定程度上增加了终端的耗电。
与方案1相比,本公开实施例的技术方案可以实现目标对象的查找、针对目标对象的预警、以及生成购买推荐信息等功能,即,可以实现更多的功能。本公开实施例可以实现一个计算机设备对多个目标对象的图像的处理,例如,可以实现对多个目标的查找;本公开实施例的技术方案的物品查找范围为图像采集设备的拍摄范围,物品查找范围较广;本公开实施例中,图像采集设备可以复用已有的图像采集设备,因而,与采用防丢贴片来提示物体遗失的方案相比,降低了使用成本;本公开实施例的技术方案可以通过语音输入和图像展示实现人机交互,操作简单方便;并且,由于无需开启蓝牙感应功能,在一定程度上可以降低终端的功耗。
本公开实施例可以提示物体位置,有利于用户寻找物体;可以在企业工作场景中,实现仓储、医院的库存盘点、物体计数、出入库统计、物体跟踪等功能,可以实现安全检测场景中的药物跟踪、配药提醒、危险化学品追踪等功能,可以实现商场内的物体导购、物体预警等功能。
在一个示例性的场景中,小明现在需要出差但是找不到护照,此时,可以向终端输入语音信息“我的护照在哪里?”,终端可以生成以下信息:在客厅电视机下面的第二个抽屉里。
在另一个示例性的场景中,用户h找不到凳子,此时无需通过摄像头寻找,而是可以通过计算机设备查找凳子的位置变化路径,从而降低了用户h的工作量。
在一些实施例中,本公开实施例的基于图像识别的信息提示方法可以通过软件开发工具包软件包(softwaredevelopmentkit,sdk)或手机软件(application,app)的形式进行封装。
在一些场景中,用户可以直接在终端上安装上述app,从而结合终端的摄像头,可以按照本公开实施例的信息提示方法实现信息提示等功能;已有相关摄像头(非终端的摄像头)的其他用户同样可以使用上述app;智能厂商同样可以通过使用上述app,实现智能硬件的功能拓展,智能硬件可以是智能手表、智能眼镜、智能机器人、车机端设备等。
可以看出,结合已有摄像头,直接使用软件便可以实现本公开实施例的图像处理方法,有利于节约成本。
在一些场景中,可以将上述sdk与摄像头进行组合,或者,将上述app与摄像头进行组合,得到第一组合产品;示例性地,个人家庭可以使用该第一组合产品,对固定区域(摄像头拍摄范围)的图像按照本公开实施例的信息提示方法进行处理;小型企业可以使用第一组合产品,对单一地点或库存的图像按照本公开实施例的信息提示方法进行处理;飞机、邮轮、汽车等移动端设备可以使用第一组合产品,按照本公开实施例的信息提示方法进行处理。
在一些场景中,可以将上述sdk、摄像头和服务器进行组合,或者,将上述app、摄像头和服务器进行组合,得到第二组合产品;在重点区域、企业物流、库管、药房、机场、酒店等场景中,可以使用第二组合产品,以按照本公开实施例的信息提示方法进行处理;第二组合产品的使用场景可以是多摄像头联动的场景。
可以看出,本公开实施例根据不同的场景灵活地使用不同的产品,这些产品可以仅仅是软件产品,也可以是第一组合产品或第二组合产品,产品的安装以及与已有的产品的结合较为方便,有利于结合现有产品实现本公开实施例的技术方案。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
在前述实施例提出的基于图像识别的信息提示方法的基础上,本公开实施例提出了一种基于图像识别的信息提示装置。
图6为本公开实施例的基于图像识别的信息提示装置的组成结构示意图,如图6所示,该装置可以包括获取模块600、第一处理模块601和第二处理模块602,其中,
获取模块600,用于获取包含目标对象的场景图像;
第一处理模块601,确定所述场景图像中所述目标对象的信息;
第二处理模块602,基于所述目标对象的信息,确定待提示信息;在响应于用户的触发指令的情况下,根据待提示信息对所述用户进行信息提示。。
在一些实施例中,所述目标对象的信息包括所述场景图像中所述目标对象的位置;
所述第一处理模块601,用于确定所述场景图像中所述目标对象的信息,包括:
对所述场景图像进行静态物体的检测,得到所述场景图像中的静态物体的检测框;对所述场景图像进行目标检测,得到所述场景图像中所述目标对象的检测框;
根据所述静态物体的检测框和所述目标对象的检测框在所述场景图像中的位置,确定所述目标对象相对于所述静态物体的位置;将所述目标对象相对于所述静态物体的位置作为:所述场景图像中目标对象的位置。
在一些实施例中,所述第二处理模块602,用于基于所述目标对象的信息,确定待提示信息,包括:
基于所述目标对象的信息,生成以下至少一种待提示信息:所述目标对象当前的位置信息、表征目标对象处于第一设定范围之外的预警信息。
在一些实施例中,所述目标对象的信息包括所述目标对象的位置变化信息,所述场景图像包括多帧图像;
所述第一处理模块601,用于确定所述场景图像中所述目标对象的信息,包括:对所述多帧图像的目标对象进行目标跟踪,确定所述目标对象的位置变化信息。
在一些实施例中,所述第二处理模块602,用于基于所述目标对象的信息,确定待提示信息,包括:
基于所述目标对象的信息,生成以下至少一种待提示信息:所述目标对象当前的位置信息、表征所述目标对象位置变化的路径信息、表征目标对象处于第一设定范围之外的预警信息。
在一些实施例中,所述第二处理模块602,用于基于所述目标对象的信息,确定待提示信息,包括:
基于所述目标对象的位置,对处于第二设定范围内的目标对象的数量进行统计,得到统计结果;
根据所述统计结果生成以下至少一种待提示信息:预警信息、所述目标对象的购买推荐信息。
在一些实施例中,所述第一处理模块601,还用于:获取终端的图像采集设备采集的人脸图像;对所述人脸图像进行人脸识别,确定所述人脸图像对应的身份信息;获取利用所述身份信息注册的目标对象。
实际应用中,获取模块600、第一处理模块601和第二处理模块602均可以利用计算机设备中的处理器实现,上述处理器可以为asic、dsp、dspd、pld、fpga、cpu、控制器、微控制器、微处理器中的至少一种。
另外,在本实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
所述集成的单元如果以软件功能模块的形式实现并非作为独立的产品进行销售或使用时,可以存储在一个计算机可读取存储介质中,基于这样的理解,本实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或processor(处理器)执行本实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(readonlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
具体来讲,本实施例中的一种基于图像识别的信息提示方法对应的计算机程序指令可以被存储在光盘,硬盘,u盘等存储介质上,当存储介质中的与一种基于图像识别的信息提示方法对应的计算机程序指令被一电子设备读取或被执行时,实现前述实施例的任意一种基于图像识别的信息提示方法。
基于前述实施例相同的技术构思,参见图7,其示出了本公开实施例提供的一种电子设备70,可以包括:存储器701和处理器702;其中,
所述存储器701,用于存储计算机程序和数据;
所述处理器702,用于执行所述存储器中存储的计算机程序,以实现前述实施例的任意一种基于图像识别的信息提示方法。
在实际应用中,上述存储器701可以是易失性存储器(volatilememory),例如ram;或者非易失性存储器(non-volatilememory),例如rom,快闪存储器(flashmemory),硬盘(harddiskdrive,hdd)或固态硬盘(solid-statedrive,ssd);或者上述种类的存储器的组合,并向处理器702提供指令和数据。
上述处理器702可以为asic、dsp、dspd、pld、fpga、cpu、控制器、微控制器、微处理器中的至少一种。可以理解地,对于不同的设备,用于实现上述处理器功能的电子器件还可以为其它,本公开实施例不作具体限定。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述
本申请所提供的各方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。
本申请所提供的各产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。
本申请所提供的各方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
1.一种基于图像识别的信息提示方法,其特征在于,所述方法包括:
获取包含目标对象的场景图像;
确定所述场景图像中所述目标对象的信息;
基于所述目标对象的信息,确定待提示信息;
在响应于用户的触发指令的情况下,根据待提示信息对所述用户进行信息提示。
2.根据权利要求1所述的方法,其特征在于,所述目标对象的信息包括所述场景图像中所述目标对象的位置;
所述确定所述场景图像中所述目标对象的信息,包括:
对所述场景图像进行静态物体的检测,得到所述场景图像中的静态物体的检测框;对所述场景图像进行目标检测,得到所述场景图像中所述目标对象的检测框;
根据所述静态物体的检测框和所述目标对象的检测框在所述场景图像中的位置,确定所述目标对象相对于所述静态物体的位置;将所述目标对象相对于所述静态物体的位置作为:所述场景图像中目标对象的位置。
3.根据权利要求2所述的方法,其特征在于,所述基于所述目标对象的信息,确定待提示信息,包括:
基于所述目标对象的信息,生成以下至少一种待提示信息:所述目标对象当前的位置信息、表征目标对象处于第一设定范围之外的预警信息。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述目标对象的信息包括所述目标对象的位置变化信息,所述场景图像包括多帧图像;
所述确定所述场景图像中所述目标对象的信息,包括:对所述多帧图像的目标对象进行目标跟踪,确定所述目标对象的位置变化信息。
5.根据权利要求4所述的方法,其特征在于,所述基于所述目标对象的信息,确定待提示信息,包括:
基于所述目标对象的信息,生成以下至少一种待提示信息:所述目标对象当前的位置信息、表征所述目标对象位置变化的路径信息、表征目标对象处于第一设定范围之外的预警信息。
6.根据权利要求2或4所述的方法,其特征在于,所述基于所述目标对象的信息,确定待提示信息,包括:
基于所述目标对象的位置,对处于第二设定范围内的目标对象的数量进行统计,得到统计结果;
根据所述统计结果生成以下至少一种待提示信息:预警信息、所述目标对象的购买推荐信息。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述方法还包括:获取终端的图像采集设备采集的人脸图像;对所述人脸图像进行人脸识别,确定所述人脸图像对应的身份信息;获取利用所述身份信息注册的目标对象。
8.一种基于图像识别的信息提示装置,其特征在于,所述装置包括:
获取模块,用于获取包含目标对象的场景图像;
第一处理模块,确定所述场景图像中所述目标对象的信息;
第二处理模块,基于所述目标对象的信息,确定待提示信息;在响应于用户的触发指令的情况下,根据待提示信息对所述用户进行信息提示。
9.一种电子设备,其特征在于,包括处理器和用于存储能够在处理器上运行的计算机程序的存储器;其中,
所述处理器用于运行所述计算机程序以执行权利要求1至7任一项所述的方法。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7任一项所述的方法。
技术总结