1.本发明涉及计算机信息处理领域,具体而言,涉及一种基于催收标签的接入设备鉴别方法、装置和计算机设备。
背景技术:
2.风险预测是对风险的量化,是风险管理的关键性技术。目前一般通过建模的方式进行风险鉴别,在模型的建立过程中,主要有数据抽取、特征生成、特征选取、算法模型生成和合理性评估等步骤。
3.在现有技术中,设备风险预测主要的目的是如何区分出好客户和坏客户,评估用户的风险情况,以降低信用风险,并实现利润最大化。在通常情况下,有些设备可能是无风险设备,但一旦存在市场风险时,无风险设备会跟随所关联用户从优质用户转变为风险用户而转变为风险设备,在这种情况下,会给资源管理平台造成一定资源损失。此外,在特定用户群或用户关联设备的风险预测、模型参数估计、模型计算精度、数据更新方面仍存在很大改进空间。
4.因此,有必要提供一种基于催收标签的接入设备鉴别方法,以解决上述问题。
技术实现要素:
5.为了解决以下问题:可靠保证资源管理平台的收支平衡,有效避免特定用户群的资源回收额对整体资源分配与回收的使用过程的影响,降低用户误拒的问题,精确量化用户关联设备的风险大小,同时对新接入设备进行风险鉴别,提升用户体验,以及减少资源管理平台的损失。
6.本发明的第一方面提供了一种基于催收标签的接入设备鉴别方法,包括:根据预定筛选规则,筛选特定用户群;计算所述特定用户群的评估指标,根据所述评估指标生成催收标签,并构建基于所述催收标签的设备风险预测模型;使用训练好的设备风险预测模型对新接入设备进行风险鉴别。
7.根据本发明的可选实施方式,所述计算所述特定用户群的评估指标,根据所述评估指标生成催收标签包括:使用自资源归还时间点起特定时间段内的资源回收率,作为催收标签值,并确定好样本和坏样本,以建立训练数据集。
8.根据本发明的可选实施方式,包括:通过下式计算评估指标,所述评估指标为资源回收率:
[0009][0010]
其中,所述资源回收率是指自资源归还时间点起特定时间段内互联网服务资源额可回收额与资源入催额的比率;所述x天内回收额是指执行催收策略了并在自资源归还时间点起特定时间内(即x天内)用户归还资源的互联网服务资源额;所述资源入催额是指在资源归还时间点未归还的互联网服务资源额。
[0011]
根据本发明的可选实施方式,包括:通过下式计算评估指标,所述评估指标为资源回收率:
[0012][0013]
其中,所述资源回收率是指自资源归还时间点起特定时间段内互联网服务资源额可回收额与资源入催额的比率;所述(x 1)天后仍未回收额是指执行了催收策略并在自资源归还时间点起特定时间加一天之后用户仍未归还的互联网服务资源额;所述资源入催额是指在资源归还时间点未归还的互联网服务资源额。
[0014]
根据本发明的可选实施方式,包括:获取历史用户的互联网服务资源额度、资源服务时间和资源入催时间,计算所述资源入催额。
[0015]
根据本发明的可选实施方式,所述根据预定筛选规则,筛选特定用户群包括:所述预定筛选规则包括配置时间参数和资源回收率阈值,该时间参数为自资源归还时间起特定时间内;将自资源归还时间起特定时间内用户归还了资源且大于资源回收率阈值的用户筛选出,则该用户属于所述特定用户群,所述特定用户群用于表征指在市场风险因素影响下资源归还风险增加的特定群体。
[0016]
根据本发明的可选实施方式,所述使用训练好的设备风险预测模型对新接入设备进行风险鉴别包括:使用所述设备风险预测模型,计算所述新接入设备的预测值;将所计算的预测值与设定阈值进行比较,在所计算的预测值小于等于设定阈值时,确定向所述新接入设备提供互联网服务资源;在所计算的预测值大于设定阈值时,确定不向所述新接入设备提供互联网服务资源。
[0017]
此外,本发明的第二方面提供了一种基于催收标签的接入设备鉴别装置,包括:筛选模块,根据预定筛选规则,筛选特定用户群;计算模块,用于计算所述特定用户群的评估指标,根据所述评估指标生成催收标签,并构建基于所述催收标签的设备风险预测模型;预测模块,用于使用训练好的设备风险预测模型对新接入设备进行风险鉴别。
[0018]
此外,本发明的第三方面提供了一种计算机设备,包括处理器和存储器,所述存储器用于存储计算机可执行程序,当所述计算机程序被所述处理器执行时,所述处理器执行如本发明的第一方面所述的基于催收标签的接入设备鉴别方法。
[0019]
此外,本发明的第四方面提供了一种计算机程序产品,存储有计算机可执行程序,所述计算机可执行程序被执行时,实现如本发明的第一方面所述的基于催收标签的接入设备鉴别方法。
[0020]
有益效果
[0021]
与现有技术相比,本发明通过预定筛选规则进行用户筛选,能够精确地筛选出属于特定用户群的用户,并能够精确确定与特定用户群的用户相对应的用户关联设备;通过计算所述特定用户群的评估指标,生成用于表征用户关联设备的风险大小的催收标签,并构建基于所述催收标签的设备风险预测模型,通过该设备风险预测模型进行新接入设备的风险计算,能够更精确量化新接入设备的风险情况,能够有效识别新接入设备是否为风险设备。
[0022]
进一步地,通过对新接入设备的关联用户执行劣质用户数量的判断步骤,能够更
精确地确定出风险设备;通过调整所述设备风险预测模型中的模型参数,能够优化模型参数,能够提高模型认证精度,还能够优化设备风险预测模型的构建过程;通过执行催收策略,能够有效确保特定用户群中用户的资源归还。
附图说明
[0023]
为了使本发明所解决的技术问题、采用的技术手段及取得的技术效果更加清楚,下面将参照附图详细描述本发明的具体实施例。但需声明的是,下面描述的附图仅仅是本发明本发明示例性实施例的附图,对于本领域的技术人员来讲,在不付出创造性劳动的前提下,可以根据这些附图获得其他实施例的附图。
[0024]
图1是本发明的实施例1的基于催收标签的接入设备鉴别方法的一示例的流程图。
[0025]
图2是本发明的实施例1的基于催收标签的接入设备鉴别方法的另一示例的流程图。
[0026]
图3是本发明的实施例1的基于催收标签的接入设备鉴别方法的又一示例的流程图。
[0027]
图4是本发明的实施例2的基于催收标签的接入设备鉴别装置的一示例的示意图。
[0028]
图5是本发明的实施例2的基于催收标签的接入设备鉴别装置的另一示例的示意图。
[0029]
图6是本发明的实施例2的基于催收标签的接入设备鉴别装置的又一示例的示意图。
[0030]
图7是本发明的实施例2的基于催收标签的接入设备鉴别装置的又一示例的示意图。
[0031]
图8是根据本发明的计算机设备的示例性实施例的结构框图。
[0032]
图9是根据本发明的计算机程序产品的示例性实施例的结构框图。
具体实施方式
[0033]
现在将参考附图更全面地描述本发明的示例性实施例。然而,示例性实施例能够以多种形式实施,且不应被理解为本发明仅限于在此阐述的实施例。相反,提供这些示例性实施例能够使得本发明更加全面和完整,更加便于将发明构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的元件、组件或部分,因而将省略对它们的重复描述。
[0034]
在符合本发明的技术构思的前提下,在某个特定的实施例中描述的特征、结构、特性或其他细节不排除可以以合适的方式结合在一个或更多其他的实施例中。
[0035]
在对于具体实施例的描述中,本发明描述的特征、结构、特性或其他细节是为了使本领域的技术人员对实施例进行充分理解。但是,并不排除本领域技术人员可以实践本发明的技术方案而没有特定特征、结构、特性或其他细节的一个或更多。
[0036]
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
[0037]
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。
即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
[0038]
应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但这不应受这些定语限制。这些定语乃是用以区分一者与另一者。例如,第一器件亦可称为第二器件而不偏离本发明实质的技术方案。
[0039]
术语“和/或”或者“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。
[0040]
鉴于上述问题,本发明通过预定筛选规则进行用户筛选,能够精确地筛选出属于特定用户群的用户,并能够精确确定与特定用户群的用户相对应的用户关联设备;通过计算所述特定用户群的评估指标,生成用于表征用户关联设备的风险大小的催收标签,并构建基于所述催收标签的设备风险预测模型,通过该设备风险预测进行新接入设备的风险计算,能够更精确量化新接入设备的风险情况,能够有效识别新接入设备是否为风险设备。
[0041]
需要说明的是,本发明中,本发明的创新之处在于如何根据用户关联设备与互联网服务平台之间的交互(即物与物之间的信息交互),使用户关联设备的风险鉴别过程更加自动化、高效和减小人力成本。但是,为了方便起见,本发明中以互联网服务为例说明接入设备鉴别的实施,但是不能理解成对本发明的限制。以下将详细描述接入设备鉴别方法的具体过程。
[0042]
实施例1
[0043]
下面,将参照图1至图3描述本发明的基于催收标签的接入设备鉴别方法的实施例。
[0044]
图1为本发明的基于催收标签的接入设备鉴别方法的流程图。如图1所示,该接入设备鉴别方法包括如下步骤。
[0045]
步骤s101,根据预定筛选规则,筛选特定用户群。
[0046]
步骤s102,计算所述特定用户群的评估指标,根据所述评估指标生成催收标签,并构建基于所述催收标签的设备风险预测模型。
[0047]
步骤s103,使用训练好的设备风险预测模型对新接入设备进行风险鉴别。
[0048]
为了精确地进行接入设备风险鉴别,对在受外部环境影响下从优质用户转变为劣质用户的这部分用户(其中用户均为已被提供互联网服务资源额的用户,该部分用户为特定用户群),进行了深入研究,上述这部分用户的资源回收额极大影响着资源管理平台的整体资源分配与回收的使用过程,甚至严重影响着资源管理平台的收支平衡。其中,所述特定用户群特别指在市场风险因素影响下资源归还风险增加的特定群体。因此,为了可靠保证资源管理平台的收支平衡,有效避免特定用户群的资源回收额对资源管理平台的整体资源分配与回收的使用过程的影响,本发明通过建立基于催收标签的机器学习模型(即设备风险预测模型),对所述特定用户群的资源回收风险进行量化以用于表征用户关联设备的风险大小,能够降低用户误拒的问题,同时能够对新接入设备进行风险鉴别,以有效拒绝风险设备接入,能够提升用户体验,还能够减少资源管理平台的损失。
[0049]
需要说明的是,在本发明中,所述互联网服务包括由用户关联设备向互联网服务平台的申请而提供例如购物、乘车、地图、外卖、共享单车等的互联网服务资源。例如,资源分配服务、资源使用服务、资源保障服务或互助服务、拼团购买以及乘车服务等等。其中,资
源是指任何可被利用的物质、信息、时间,信息资源包括计算资源和各种类型的数据资源。数据资源包括各个领域中的各种专用数据。用户关联设备是指在互联网服务平台上申请服务时注册用户所关联的设备,通常使用设备id代表。当特定用户群中用户在申请使用互联网服务并获得资源分配授权之后,因受到市场风险因素的影响而导致所述用户在资源使用的期间内有可能发生违约行为或者资源未归还等的风险行为,从而对资源管理平台造成资源损失。本发明正是对于上述风险行为导致的风险进行预测以进行事先或事后防范。
[0050]
下面将以互联网资源分配服务为示例说明本发明方法的具体过程。
[0051]
首先,在步骤s101中,根据预定筛选规则,筛选特定用户群。
[0052]
作为一具体实施方式,将步骤s101拆分成步骤s101和步骤s201,在执行筛选特定用户群的步骤s101之前,先执行预先配置预定筛选规则的步骤(即步骤s201)。
[0053]
在步骤s201中,预先配置预定筛选规则。
[0054]
具体地,所述预定筛选规则包括配置时间参数和资源回收率阈值,其中,该时间参数为自资源归还时间起特定时间内。例如为自资源归还时间起20天时间内。
[0055]
更具体地,所述特定时间为7天~30天,例如为7天、15天、20天或者30天等等。
[0056]
需要说明的是,对于资源分配服务的时间节点为资源归还时间,但是不限于此,在其他互联网服务的示例中,时间节点为资源接续时间、资源服务支付时间或资源服务交易时间等等。上述仅作为示例进行说明,不能理解成对本发明的限制。
[0057]
进一步地,对于资源回收率阈值的配置,例如由相关业务人员根据一定时间段内(例如半年内、一年内或两年内等)对于不同类型资源服务的总资源额、资源收支比率或者历史资源回收率来配置用户的资源回收率阈值。例如,在一年内资源分配服务的总资源额为100万,历史资源回收率为80%,配置例如80%~90%的用户的资源回收率阈值,具体地,例如该资源回收率阈值为85%。
[0058]
在一实施方式中,预定筛选规则为自资源归还时间起特定时间(例如30天)内用户归还了资源且资源回收率大于资源回收率阈值(例如为80%)。在使用所述预定筛选规则进行用户筛选时,将自资源归还时间起30天内用户归还了资源且资源回收率大于资源回收率阈值(例如为80%)的用户筛选出,则该用户属于所述特定用户群,所述用户的关联设备为用户在向资源管理平台申请互联网资源服务时或注册时所关联的设备(即用户关联设备)。
[0059]
需要说明的是,所述特定用户群用于表征指在市场风险因素影响下资源归还风险增加且从优质用户转变为劣质用户的特定群体,其中所述市场风险因素包括根据市场风险指标确定的意外风险因素、环境风险因素。
[0060]
具体地,市场风险指标包括意外风险指标和环境风险指标,意外风险指标包括与资源归还人(即属于特定用户群的用户)的意外事件相关的风险指标,例如,表示该资源归还人因发生意外事故而造成经济收入减少或没有经济收入的风险指标,或者表示不能归还或有不归还的可能性的风险指标。而环境风险指标包括与自然环境或社会环境造成风险相关的风险指标,例如,表示自然灾害造成的资源归还人在物质或人身上的伤害而影响资源归还的风险指标。再例如,表示政策、法律的改变,使相关企业经济环境、生产经营等受到影响,进而影响资源归还人不能归还或有不归还的可能性的风险指标。
[0061]
在另一实施方式中,预定筛选规则为自资源归还时间起特定时间(例如20天)内用户归还了资源且大于资源回收率阈值(例如为85%)。在使用所述预定筛选规则进行用户筛
选时,将自资源归还时间20天内用户归还了资源且大于资源回收率阈值(例如为85%)的用户筛选出,则该用户属于所述特定用户群,并筛选所述用户的用户关联设备的信息数据,例如用户关联设备的设备id、设备标识码、设备名称等。
[0062]
由此,通过预定筛选规则进行用户筛选,能够精确地筛选出属于特定用户群的用户,并能够精确确定与特定用户群的用户相对应的用户关联设备。
[0063]
需要说明的是,上述仅作为示例进行说明,不能理解成对本发明的限制。
[0064]
为了确保特定用户群中用户的资源归还,通常会采取催收策略,以促使用户归还资源,因此,本发明使用所述特定用户群包含催收数据的用户样本数据生成催收标签(即特定用户群中用户的催收标签表征用户关联设备的风险大小),并使用该催收标签建立设备风险预测模型,再使用所述设备风险预测模型对新接入设备进行风险鉴别。下面将具体说明设备风险预测模型的构建过程。
[0065]
在步骤s102中,计算所述特定用户群的评估指标,根据所述评估指标生成催收标签,并构建基于所述催收标签的设备风险预测模型。
[0066]
具体地,获取历史用户中属于特定用户群的用户样本数据,该用户样本数据包括互联网服务资源额度、资源服务时间、资源入催时间、资源归还期数、与资源归还期数相对应的待归还的互联网服务资源额(在本发明中,也简称为资源额),其中,根据资源归还期数可确定多个资源归还时间点。
[0067]
进一步地,根据所获取的用户样本数据,计算特定用户群中用户的评估指标,并根据所述评估指标生成催收标签。
[0068]
在一可选实施方式中,通过下式计算评估指标,所述评估指标为资源回收率:
[0069][0070]
其中,所述资源回收率是指自资源归还时间点起特定时间段内互联网服务资源额可回收额与资源入催额的比率;所述x天内回收额是指执行催收策略了并在自资源归还时间点起特定时间内(即x天内)用户归还资源的互联网服务资源额(在本发明中,也简称为资源额);所述资源入催额是指在资源归还时间点未归还的互联网服务资源额。
[0071]
具体地,所述x天与步骤s101中的特定时间相对应,例如为7天~30天,如7天、15天、20天或者30天等等。
[0072]
在另一可选实施方式中,通过下式计算评估指标,所述评估指标为资源回收率:
[0073][0074]
其中,所述资源回收率是指自资源归还时间点起特定时间段内互联网服务资源额可回收额与资源入催额的比率;所述(x 1)天后仍未回收额是指执行了催收策略并在自资源归还时间点起特定时间加一天之后用户仍未归还的互联网服务资源额;所述资源入催额是指在资源归还时间点未归还的互联网服务资源额。
[0075]
具体地,所述x 1天与步骤s101中的特定时间相对应,例如为8天~31天,如8天、16天、21天或者31天等等。
[0076]
因此,通过计算用户的资源回收率,能够精确计算出所述资源回收率。
[0077]
具体地,例如,基于所述催收标签,并使用xgboost方法或深度神经网络,构建设备风险预测模型。
[0078]
需要说明的是,上述仅作为示例进行说明,不能理解成对本发明的限制。在其他示例中,还可以使用textcnn算法、随机森林算法、逻辑回归算法等,或者使用上述算法中的两种以上的算法。此外,具体使用的算法可以根据采样数据量和/或业务需求进行确定。
[0079]
作为一具体实施方式,使用自资源归还时间点起特定时间段内的资源回收率,作为催收标签值,并确定用户关联设备的好样本和坏样本,以建立训练数据集,并使用该训练数据集训练所述设备风险预测模型。
[0080]
例如,在具有市场风险因素影响的情况下,将资源归还时间点起30天内,即逾期时间为20天以上且30天以内、且资源回收率高于80%的样本用户的用户关联设备作为坏样本(而在没有市场风险因素影响的情况下该用户作为好样本)。而将逾期时间小于20天、且资源回收率高于80%的样本用户的用户关联设备作为好样本。其中,将逾期时间是否为20天以上且30天以内、且资源回收率高于80%,作为催收标签值,以建立训练数据集,该训练数据集包括标注有催收标签值的历史用户关联设备(使用设备id表征用户关联设备)。
[0081]
例如,在具有市场风险因素影响的情况下,将逾期时间为30天以上且资源回收率高于85%的样本用户的用户关联设备作为坏样本(而在没有市场风险因素影响的情况下该用户的用户关联设备作为好样本)。而将逾期时间小于30天且资源回收率高于85%的样本用户的用户关联设备作为好样本。其中,将逾期时间是否为30天以上且资源回收率高于80%,作为催收标签值,以建立训练数据集,该训练数据集包括标注有催收标签值的历史用户关联设备(使用设备id表征用户关联设备)。
[0082]
需要说明的是,本发明的设备风险预测模型的y值(即催收标签值)是由两个参数共同确定的,所述两个参数包括逾期时长和资源回收率。在没有市场风险因素影响的情况下,逾期时间长但回收率高的用户是好用户(或者优质用户),即该用户的用户关联设备为好样本(或者接受样本),但在具有市场风险因素影响的情况下,将逾期时间长但回收率高的用户作为坏用户,即该用户的用户关联设备为坏样本(或者拒绝样本)。
[0083]
进一步地,对于资源入催额的计算,获取历史用户的互联网服务资源额度、资源服务时间和资源入催时间,计算所述资源入催额。
[0084]
作为一具体实施方式,例如历史用户a向资源管理平台申请了互联网服务资源额度l(例如为三万元)的资源分配服务,资源服务时间是6个月,资源归还期数为6期,在资源归还期间,历史用户a受到市场风险因素的影响,在第x期(例如第3期)的资源归还时间点未(例如为0.5万元),对该历史用户a执行了例如打电话催收或发短信催收的催收策略,在逾期20天时(即在自资源归还时间点起30天以内)归还了协议约定的待归还资源,则该历史用户a属于特定用户群,并且历史用户a的用户关联设备为坏样本(或者拒绝样本)。
[0085]
对于模型构建中训练数据集的训练数据样本,还包括进行如下步骤:判断被拒绝样本的真实概率与预测概率是否一致的步骤。
[0086]
具体地,计算真实概率和所输出的预测概率的相对偏差,其中,在所计算的相对偏差小于设定值时,判断真实概率和所述预测概率一致;而在所计算的相对偏差值大于等于设定值时,判断真实概率和所述预测概率一致。由此,能够更精确地判断真实概率和所述预测概率是否一致。
[0087]
需要说明的是,上述仅作为示例进行说明,不能理解成对本发明的限制,在其他实施方式中,也可以计算真实概率与所输出的预测概率的差值来判断真实概率和预测概率是否一致。在本示例中,所述设定值是由业务人员根据历史真实概率的统计值所确定的。但是不限于此,在其他示例中,还可通过其他方式进行确定。
[0088]
作为一实施方式,在判断真实概率和所述预测概率是否一致的步骤之后,判断与所述真实概率一致的所述预测概率的数量在所有所述训练数据样本的数量的占比是否大于预设占比值。
[0089]
若是,则设备风险预测模型收敛,得到训练完成的设备风险预测模型。
[0090]
若否,则调整设备风险预测模型中的模型参数,重新通过所述设备风险预测模型对所述历史被拒绝样本的预测概率,直至与所述真实概率一致的所述预测概率的数量在所有所述训练数据样本的数量的占比大于预设占比值。
[0091]
需要说明的是,对于上述判断与所述真实概率一致的所述预测概率的数量在所有所述训练数据样本的数量的占比是否大于预设占比值的步骤等等,还可以更换构建模型所使用的机器学习方法,重新建立设备风险预测模型,等等。上述仅作为示例进行说明,不能理解成对本发明的限制。
[0092]
由此,通过调整所述设备风险预测模型中的模型参数,能够优化模型参数,能够提高模型认证精度,还能够优化设备风险预测模型的构建过程。
[0093]
需要说明的是,上述仅作为示例进行说明,不能理解成对本发明的限制。
[0094]
在步骤s103中,使用训练好的设备风险预测模型对新接入设备进行风险鉴别。
[0095]
具体地,获取新接入设备的设备信息,例如该设备信息为设备id或设备标识码。
[0096]
进一步地,使用所述设备风险预测模型,将新接入设备的设备id输入设备风险预测模型,计算(或输出)所述新接入设备的预测值。
[0097]
在一实施方式中,将所计算的预测值与设定阈值进行比较,在所计算的预测值小于等于设定阈值时,确定向所述新接入设备提供互联网服务资源。
[0098]
例如,对于资源分配服务或资源保障服务的互联网服务的设备风险鉴别过程中,当所计算的预测值小于等于设定阈值时,判断所述新接入设备的风险小,确定可向新接入设备提供例如资源分配服务或者资源保障服务。
[0099]
在另一实施方式中,在所计算的预测值大于设定阈值时,确定不向所述新接入设备提供互联网服务资源。
[0100]
例如,当所计算的预测值大于设定阈值时,判断所述新接入设备的风险大,确定不能向新接入设备提供例如资源分配服务或者资源保障服务。
[0101]
因此,通过使用设备风险预测模型对新接入设备进行风险鉴别,能够精确量化新接入设备的风险情况,并能够提高设备风险预测模型的预测精度。
[0102]
在另一示例中,如图3所示,所述接入设备鉴别方法包括在计算新接入设备的预测值之前,判断所述新接入设备所关联的用户中劣质用户数量的步骤s301。
[0103]
具体地,在步骤s301中,在计算新接入设备的预测值之前,判断所述新接入设备所关联的用户中劣质用户数量。
[0104]
例如,获取新接入设备的设备信息、及其关联用户的用户特征信息,对每一个新接入设备的关联用户执行劣质用户数量的判断步骤。
[0105]
具体地,例如,先判断新接入设备的关联用户的数量,例如为一个或多个。
[0106]
在判断所述关联用户的数量为多个时,使用所述多个用户的用户特征信息,与预存用户数据库中黑名单(劣质用户)的用户特征信息进行对比查询,判断出与已注册用户和已申请资源服务用户中劣质用户的用户特征信息相似的用户,或者判断是否是劣质用户,并确定劣质用户的数量。
[0107]
进一步地,在劣质用户的数量占总数量的60%以上时,初步判断所述新接入设备为风险大的设备,并进行风险标识,再进一步计算新接入设备的预测值。
[0108]
因此,通过对新接入设备的关联用户执行劣质用户数量的判断步骤,能够更精确地确定出风险设备。
[0109]
在另一示例中,所述接入设备鉴别方法包括对设备风险预测模型的模型参数进行优化,所述模型参数包括深度神经网络的各层之间的权重参数和偏置参数。
[0110]
需要说明的是,上述仅作为示例进行说明,不能理解成对本发明的限制。在其他示例中,模型参数还包括深度神经网络的层数、迭代次数和学习率。
[0111]
具体地,例如设定模型参数的先验概率服从标准正态分布,使用mcmc方法对所述权重参数和偏置参数的分布进行多次采样,得到参数组合集,其中,在使用所述参数组合集进行测试时,对所输入的同一设备id进行多次前向传播,计算各模型参数的平均数和统计方差值,以优化各模型参数,最后输出参数优化后的神经网络。由此,通过优化所述风险模型的模型参数,能够提高模型精确度。
[0112]
需要说明的是,上述仅作为示例进行说明,不能理解成对本发明的限制。
[0113]
上述接入设备鉴别方法的过程仅用于对本发明的说明,其中,步骤的顺序和数量没有特别的限制。此外,上述方法中的步骤还可以拆分成两个、三个,或者有些步骤也可以合并成一个步骤,根据实际示例进行调整。
[0114]
本领域技术人员可以理解,实现上述实施例的全部或部分步骤被实现为由计算机数据处理设备执行的程序(计算机程序)。在该计算机程序被执行时,可以实现本发明提供的上述方法。而且,所述的计算机程序可以存储于计算机可读存储介质中,该存储介质可以是磁盘、光盘、rom、ram等可读存储介质,也可以是多个存储介质组成的存储阵列,例如磁盘或磁带存储阵列。所述的存储介质不限于集中式存储,其也可以是分布式存储,例如基于云计算的云存储。
[0115]
与现有技术相比,本发明通过预定筛选规则进行用户筛选,能够精确地筛选出属于特定用户群的用户,并能够精确确定与特定用户群的用户相对应的用户关联设备;通过计算所述特定用户群的评估指标,生成用于表征用户关联设备的风险大小的催收标签,并构建基于所述催收标签的设备风险预测模型,通过该设备风险预测进行新接入设备的风险计算,能够更精确量化新接入设备的风险情况,能够有效识别新接入设备是否为风险设备。
[0116]
进一步地,通过对新接入设备的关联用户执行劣质用户数量的判断步骤,能够更精确地确定出风险设备;通过调整所述设备风险预测模型中的模型参数,能够优化模型参数,能够提高模型认证精度,还能够优化设备风险预测模型的构建过程;通过执行催收策略,能够有效确保特定用户群中用户的资源归还。
[0117]
实施例2
[0118]
下面描述本发明的装置实施例,该装置可以用于执行本发明的方法实施例。对于
本发明装置实施例中描述的细节,应视为对于上述方法实施例的补充;对于在本发明装置实施例中未披露的细节,可以参照上述方法实施例来实现。
[0119]
参照图4至图7,本发明还提供了一种基于催收标签的接入设备鉴别装置,该接入设备鉴别装置400包括:筛选模块401,根据预定筛选规则,筛选特定用户群;计算模块402,用于计算所述特定用户群的评估指标,根据所述评估指标生成催收标签,并构建基于所述催收标签的设备风险预测模型;预测模块403,用于使用训练好的设备风险预测模型对新接入设备进行风险鉴别。
[0120]
在一实施方式中,如图5所示,还包括配置模块501,基将所述筛选模块401拆分成配置模块501和筛选模块401,所述配置模块501用于预先配置预定筛选规则。
[0121]
具体地,所述预定筛选规则包括配置时间参数和资源回收率阈值,该时间参数为自资源归还时间起特定时间内;将自资源归还时间起特定时间内用户归还了资源且大于资源回收率阈值的用户筛选出,则该用户属于所述特定用户群,所述特定用户群用于表征指在市场风险因素影响下资源归还风险增加的特定群体。
[0122]
更具体地,所述时间参数为自资源归还时间起特定时间内。例如为自资源归还时间起20天时间内。例如,所述特定时间为7天~30天,例如为7天、15天、20天或者30天等等。
[0123]
需要说明的是,对于资源分配服务的时间节点为资源归还时间,但是不限于此,在其他互联网服务的示例中,时间节点为资源接续时间、资源服务支付时间或资源服务交易时间等等。上述仅作为示例进行说明,不能理解成对本发明的限制。
[0124]
具体地,对于评估指标,可根据如下两种可选实施方式进行计算。
[0125]
根据本发明的可选实施方式,包括:通过下式计算评估指标,所述评估指标为资源回收率:
[0126][0127]
其中,所述资源回收率是指自资源归还时间点起特定时间段内互联网服务资源额可回收额与资源入催额的比率;所述x天内回收额是指执行催收策略了并在自资源归还时间点起特定时间内(即x天内)用户归还资源的互联网服务资源额;所述资源入催额是指在资源归还时间点未归还的互联网服务资源额。
[0128]
根据本发明的可选实施方式,包括:通过下式计算评估指标,所述评估指标为资源回收率:
[0129][0130]
其中,所述资源回收率是指自资源归还时间点起特定时间段内互联网服务资源额可回收额与资源入催额的比率;所述(x 1)天后仍未回收额是指执行了催收策略并在自资源归还时间点起特定时间加一天之后用户仍未归还的互联网服务资源额;所述资源入催额是指在资源归还时间点未归还的互联网服务资源额。
[0131]
在另一实施方式中,如图6所示,所述接入设备鉴别装置400还包括数据获取模块601,所述数据获取模块601用于获取历史用户的互联网服务资源额度、资源服务时间和资源入催时间,计算所述资源入催额。
[0132]
具体地,所述使用训练好的设备风险预测模型对新接入设备进行风险鉴别包括:使用所述设备风险预测模型,计算所述新接入设备的预测值;将所计算的预测值与设定阈值进行比较。
[0133]
在一实施方式中,在所计算的预测值小于等于设定阈值时,确定向所述新接入设备提供互联网服务资源。
[0134]
在另一实施方式中,在所计算的预测值大于设定阈值时,确定不向所述新接入设备提供互联网服务资源。
[0135]
在又一实施方式中,所述接入设备鉴别装置400还包括判断模块701,所述判断模块701用于在计算新接入设备的预测值之前,判断所述新接入设备所关联的用户中劣质用户数量。
[0136]
例如,获取新接入设备的设备信息、及其关联用户的用户特征信息,所述判断模块701对每一个新接入设备的关联用户执行劣质用户数量的判断步骤。
[0137]
例如,所述判断模块701先判断新接入设备的关联用户的数量,例如为一个或多个。
[0138]
在判断所述关联用户的数量为多个时,使用所述多个用户的用户特征信息,与预存用户数据库中黑名单(劣质用户)的用户特征信息进行对比查询,判断出与已注册用户和已申请资源服务用户中劣质用户的用户特征信息相似的用户,或者判断是否是劣质用户,并确定劣质用户的数量。
[0139]
进一步地,在劣质用户的数量占总数量的60%以上时,初步判断所述新接入设备为风险大的设备,并进行风险标识,再进一步计算新接入设备的预测值。
[0140]
因此,通过对新接入设备的关联用户执行劣质用户数量的判断过程,能够更精确地确定出风险设备。
[0141]
需要说明的是,在实施例2中,省略了与实施例1相同的部分的说明。
[0142]
本领域技术人员可以理解,上述装置实施例中的各模块可以按照描述分布于装置中,也可以进行相应变化,分布于不同于上述实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
[0143]
与现有技术相比,本发明通过预定筛选规则进行用户筛选,能够精确地筛选出属于特定用户群的用户,并能够精确确定与特定用户群的用户相对应的用户关联设备;通过计算所述特定用户群的评估指标,生成用于表征用户关联设备的风险大小的催收标签,并构建基于所述催收标签的设备风险预测模型,通过该设备风险预测进行新接入设备的风险计算,能够更精确量化新接入设备的风险情况,能够有效识别新接入设备是否为风险设备。
[0144]
进一步地,通过对新接入设备的关联用户执行劣质用户数量的判断步骤,能够更精确地确定出风险设备;通过调整所述设备风险预测模型中的模型参数,能够优化模型参数,能够提高模型认证精度,还能够优化设备风险预测模型的构建过程;通过执行催收策略,能够有效确保特定用户群中用户的资源归还。
[0145]
实施例3
[0146]
下面描述本发明的计算机设备实施例,该计算机设备可以视为对于上述本发明的方法和系统实施例的具体实体实施方式。对于本发明计算机设备实施例中描述的细节,应视为对于上述方法或系统实施例的补充;对于在本发明计算机设备实施例中未披露的细
节,可以参照上述方法或系统实施例来实现。
[0147]
图8是根据本发明的计算机设备的示例性实施例的结构框图。下面参照图8来描述根据本发明该实施例的的计算机设备200。图8显示的计算机设备200仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0148]
如图8所示,计算机设备200以通用计算设备的形式表现。计算机设备200的组件可以包括但不限于:至少一个处理单元210、至少一个存储单元220、连接不同装置组件(包括存储单元220和处理单元210)的总线230、显示单元240等。
[0149]
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元210执行,使得所述处理单元210执行本说明书上述计算机设备的处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元210可以执行如图1所示的步骤。
[0150]
所述存储单元220可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)2201和/或高速缓存存储单元2202,还可以进一步包括只读存储单元(rom)2203。
[0151]
所述存储单元220还可以包括具有一组(至少一个)程序模块2205的程序/实用工具2204,这样的程序模块2205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
[0152]
总线230可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
[0153]
计算机设备200也可以与一个或多个外部设备300(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该计算机设备200交互的设备通信,和/或与使得该计算机设备200能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口250进行。并且,计算机设备200还可以通过网络适配器260与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。网络适配器260可以通过总线230与计算机设备200的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0154]
通过以上的实施方式的描述,本领域的技术人员易于理解,本发明描述的示例性实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个计算机可读的存储介质(可以是cd
‑
rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本发明的上述方法。当所述计算机程序被一个数据处理设备执行时,使得该计算机程序产品能够实现本发明的上述方法。
[0155]
图9是根据本发明的计算机程序产品的示例性实施例的结构框图。
[0156]
如图9所示,所述计算机程序可以存储于一个或多个计算机程序产品上。计算机程序产品例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机程序产品的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读
存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd
‑
rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0157]
所述计算机程序产品可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机程序产品可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。所述计算机程序产品上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。
[0158]
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、c 等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
[0159]
综上所述,本发明可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)等通用数据处理设备来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机程序产品上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0160]
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,本发明不与任何特定计算机、虚拟装置或者电子设备固有相关,各种通用装置也可以实现本发明。以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
转载请注明原文地址:https://doc.8miu.com/read-1764088.html