本申请涉及数据处理领域,具体而言,涉及一种商品销量数据预测方法、装置、设备、介质及产品。
背景技术:
电商平台在商品销售过程中,会产生海量的销售数据。因此,电商平台的电子设备(例如,服务器)可以利用这些销售数据进行大数据分析,以便为用户提供更好的购物体验。
然而,发明人研究发现,海量的销售数据中会存在一些售罄状况的销量数据,而售罄状况的销量数据并不能真实反映商品的销售情况,继而会干扰最终的分析结果。
技术实现要素:
为了克服现有技术中的至少一个不足,第一方面,本申请提供一种商品销量数据预测方法,应用于电子设备,所述方法包括:
获取目标商品的第一销量数据以及待预测的售罄时段,其中,所述第一销量数据为所述目标商品在第一销售时段内未出现售罄状况的历史销量数据,所述售罄时段为所述目标商品在第二销售时段内出现售罄状况的时间段;
根据所述第一销量数据,确定出相似商品;其中,所述相似商品在第三销售时段内的第二销量数据与所述第一销量数据满足预设相似条件;
根据所述第一销量数据和所述第二销量数据,预测所述目标商品在所述售罄时段内的销量数据。
第二方面,本申请提供一种商品销量数据预测装置,应用于电子设备,所述商品销量数据预测装置包括:
数据获取模块,用于获取目标商品的第一销量数据以及售罄时段,其中,所述第一销量数据为所述目标商品在销售时段内未出现售罄状况的历史销量数据,所述售罄时段为所述销售时段内出现售罄状况的时间段;
商品查找模块,用于根据所述第一销量数据,确定出相似商品;其中,所述相似商品在所述销售时段内的第二销量数据与所述第一销量数据满足预设相似条件;
销量预测模块,用于根据所述第一销量数据和所述第二销量数据,预测所述目标商品在所述售罄时段内的销量数据。
第三方面,本申请提供一种电子设备,所述电子设备包括处理器以及存储器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,实现所述的商品销量数据预测方法。
第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现所述的商品销量数据预测方法。
第五方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现所述的商品销量数据预测方法。
相对于现有技术而言,本申请具有以下有益效果:
本实施例提供的商品销量数据预测方法、装置、设备、介质及产品中,电子设备根据目标商品未出现售罄状况时的第一销量数据,确定出销量数据满足相似条件的相似商品;然后,通过相似商品的第二销量数对目标商品在售罄时段的销量数据。因此,通过其他相似商品的销量数据预测目标商品销量数据的目的,以达到克服目标商品销量较低的局限性所导致的预测精度欠佳的问题。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的电子设备的结构示意图;
图2为本申请实施例提供的商品修量数据预测方法的步骤示意图之一;
图3为本申请实施例提供的商品修量数据预测方法的步骤示意图之二;
图4为本申请实施例提供的商品修量数据预测方法的步骤示意图之三;
图5为本申请实施例提供的商品修量数据预测装置的结构示意图。
图标:120-存储器;130-处理器;201-数据获取模块;202-商品查找模块;203-销量预测模块。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本申请的描述中,需要说明的是,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。此外,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
本实施例考虑到在使用了售罄状况的销量数据进行大数据分析时,由于售罄状况的销量数据并不能真实反映商品的销售情况,继而会干扰最终的分析结果,因此,需要对售罄状况的销量数据进行预测。然而,发明人研究发现,相关的销量数据预测方法在面对低销量的商品时,存在极大的误差。
示例性的,假定存在一目标商品,该目标商在3月12日的销售时段内出现了售罄状况,并且,该目标商品在3月5日-3月11日的销售时段内未出现售罄状况。电子设备则可以统计该目标商品在3月5日-3月11日这7天内的平均销量;然后,减去3月12日未出现售罄状况这段时间内的销量,即预测获得目标商品在3月12的售罄时段内的商品销量。
另一示例性中,假定该目标商在3月12的销售时段内出现了售罄状况,并且在中午12点开始出现售罄状况,即12:00am-24:00pm这段时间内发生了缺货所导致的售罄状况。电子设备可以获取目标商品在3月5日-3月11日这7天内每个小时的平均销量;然后,根据目标商品在3月5日-3月11日这7天内每个小时的平均销量,预测获得目标商品在售罄时段内的商品销量。
然而,上述示例均是基于均值的预测方法,在面对销量较低的商品时,则会存在极大的误差。
例如,假定目标商品每日的销量在1-3之间波动时,则受限于销量太低导致不满足大数定理,从而影响所预测售罄时段内目标商品的销量精度。示例性的,假定目标商品在一天中的平均销量为1,而通过泊松概率方法预测该目标商品全天销量为1.2。由于商品的数量不可能是小数,因此,1.2不具备业务意义,通常对预测的销量取整,则调整后的销量为2,这就会导致预测销量的偏差扩大为80%。
鉴于此,为例至少部分解决相关技术的技术问题,本实施例提供一种应用于电子设备的商品销量数据预测方法。该方法中,针对需要进行销量预测的目标商品,电子设备使用相似商品的销量数据预测该商品在售罄时段内的商品销量,以提高对低销量商品在售罄时段的销量预测精度。
为了便于清楚阐述本实施例提供的技术方案,在对上述方法进行详细介绍之前,下面先对该方法的执行设备进行介绍。
其中,该电子设备可以是服务器。例如,web(网站)服务器、数据服务器等。应理解的是,本实施例所指的服务器可以是单个服务器,还可以是由多个服务器构成的服务器集群。当然,在其他的一些应用场景下,该电子设备还可以是个人终端。例如,智能手机、个人电脑(personalcomputer,pc)、平板电脑、移动上网设备(mobileinternetdevice,mid)等。
下面结合图1所示的电子设备结构示意图,对上述电子设备的结构进行详细介绍。如图1所示,该电子设备包括处理器以及存储器。当然,在一些需要进行通信的场景中,该电子设备还可以包括通信装置,用于通过有线或者无线网络收发数据。
如图1所示,该存储器120、处理器130之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。
其中,该存储器120可以是,但不限于,随机存取存储器(randomaccessmemory,ram),只读存储器(readonlymemory,rom),可编程只读存储器(programmableread-onlymemory,prom),可擦除只读存储器(erasableprogrammableread-onlymemory,eprom),电可擦除只读存储器(electricerasableprogrammableread-onlymemory,eeprom)等。存储器120用于存储计算机程序,该处理器130在接收到执行指令后,执行该程序。
该处理器130可能是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,简称np)等;还可以是数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
基于上述电子设备的相关介绍,下面结合图2所示商品销量数据预测方法的一种步骤流程图,对该方法的各步骤进行详细阐述。如图2所示,该商品销量数据预测方法包括:
步骤s101,获取目标商品的第一销量数据以及待预测的售罄时段。
其中,第一销量数据为目标商品在第一销售时段内的历史销量,且第一销售时内未出现售罄状况,目标商品在第二销售时段内出现售罄状况的时间段为售罄时段。
此外,本领域技术人员可以根据实际需要,选择第一销售时段与第二销售时段的时间跨度。其中,该时间跨度可以以天为单位,还可以以周为单位。例如,当售罄时段持续时间在一天以内,则该时间跨度可以以天为单位;当售罄时段持续时间超过一天,则该时间跨度可以以周为单位。
下面以天为单位进行示例性说明,并且为了便于描述,将存在售罄时段的一天称为售罄日。
作为一种实现方式,第一销量数据可以是售罄日之前任意一天的销售数据。例如,假定该售罄日为3月12日,则将3月12日整天作为第二销售时段,将3月12日之前的任意一天作为第一销售时段。例如,可以选择3月11日作为第一销售时段,将3月11日整天的销量数据作为第一销量数据。
作为另外一种实现方式,第一销量数据可以是售罄日之前多天的销售数据。例如,假定该售罄日为3月12日,将3月12日整天作为第二销售时段,将3月11日-3月5日这7天作为第一销售时段,将这7天的销量数据作为第一销量数据。
本实施例还考虑到目标商品在工作日与周末的销量存在较大的差异,因此,当售罄日属于工作日时,则选取目标商品在工作日的销量数据作为第一销量数据;当售罄时段属于周末时,则可以选取目标商品在周末的销量数据作为第一销量数据。如此,以提高目标商品销量的预测精度。
例如,假定售罄日属于工作日,则可以选取售罄日之前,周一至周五任意一天或者多天的销量数据作为第一销量数据。假定售罄日属于周末,则可以选取售罄日之前周六至周日任意一天或者多天的销量数据作为第一销量数据。
因此,本实施例不对第一销售时段以及第二销时段做具体的限定,本领域技术人员可以根据需要进行适应性选择,其基于本实施例不需要做出创造性的贡献。
步骤s102,根据第一销量数据,确定出相似商品。
其中,相似商品在第三销售时段内的第二销量数据与第一销量数据满足预设相似条件。其中,该预设相似条件可以是目标商品与相似商品之间,销量数据的销量分布较为接近。
其中,第三销售时段的时间跨度可以根据第一销售时段的时间跨度进行适应性调整。示例性的,假定售罄日位于3月12日,并且第一销售时段是3月11日整天,则第三销售时段的时间跨度可以是1天。同理,若第一销售时段是3月11日-3月5日这7天,则第三销售时段的时间跨度为7天,其中,这7天可以不连续。
此外,值得说明的是,目标商品与相似商品需要是同一电商平台的销售商品。并且,本实施例不对相似商品与目标商品的种类进行限制。例如,电商平台会通常会售卖平类繁多的商品,假定目标商品时水果a,则相似商品可以是水果b、水果c、日用品a、电子设备a等。
步骤s103,根据第一销量数据和第二销量数据,预测目标商品在售罄时段内的销量数据。
由此,电子设备根据目标商品未出现售罄状况时的第一销量数据,确定出销量数据满足相似条件的相似商品;然后,通过相似商品的第二销量数预测目标商品在售罄时段的销量数据。因此,通过其他相似商品的销量数据预测目标商品销量数据的目的,以达到克服目标商品销量较低的局限性所导致的预测精度欠佳的问题。
此外,在一些实施场景,商品出现售罄状况时,需要及时进行补货,而有些商品对存放时间很敏感,即短保质期商品。例如,一些生鲜类的商品。因此,若补充货物的数量较多,则会出现商品剩余,继而导致商品报废,反之,若补充的货物较少,则又会因供不应求再次出现售罄状况。
因此,本实施例提供的商品销量数据预测方法,能够提高对目标商品销量数据的预测精度,进而以达到尽可能的减少商品报废数量的同时,提高商品销量的目的。
本实施例中,通过下述实施方式找出与目标商品的销量分布满足预设相似条件的相似商品。其中,第一销售时段包括多个子时段,相似商品选取自候选商品集。如图3所示,上述步骤s102包括:
步骤s102-1,根据第一销量数据,获取目标商品在多个子时段内的销量分布。
示例性的,假定第一销量数据为目标商品在3月11日-3月5日这7天的销量数据,则电子设备可以以1个小时为一个子时段,统计目标商品在每个小时内的销量,获得目标商品在24*7个小时中每个小时的销量分布。由此,电子设备可以获得目标商品在7天内的销量分布情况。
为了便于与目标商品进行匹配,候选商品集中的各候选商品的销量数据同样为7天内的销量数据。值得说明的是,候选商品集中的销量数据不仅限于3月11日-3月5日这7天的销量数据,还可以是其他时间段的销量数据,只要凑够7天即可。同理,针对每个候选商品,电子设备统计候选商品在这7天当中每个小时内的销量,获得目标商品在24*7个小时中每个小时的销量分布。
当然,子时段的时长不仅限于1小时,还可以是30分钟、40分钟等,本申请实施例不做具体的限定,本领域技术人员可以根据精度需要进行适应性选择。即对预测精度要求较高时,可以适当选择较短时长的子时段。
此外,考虑到目标商品在24*7=168个小时的销量分布的维度为达到了168维;在进行相似度匹配的时候,需要耗费大量的计算资源。为了降低对计算资源的消耗,一种解决方式是减小第一销售时段的时间跨度。
而本实施例提供的另外一种解决方式则是以天为单位,计算目标商品每天当中相同时段的平均销量。例如,同样以目标商品在3月11日-3月5日这7天的销量数据为例,电子设备统计这7天当中每天相同时段的平均销量。若以1小时为一个时段,则可以将24*7=168维的销量分布压缩成24维。
同理,针对每个候选商品,电子设备同样以天为单位,统计候选商品在每天当中相同时段的平均销量。假定以候选商品在3月11日-3月5日这7天的销量数据为例。针对每个候选商品,电子设备统计这7天当中每天相同时段的平均销量。若以1小时为一个时段,则可以将每个候选商品24*7=168维的销量分布压缩为24维。
步骤s102-4,根据目标商品的销量分布,从候选商品集中确定出相似商品。
即电子设备以第一销量数据的销量分布为基准,将其与候选商品的销量分布进行匹配,从候选商品集中找出满足预设相似条件的相似商品。
其中,电子设备可以获得与候选商品数量相对应的多个相似度,即多个相似度分别表征目标商品对应销量分布与每个候选商品对应销量分布之间的相似程度。然后,电子设备从多个相似度中,选取至少一个目标相似度;将至少一个目标相似度对应的候选商品,作为相似商品。
即本实施例中,不对相似商品的数量做具体的限定,可以是一个或者是多个。
由于本实施例提供的商品销量数据预测方法,通过其他相似商品的第二销量数据来预测目标商品在售罄时段的销量,因此,相似商品的选择直接影响到最终预测结果的精度。而本实施例中的候选商品集筛选自初始商品集。
因此,再次参见图3,步骤s102还包括:
步骤s102-2,从初始商品集获取每个候选商品的销售状况信息;
步骤s102-3,根据每个候选商品的销售状况信息,从初始商品集中剔除干扰数据以得到候选商品集。
其中,销售状况信息包括每个候选商品的销量数据、售后信息以及促销信息。而干扰数据则包括售后信息出现异常的销量数据、参与促销活动的销量数据以及干扰商品的销量数据,其中,干扰商品为销量数据小于预设数量阈值的候选商品。
应理解,若未将干扰商品从初始商品集中剔除,即未对候选商品集中的候选商品的销量进行限制,则可能会出现所找到的相似商品,其销量分布与目标商品的销量分布极为相似,但是,该相似商品同样为销量较低的商品。例如,该相似商品的销量同样在1-3之间波动。因此,电子设备使用这一类的相似商品来预测目标商品在售罄时段的销量,显然不具备明显的参考意义。
因此,本实施例中,电子设备使用预设数量阈值对初始商品集中的商品进行了过滤,将过滤后的商品集作为候选商品集。其中,该预设数量阈值可以是100。当然,本领域技术人员可以根据初始商品集中候选商品的数量以及对预测精度的要求,对预设数量阈值进行适应性调整。
例如,当初始商品集中候选商品的数量比较多时,电子设备则可以提高预设数量阈值。与之相互对应的是,当初始商品集中候选商品的数量比较少时,电子设备则可以适当降低预设数量阈值。同理,当预测精度的要求较高时,电子设备则可以提高预设数量阈值。与之相互对应的是,当预测精度的要求较低时,电子设备则可以适当降低预设数量阈值。
示例性的,初始商品集源自于电商平台的购物数据库。电子设备从数据库中读取所有订单数据和电商平台在售商品数据。其中,每条订单数据包含商品信息,发货仓库信息,时间信息,活动信息,履约信息等。电商平台在售商品数据包含商品数据,发货仓库信息,时间信息,活动信息等。
其中,该订单数据时间跨度可以根据实际需求进行具体设定,通常选择目标商品售罄日当天以及之前两周的订单数据。例如,目标商品售罄日在2021年3月31日,电子设备则选取2021年3月31日的订单数据(称为“当天销量数据”)及3月17日至3月30日的订单数据(称为“历史销量数据”)。
下面对订单数据进行详细的解释。其中,商品信息是指sku(stockkeepingunit,库存保有单位)的编号、商品名等。应理解,sku是物理上不可分割的最小存货单元,在电商领域特指某一款商品。
发货仓库信息是指仓库的编号、地理位置等。
订单数据的时间信息是指用户下单时间;在售商品数据的时间信息是指商品的上架和下架时间。
活动信息是指商品促销活动信息,例如,是否参与秒杀、万人团等活动。
履约信息是指该订单是否成功配送、是否发生退货退款等。
由于直接从购物数据库读取的订单数据存在部分无效订单以及噪声数据,因此,因此需要进行清洗,以得到合理的初始商品集。
作为一种可能的实现方式,电子设备可以根据当天销量数据和历史销量数据中的售后信息,将出现订单配送失败,或发生退货、退款等异常售后情况的订单数据剔除。
以及电子设备根据当天销量数据和历史销量数据中的促销信息,将出现某仓库的某个商品参与秒杀、万人团等特殊促销活动情况的订单数据剔除。原因在于,出现促销活动时,商品销量会出现较大波动,因此该商品全天的数据不具有参考意义,需要将其筛除;
以及电子设备根据当天销量数据以及历史销量数据,若某个商品出现了售罄状况,其销量会显著偏低,因此该商品的数据将被筛除。
该实现方式仅仅是为了便于理解所提供的示例,本领域技术人员还可以上述筛选方式的基础上进行适当的增加或者减少,本实施例不对此做具体的限定。
筛选出的候选商品集中包括多个候选商品,电子设备获取目标商品与多个候选商品之间的多个相似度,其中,多个相似度分别表征目标商品对应销量分布与每个候选商品对应销量分布之间的相似程度;
然后,电子设备从多个相似度中,选取至少一个目标相似度;将至少一个目标相似度对应的候选商品,作为相似商品。
其中,电子设备可以将各候选商品之间的相似度以递增方式进行排序,然后,选取选择最为相似的至少一目标相似度。例如,可以选择最为相似的前2个候选商品作为相似商品。当然,在其他的一些实施方式中,本领域技术人员还可以选取大于预设相似阈值的候选商品作为相似商品。例如,该预设相似阈值可以是98%。
由此,可以依据设置的预设相似条件选取合适的相似商品,以提高对预测销量数据的预测精度。
由于本实施例中,通过销量分布用于衡量两商品是否相似的标准,因此,电子设备通过以下方式获取目标商品与多个候选商品之间的多个相似度。
电子设备获取目标商品对应销量分布的第一向量以及多个候选商品对应销量分布的多个第二向量;然后,计算第一向量与多个第二向量之间的多个向量关系;最后,将多个向量关系,作为目标商品与多个候选商品之间的多个相似度。
示例性的,接着以上述筛选方式清洗后所获得候选商品集为例,电子设备统计仓库中每sku(包括目标商品以及候选商品)的销量数据,为目标商品寻找满足预设相似条件的相似商品。需要注意的是,由于促销活动、当天出现售罄、商品未上架等情况下的销量数据会影响预测结果的精度,因此,不会计入统计。
下面以一天当中每个小时的平局销量为例,进行示例性说明。示例性的,通常将一天的时间按小时分为24段,即仓库中每个sku会得到一个长度为24的序列。假定目标商品为a商品,该a商品的第一销售时段的跨度本实施例不做限定,假定为7天。则其中一天中,每个小时的销量分布为:
[3,3,7,12,2,1,23,2,0,3,10,7,8,14,13,2,6,7,8,0,10,3,6,8]。
然后,将a商品在第一销售时段内的销量数据按照一天当中的每个小时进行平均,得到如下销量分布:
[3.2,5.7,6.4,7.9,4.3,5.4,8.8,4.0,3.2,3.4,10.7,7.5,8.2,10.2,9.3,7.4,6.5,6.6,10.8,3.3,7.3,3.8,2.1,1.1]。
因此,可以得到该a商品的日平均销量为na=147.1。
由于目标商品与候选商品之间的绝对销量并不相同,因此,难以直接衡量两者之间的相似度,因此,发明人想到了将以绝对销量进行标识的销量分布进行归一化处理,即将每个子时段的平均销量除以该商品的日平均销量,因此,a商品归一化后的销量分布为:
va=[0.0217,0.0387,0.0435,0.0537,0.0292,0.0367,0.0598,0.0271,0.0217,0.0231,0.0727,0.0509,0.0557,0.0693,0.0632,0.0503,0.0441,0.0448,0.0734,0.0224,0.0496,0.0258,0.0142,0.0074]
将所有的候选商品按照目标商品的上述方式进行归一下处理后,电子设备将目标商品的销量分布作为24维的第一向量,将候选商品的销量分布作为24维的第二向量,在向量空间进行聚类。其中,可以选取欧氏距离、曼哈顿距离或者夹角余弦值衡量两个一维向量的相似性。
下面以夹角余弦值为例进行示例性说明,电子设备计算目标商品的第一向量分别于各候选商品集的第二向量之间的夹角余弦值;将夹角余弦值作为目标商品与候选商品之间的相似度,取相似性最高的m个商品作为相似商品。其中,m可根据实际情况调整。
下面以m=2为例进行示例性说明,假定电子设备找到最相似的两个相似商品分别为商品b和商品c,其中,商品b对应的日平均销量为27.0,商品c对应的日平均销量为28.4。相应的销量分布可以表示为:
vb=[0.0116,0.0493,0.0505,0.0537,0.0287,0.0239,0.0508,0.0128,0.0271,0.0231,0.0818,0.0489,0.0623,0.0671,0.0638,0.0438,0.0423,0.0577,0.0777,0.0226,0.0399,0.0308,0.0191,0.0095];
vc=[0.0071,0.0409,0.0544,0.0654,0.0434,0.0373,0.0745,0.0202,0.0185,0.0056,0.0568,0.0563,0.0607,0.0568,0.0684,0.062,0.0366,0.0315,0.0693,0.0446,0.0554,0.0279,0.0001,0.006]。
其与商品a的相似度表示为sa。其中,相似商品b与商品a之间的相似度为sa_b=0.9877;相似商品c与商品a之间的相似度为sa_c=0.9728。
通过上述设计确定出相似商品后,如图4所示,图2中的步骤s103包括:
步骤s103-1,根据第一销量数据与第二销量数据,获得目标商品的销量比值。
步骤s103-2,将第一销量数据中位于售罄时段内的历史销量作为参考销量。
步骤s103-3,根据参考销量以及销量比值,获得目标商品在售罄时段内的销量数据。
其中,销量比值包括第一比值以及第二比值;第一比值为目标商品的第一参考销量与第二参考销量之间的比值。
第一参考销量为目标商品在第一参考时段的历史销量,其中,第二销售时段内未出现售罄状况的时间段称为第一参考时段。
第二参考销量为目标商品在第二参考时段的历史销量,第一销售时段内与第一参考时段相对应的时间段称为第二参考时段。
示例性的,以天为单位,假定a商品在第二销售时段的第7个小时开始出现售罄状况,则将前6个小时称为第一参考时段。假定,第一参考时段内的销量数据为[5,7,4,10,5,7],即第一参考销量为38。
由于,第一销售时段内与第一参考时段相对应的时间段称为第二参考时段,且第二销售时段以天为单位。因此,若第一销售时段的时间跨度为1天,则将第一销售时段的前6个小时的销量数据作为第二参考销量;若第一销售时段的时间跨度超过为多天,则获取第一销售时段每天当中相同时段的平均销量,然后,将前6个小时的平均销量作为第二参考销量。假定第二参考销量的销量数据的分布为[3.2,5.7,6.4,7.9,4.3,5.4],即第二参考销量为32.9。因此,依据第一参考销量与第二参考销量可以获得第一比值ra,其中,ra=38/32.9=1.155。
第二比值为目标商品与相似商品之间的销量比值,根据第一销量数据与第二销量数据进行计算获得。可以理解为,第二比值的数量与相似商品的数量相同。
作为一种可能的实现方式,电子设备获取第一比值与第二比值之间的平均比值;根据平均比值以及参考销量,获得目标商品在售罄时段内的销量数据。
示例性的,接着上述最相似的两个商品分别为b和c进行示例性说明。假定a商品与相似商品b之间的第二比值为rb=1.037;a商品与相似商品c之间的第二比值为rc=0.986,则最终的平均比值为r=(ra rb rc)/3=1.059。
然后,假定a商品在第7:00开始出现售罄状况,而在第7-24小时出现售罄状况,并且,a商品在7-24小时内每个小时的平均销量为:
[8.8,4.0,3.2,3.4,10.7,7.5,8.2,10.2,9.3,7.4,6.5,6.6,10.8,3.3,7.3,3.8,2.1,1.1];
即该段时间内的参考销量为114.2,则该售罄时段内的预测销量为:l=114.2*1.059≈121。
作为另外一种可能的实现方式,电子设备根据目标商品与相似商品之间的相似度,获得第一比值以及第二比值各自的权重。
然后,该电子设备根据第一比值与第二比值之间各自的权重,获得第一比值与第二比值之间的加权比值;最后,根据加权比值以及参考销量,获得目标商品在售罄时段内的销量数据。
示例性的,可以根据各相似商品的相似度确定其权重,因此,电子设备对相似商品的相似度做softmax计算,得到各个比值的最终权重。即:
式中,sa,a表示a商品与自身的相似度,即sa,a=1,sa,b表示a商品与相似商品b之间的相似度,即sa,b=0.9877;;sa,c表示a商品与相似商品c之间的相似度,即sa,c=0.9728;系数τ用于调节权重的比例,τ越大则待评估商品本身的权重会越大,反之越小。
当τ=10时,a商品自身比值的权重αa=0.3779;a商品与相似商品b之间比值的权重αb=0.3342,a商品与相似商品c之间的比值权重αc=0.2879。则最终比值为rαara αbrb αcrc=1.067。
然后,假定a商品在第7:00开始出现售罄状况,而在第7-24小时出现售罄状况,将7-24小时内的平均销量表示为:
[8.8,4.0,3.2,3.4,10.7,7.5,8.2,10.2,9.3,7.4,6.5,6.6,10.8,3.3,7.3,3.8,2.1,1.1];
即该段时间内的参考销量为114.2,则该售罄时段内的预测销量为:l=114.2*1.067≈122。
基于与上述商品销量数据预测方法同样的发明构思,本实施例还提供一种商品销量数据预测装置,应用于电子设备。商品销量数据预测装置包括至少一个可以软件形式存储于存储器中的功能模块。如图5所示,从功能上划分,商品销量数据预测装置可以包括:
数据获取模块201,用于获取目标商品的第一销量数据以及待预测的售罄时段,其中,第一销量数据为目标商品在第一销售时段内未出现售罄状况的历史销量数据,售罄时段为目标商品在第二销售时段内出现售罄状况的时间段。
本实施例中,该数据获取模块201用于实现图2中的步骤s101,关于该数据获取模块201的详细描述可以参见步骤s101的详细描述。
商品查找模块202,用于根据第一销量数据,确定出相似商品;其中,相似商品在第三销售时段内的第二销量数据与第一销量数据满足预设相似条件。
本实施例中,该商品查找模块202用于实现图2中的步骤s102,关于该商品查找模块202的详细描述可以参见步骤s102的详细描述。
销量预测模块203,用于根据第一销量数据和第二销量数据,预测目标商品在售罄时段内的销量数据。
本实施例中,该销量预测模块203用于实现图2中的步骤s103,关于该销量预测模块203的详细描述可以参见步骤s103的详细描述。
本实施例还提供一种电子设备,该电子设备包括处理器以及存储器,存储器存储有计算机程序,计算机程序被处理器执行时,实现所述的商品销量数据预测方法。
本实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时,实现所述的商品销量数据预测方法。
本实施例还提供一种计算机程序产品,包括计算机程序/指令,计算机程序/指令被处理器执行时实现所述商品销量数据预测方法。
综上所述,本申请实施例公开了ts1、一种商品销量数据预测方法,应用于电子设备,所述方法包括:
获取目标商品的第一销量数据以及待预测的售罄时段,其中,所述第一销量数据为所述目标商品在第一销售时段内未出现售罄状况的历史销量数据,所述售罄时段为所述目标商品在第二销售时段内出现售罄状况的时间段;
根据所述第一销量数据,确定出相似商品;其中,所述相似商品在第三销售时段内的第二销量数据与所述第一销量数据满足预设相似条件;
根据所述第一销量数据和所述第二销量数据,预测所述目标商品在所述售罄时段内的销量数据。
ts2、根据ts1所述的商品销量数据预测方法,所述第一销售时段包括多个子时段,所述相似商品选取自候选商品集,所述根据所述第一销量数据,确定出相似商品,包括:
根据所述第一销量数据,获取所述目标商品在多个所述子时段内的销量分布;
根据所述目标商品的销量分布,从所述候选商品集中确定出所述相似商品。
ts3、根据ts2所述的商品销量数据预测方法,所述根据所述目标商品的销量分布,从所述候选商品集中确定出所述相似商品之前,所述方法还包括:
从初始商品集获取每个候选商品的销售状况信息;
根据每个所述候选商品的销售状况信息,从所述初始商品集中剔除干扰数据以得到所述候选商品集。
ts4、根据ts3所述的商品销量数据预测方法,所述销售状况信息包括每个所述候选商品的销量数据、售后信息以及促销信息;
所述干扰数据包括售后信息出现异常的销量数据、参与促销活动的销量数据以及干扰商品的销量数据,其中,所述干扰商品为销量数据小于预设数量阈值的候选商品。
ts5、根据ts2所述的商品销量数据预测方法,所述候选商品集中包括多个候选商品,所述根据所述目标商品的销量分布,从所述候选商品集中确定出所述相似商品,包括:
获取所述目标商品与多个所述候选商品之间的多个相似度,其中,所述多个相似度分别表征所述目标商品对应的销量分布与每个所述候选商品对应的销量分布之间的相似程度;
从所述多个相似度中,选取至少一个目标相似度;
将所述至少一个目标相似度对应的候选商品,作为所述相似商品。
ts6、根据ts5所述的商品销量数据预测方法,所述获取所述目标商品与多个所述候选商品之间的多个相似度,包括:
获取所述目标商品对应销量分布的第一向量以及多个所述候选商品对应销量分布的多个第二向量;
分别计算所述第一向量与多个所述第二向量之间的多个向量关系;
将多个所述向量关系,作为所述目标商品与多个所述候选商品之间的多个相似度。
ts7、根据ts1-ts6任意一项所述的商品销量数据预测方法,所述目标商品与所述相似商品为同一电商平台的销售商品。
ts8、根据ts1-ts6任意一项所述的商品销量数据预测方法,根据所述第一销量数据和所述第二销量数据,预测所述目标商品在所述售罄时段内的销量数据,包括:
根据所述第一销量数据与所述第二销量数据,获得所述目标商品的销量比值;
将所述第一销量数据中位于所述售罄时段内的历史销量作为参考销量;
根据所述参考销量以及所述销量比值,获得所述目标商品在所述售罄时段内的销量数据。
ts9、根据ts8所述的商品销量数据预测方法,所述销量比值包括第一比值以及第二比值;
所述第一比值为所述目标商品的第一参考销量与第二参考销量之间的比值,其中,所述第一参考销量为所述目标商品在第一参考时段的历史销量,所述第一参考时段位于所述第二销售时段未出现售罄状况的时间段;所述第二参考销量为所述目标商品在第二参考时段的历史销量,所述第二参考时段为所述第一销售时段内与所述第一参考时段相对应的时间段;
所述第二比值为所述目标商品与所述相似商品之间的销量比值,根据所述第一销量数据与所述第二销量数据进行计算获得。
ts10、根据ts9述的商品销量数据预测方法,所述根据所述参考销量以及所述销量比值,获得所述目标商品在所述售罄时段内的销量数据,包括:
获取所述第一比值与所述第二比值之间的平均比值;
根据所述平均比值以及所述参考销量,获得所述目标商品在所述售罄时段内的销量数据。
ts11、根据ts9所述的商品销量数据预测方法,所述根据所述参考销量以及所述销量比值,获得所述目标商品在所述售罄时段内的销量数据,包括:
获取所述第一比值与所述第二比值之间各自的权重;
根据所述第一比值与所述第二比值之间各自的权重,获得所述第一比值与所述第二比值之间的加权比值;
根据所述加权比值以及所述参考销量,获得所述目标商品在所述售罄时段内的销量数据。
ts12、一种商品销量数据预测装置,应用于电子设备,所述商品销量数据预测装置包括:
数据获取模块,用于获取目标商品的第一销量数据以及售罄时段,其中,所述第一销量数据为所述目标商品在销售时段内未出现售罄状况的历史销量数据,所述售罄时段为所述销售时段内出现售罄状况的时间段;
商品查找模块,用于根据所述第一销量数据,确定出相似商品;其中,所述相似商品在所述销售时段内的第二销量数据与所述第一销量数据满足预设相似条件;
销量预测模块,用于根据所述第一销量数据和所述第二销量数据,预测所述目标商品在所述售罄时段内的销量数据。
ts13、根据ts所述的一种商品销量数据预测装置,所述第一销售时段包括多个子时段,所述相似商品选取自候选商品集,所述商品查找模块确定相似商品的方式包括:
根据所述第一销量数据,获取所述目标商品在多个所述子时段内的销量分布;
根据所述目标商品的销量分布,从所述候选商品集中确定出所述相似商品。
ts14、根据ts13所述的一种商品销量数据预测装置,所述根据所述目标商品的销量分布,从所述候选商品集中确定出所述相似商品之前,所述商品查找模块还用于:
从初始商品集获取每个候选商品的销售状况信息;
根据每个所述候选商品的销售状况信息,从所述初始商品集中剔除干扰数据以得到所述候选商品集。
ts15、根据ts14所述的一种商品销量数据预测装置,所述干扰数据包括售后信息出现异常的销量数据、参与促销活动的销量数据以及干扰商品的销量数据,其中,所述干扰商品为销量数据小于预设数量阈值的候选商品。
ts16、根据ts13所述的一种商品销量数据预测装置,所述候选商品集中包括多个候选商品,所述商品查找模块通过所述的目标商品确定相似商品的方式包括:
获取所述目标商品与多个所述候选商品之间的多个相似度,其中,所述多个相似度分别表征所述目标商品对应的销量分布与每个所述候选商品对应的销量分布之间的相似程度;
从所述多个相似度中,选取至少一个目标相似度;
将所述至少一个目标相似度对应的候选商品,作为所述相似商品。
ts17、根据ts16所述的一种商品销量数据预测装置,所述商品查找模块获取所述目标商品与多个所述候选商品之间的多个相似度的方式,包括:
获取所述目标商品对应销量分布的第一向量以及多个所述候选商品对应销量分布的多个第二向量;
分别计算所述第一向量与多个所述第二向量之间的多个向量关系;
将多个所述向量关系,作为所述目标商品与多个所述候选商品之间的多个相似度。
ts18、根据ts12-ts17任意一项所述的商品销量数据预测方法,所述目标商品与所述相似商品为同一电商平台的销售商品。
ts19、根据ts12-ts17任意一项所述的商品销量数据预测方法,所述销量预测模块预测所述目标商品在所述售罄时段内的销量数据的方式,包括:
根据所述第一销量数据与所述第二销量数据,获得所述目标商品的销量比值;
将所述第一销量数据中位于所述售罄时段内的历史销量作为参考销量;
根据所述参考销量以及所述销量比值,获得所述目标商品在所述售罄时段内的销量数据。
ts20、根据ts19所述的商品销量数据预测方法,所述销量比值包括第一比值以及第二比值;
所述第一比值为所述目标商品的第一参考销量与第二参考销量之间的比值,其中,所述第一参考销量为所述目标商品在第一参考时段的历史销量,所述第一参考时段位于所述第二销售时段未出现售罄状况的时间段;所述第二参考销量为所述目标商品在第二参考时段的历史销量,所述第二参考时段为所述第一销售时段内与所述第一参考时段相对应的时间段;
所述第二比值为所述第一销量数据与所述第二销量数据之间的比值。
ts21、根据ts20述的商品销量数据预测方法,所述销量预测模块根据所述参考销量以及所述销量比值,获得所述目标商品在所述售罄时段内的销量数据的方式,包括:
获取所述第一比值与所述第二比值之间的平均比值;
根据所述平均比值以及所述参考销量,获得所述目标商品在所述售罄时段内的销量数据。
ts22、根据ts20所述的商品销量数据预测方法,所述销量预测模块根据所述参考销量以及所述销量比值,获得所述目标商品在所述售罄时段内的销量数据的方式,包括:
获取所述第一比值与所述第二比值之间各自的权重;
根据所述第一比值与所述第二比值之间各自的权重,获得所述第一比值与所述第二比值之间的加权比值;
根据所述加权比值以及所述参考销量,获得所述目标商品在所述售罄时段内的销量数据。
ts23、一种电子设备,所述电子设备包括处理器以及存储器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,实现ts1-ts11任意一项所述的商品销量数据预测方法。
ts24、一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现ts1-ts11任意一项所述的商品销量数据预测方法。
ts25、一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现ts1-ts11任意一项所述商品销量数据预测方法。
因此,本实施例提供的商品销量数据预测方法、装置、设备、介质及产品中,电子设备根据目标商品未出现售罄状况时的第一销量数据,确定出销量数据满足相似条件的相似商品;然后,通过相似商品的第二销量数对目标商品在售罄时段的销量数据。因此,通过其他相似商品的销量数据预测目标商品销量数据的目的,以达到克服目标商品销量较低的局限性所导致的预测精度欠佳的问题。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的各种实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
1.一种商品销量数据预测方法,其特征在于,应用于电子设备,所述方法包括:
获取目标商品的第一销量数据以及待预测的售罄时段,其中,所述第一销量数据为所述目标商品在第一销售时段内的历史销量,所述第一销售时内未出现售罄状况,所述目标商品在第二销售时段内出现售罄状况的时间段为所述售罄时段;
根据所述第一销量数据,确定出相似商品;其中,所述相似商品在第三销售时段内的第二销量数据与所述第一销量数据满足预设相似条件;
根据所述第一销量数据和所述第二销量数据,预测所述目标商品在所述售罄时段内的销量数据。
2.根据权利要求1所述的商品销量数据预测方法,其特征在于,所述第一销售时段包括多个子时段,所述相似商品选取自候选商品集,所述根据所述第一销量数据,确定出相似商品,包括:
根据所述第一销量数据,获取所述目标商品在多个所述子时段内的销量分布;
根据所述目标商品的销量分布,从所述候选商品集中确定出所述相似商品。
3.根据权利要求2所述的商品销量数据预测方法,其特征在于,所述根据所述目标商品的销量分布,从所述候选商品集中确定出所述相似商品之前,所述方法还包括:
从初始商品集获取每个候选商品的销售状况信息;
根据每个所述候选商品的销售状况信息,从所述初始商品集中剔除干扰数据以得到所述候选商品集。
4.根据权利要求3所述的商品销量数据预测方法,其特征在于,所述销售状况信息包括每个所述候选商品的销量数据、售后信息以及促销信息;
所述干扰数据包括售后信息出现异常的销量数据、参与促销活动的销量数据以及干扰商品的销量数据,其中,所述干扰商品为销量数据小于预设数量阈值的候选商品。
5.根据权利要求2所述的商品销量数据预测方法,其特征在于,所述候选商品集中包括多个候选商品,所述根据所述目标商品的销量分布,从所述候选商品集中确定出所述相似商品,包括:
获取所述目标商品与多个所述候选商品之间的多个相似度,其中,所述多个相似度分别表征所述目标商品对应的销量分布与每个所述候选商品对应的销量分布之间的相似程度;
从所述多个相似度中,选取至少一个目标相似度;
将所述至少一个目标相似度对应的候选商品,作为所述相似商品。
6.根据权利要求5所述的商品销量数据预测方法,其特征在于,所述获取所述目标商品与多个所述候选商品之间的多个相似度,包括:
获取所述目标商品对应销量分布的第一向量以及多个所述候选商品对应销量分布的多个第二向量;
分别计算所述第一向量与多个所述第二向量之间的多个向量关系;
将多个所述向量关系,作为所述目标商品与多个所述候选商品之间的多个相似度。
7.一种商品销量数据预测装置,其特征在于,应用于电子设备,所述商品销量数据预测装置包括:
数据获取模块,用于获取目标商品的第一销量数据以及售罄时段,其中,所述第一销量数据为所述目标商品在销售时段内未出现售罄状况的历史销量数据,所述售罄时段为所述销售时段内出现售罄状况的时间段;
商品查找模块,用于根据所述第一销量数据,确定出相似商品;其中,所述相似商品在所述销售时段内的第二销量数据与所述第一销量数据满足预设相似条件;
销量预测模块,用于根据所述第一销量数据和所述第二销量数据,预测所述目标商品在所述售罄时段内的销量数据。
8.一种电子设备,其特征在于,所述电子设备包括处理器以及存储器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,实现权利要求1-6任意一项所述的商品销量数据预测方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现权利要求1-6任意一项所述的商品销量数据预测方法。
10.一种计算机程序产品,其特征在于,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现权利要求1-6任意一项所述商品销量数据预测方法。
技术总结