一种基于位置信息叠加与深度神经网络的城市房屋租金估价方法与流程

专利2022-05-09  74


本发明涉及一种城市住房租金的估价方法,尤其涉及一种基于位置信息叠加与深度神经网络的城市住房租金的估价方法。



背景技术:

租房问题是城市里众多人群需要考虑的问题,尤其是城市的年轻人与中低收入群体需要面对的问题。与住房相比,越多的人选择租房作为个人的主要居住方式。以中国为例,随着城市化的高速推进,中国城市的流动人口数量和比例都在快速增长,而中国流动人口的居住方式,有超过2/3是租房。在这个形势下,政府正在建立“租购并举”的住房制度,鼓励租房行业的发展。目前,中国的新房屋增速已经明显放缓,诸多房地产企业也已将重点投向了租房领域,中国的租房市场正在进行一场巨大的发展。中国当前的住房自有率为90%左右,远远高于各主要发达国家(英国69%,美国64%,日本61%等)。可以预见,未来中国的租房比例会有明显的上升,房租价格对个人生活和社会经济的影响会越来越大。房屋租金正在成为人们日常生活开销的重要部分,是人们进行房地产投资的重要依据之一,也是是政府的房地产政策、市政规划政策以及社会保证政策的重要组成部分,因此,这个话题在当下十分值得进行深入讨论和探究。

在现实中,租房业务的发展也暴露出一定的问题:在政府方面,近年来陆续推行了廉租房、公租房等政策来解决居民的住房问题,但在实施过程中也出现了选址偏远、租金不够合理、贫困再集中等一系列问题,许多地方出现了公租房“遇冷”的尴尬局面;在市场方面,租房市场中也出现了不少对于消费者的欺诈、信息不透明等问题。这些问题往往是由于人们没有深入掌握房屋租金的定价模型而造成的。因此,深入探索房租价格的规律,寻求较为可靠的房租定价模型并运用到人们的相关活动中,是一个有意义且十分必要的工作。

特征价格模型(hpm)是评估房价的一种行之有效的方法,自提出以来受到了极为广泛的应用。该方法认为房屋作为一种商品,是由众多不同的特征组成的。可以将房地产商品的价格分解成各个特征,以显现出各种因素对于房价的贡献。已有技术基于hpm对于房价进行了评估,揭示了房价的影响因素包括房屋建筑本身的特征、距离城市cbd的距离、距离学校的距离、公园绿地的可达性等区位条件等。hpm方法是解释房价规律的一种有效、可靠的手段。然而,hpm模型由于形式比较简单,没有考虑房价的空间分异性,其对于房价的拟合程度不是很高。空间计量经济学中的空间滞后模型(spatiallagmodel,slm)和空间误差模型(spatialerrormodel,sem),使用空间邻接矩阵来反映空间结构造成的影响。不过空间滞后模型和空间误差模型对于房价的拟合精度也比较有限。近年来,地理加权回归(gwr)被广泛应用到房价的研究和评估中。该方法基于局部光滑思想,能够考虑样本在空间范围中的空间异质性特征,且对于空间矩阵的参数有良好的处理方式。gwr对于房价的规律有不错的解释能力,有一定的拟合精度,且可以反映附近房屋价格/租金的影响,所以gwr成为了近年来较为广泛使用的方法。不过,gwr也存在过拟合、稳健性较差等问题。

随着大数据时代的到来,深度学习(deeplearning)方法以其优越的拟合、表达能力,强大的性能,高度的泛化、自动化程度实现了对大数据的强大支持,从而获得了学术界和工业界的广泛应用。深度学习方法相较于以上传统方法对于房价的拟合精度有较大的优势。不过相较于基于空间信息的slm、sem、gwr等方法,深度学习没有显式地考虑房价中的空间异质性特征,即附近房价的影响关联不能很明确地体现在深度学习方法中。因此,深度学习对于房屋租金价格的拟合精度在理论上仍存在一定的提升空间。

此外,传统上用于衡量房屋的区位因子包括“距cbd的距离”、“距学校的距离”、“距公园的距离”等,若仅用这数十个因子衡量房屋的区位,可能会损失一定的区位信息,导致房屋价格或租金的拟合不够精确。考虑更多的poi类型因素,考虑更多地理尺度的影响,借助位置信息的多尺度叠加,能够对房屋的区位信息挖掘得更加全面、深入,也可以更多地提高房屋租金拟合、评估的精度。



技术实现要素:

针对以上问题,在已有房价、房租模型的基础上,结合位置信息叠加、深度学习和地理加权回归(gwr)的方法,设计城市住房租金的定价模型。基于多尺度的位置信息叠加,可以充分挖掘、体现房屋所在的区位、邻里特征属性;将深度学习与地理加权回归相结合,可以一方面顾及到房价中的非线性、复杂特征,一方面体现房价的空间异质性,即附近房价的影响。本发明可以较为准确地拟合、评估房租的价格。主要内容包含以下几个方面:

一种基于位置信息叠加与深度神经网络的城市房屋租金估价方法,其特征在于:包括

以下步骤,

步骤1、对房屋周边的各类兴趣点(poi)进行多尺度的位置信息叠加;

步骤2、将位置信息的叠加结果与房屋本身的建筑属性(如面积、楼层、建筑时间等)合并,作为输入向量,将房屋租金作为输出向量,使用深度神经网络进行深度学习,拟合房屋租金估价的深度模型;

步骤3、将深度模型得到的房屋租金拟合与地理加权回归(gwr)模型结合,使租金的评估更充分地考虑地理位置的临近因素;

步骤4、统计各房屋附近的租金样本点个数,当附近的租房样本点较多时,以步骤3地理加权回归模型的结果作为房租估价的最终结果;当附近的租房样本点较少时,以步骤2深度模型的结果作为房租估价的最终结果;

步骤5、采集一个城市的租房信息数据和poi数据,包含租赁房屋的建筑属性、租金、各poi的位置和类型,将数据按照步骤1-3进行位置叠加、深度学习和地理加权回归,从而得到深度学习模型和地理加权回归模型的各项参数;对于待估价的房屋,按同样的方式进行位置叠加,并将该房屋的相关属性输入到上述的深度学习模型和地理加权回归模型中,最终得到房屋的租金估价。

在上述的一种基于位置信息叠加与深度神经网络的城市房屋租金估价方法,在步骤1中,将房屋周边的每一类兴趣点(poi)的数量根据附近距离进行多尺度分别统计;记poi兴趣点为p1,p2,…,pn,根据各个距离尺度h1,h2,…,hm,对房屋周边各类型poi类型的数量单独计数,计数得到的各个数值放到一起,组成一个向量,记为区位属性向量l,l=[l11,l12,…,l1m,l21,…,l2m,…,ln1,…,lnm]。

在上述的一种基于位置信息叠加与深度神经网络的城市房屋租金估价方法,在步骤2中,将房屋本身的建筑属性因子(如:面积、楼层、建筑时间等属性,分别记为a1,a2,…,ak)组成建筑属性向量a,与步骤1中的区位属性向量l合并,得到的向量v(=[a1,a2,…,ak,l11,l12,…,l1m,l21,…,l2m,…,ln1,…,lnm])作为深度学习的输入向量,使用全连接深度神经网络进行深度学习;深度学习的损失函数为loss=sum(y-y*)2 0.0001*sum(wij2),其中y表示租金拟合值,y*表示租金真实值,wij为各隐藏层中的神经元参数,学习目标是使loss达到最小;记模型训练完成后,深度学习得到的租金拟合值为yd。

在上述的一种基于位置信息叠加与深度神经网络的城市房屋租金估价方法,在步骤3中,将步骤2所得深度模型的拟合值(yd)与房租建筑因子a进行组合,得到的向量[yd,a]作为gwr的自变量,将房租价格作为因变量,进行地理加权回归(gwr)拟合;gwr的形式为

其中(ui,vi)为第i个房屋的坐标,n表示数据集中房屋的数量,m表示gwr输入因子的个数,βk(ui,vi)是第i个房屋的第k个回归参数,εi为残差项;第i个房屋样本点的回归参数估计值为:其中w为n×n的对角矩阵,对角线上各元素表示各个样本点的数据对于本房屋观测点的地理加权权重,w(ui,vi)=dia(wi1,wi2……wi3.,…,win),可通过高斯核函数来确定,gwr模型的带宽b通过akaike信息准则方法确定;记通过gwr拟合得到的房屋租金为yg。

在上述的一种基于位置信息叠加与深度神经网络的城市房屋租金估价方法,在步骤4中,根据gwr模型的带宽b,统计得到位于房屋i的附近b距离内,包含数据集中的租金样本点为neari个,所有房屋的附近b距离内样本点个数的平均值为nearavg个;当房屋附近的租房样本点较多(neari>nearavg)时,将步骤3地理加权回归模型的结果yg(i)作为房租评估的最终结果;当附近的租房样本点较少时(neari<nearavg),将步骤2深度模型的结果yd(i)作为房租评估的最终结果;即最终拟合值为

本发明具有如下优点:1、基于多尺度的位置信息叠加,可以充分挖掘、体现房屋所在的区位、邻里特征属性;2、将深度学习与地理加权回归相结合,可以一方面顾及到房价中的非线性、复杂特征,一方面体现房价的空间异质性特征,反映了附近房价的影响。本模型可以较为准确地拟合、评估城市房租的价格。

附图说明

图1是兴趣点的多尺度位置信息叠加示意图。

图2是深度学习模型示意图。

图3是深度学习模型与地理加权回归模型结合示意图(即方法总体流程图)。

具体实施方式

步骤1:将房屋周边的每一类兴趣点(poi)的数量根据附近多个距离(如500m、1000m、5000m等,如图1)进行分别统计。各个距离、各类型poi类型的数量均单独计数,计数得到的各个数值放到一起,组成一个向量,作为房屋的区位属性因子。poi的类型可参考百度地图poi:

http://lbsyun.baidu.com/index.php?title=lbscloud/poitags

例如,统计了中餐厅、公园、中学等poi类型在500m、1000m、5000m范围内的数量,它们可以构成向量[500m内中餐厅数量,500m内公园数量,500m内中学数量,1000m内中餐厅数量,1000m内公园数量,1000m内中学数量,5000m内中餐厅数量,5000m内公园数量,5000m内中学数量,…].

步骤2:将位置信息的叠加结果与房屋本身的建筑属性(如面积、楼层、建筑时间等)合并,作为输入向量,将房屋租金作为输出向量,使用深度神经网络进行深度学习,拟合房屋租金估价的深度模型,如图2。具体分为两个小步骤:

步骤2-1:将房屋本身的建筑属性因子(如:房屋面积、楼层、建筑时间等)与以上区位属性因子合并,作为深度学习的输入向量,如图3。例如,根据以上示例可以得到深度学习的输入向量[房屋面积,楼层,建筑时间,...,500m内中餐厅数量,500m内公园数量,500m内中学数量,1000m内中餐厅数量,1000m内公园数量,1000m内中学数量,5000m内中餐厅数量,5000m内公园数量,5000m内中学数量,…].

步骤2-2:取数据集的一部分(约40%),以房屋租金为结果输出值,步骤2-1所得为输入向量,使用深度神经网络进行深度学习。学习目标是的房租预测值与真实值的残差平方和达到最小;激活函数用的是relu;反向传播算法使用梯度下降算法;每次训练的样本数为50个。模型的初始学习率为0.8,学习率的衰减为0.99;滑动平均的衰减率为0.99;正则化使用的是l2正则化,正则化权重为0.0001。即深度学习模型的损失函数为loss=sum(y-y*)2 0.0001*sum(wij2)

其中y表示模型拟合值,y*表示真实值,wij为各隐藏层中的神经元参数。

模型训练完成后,记深度学习得到的房屋租金拟合值为yd,第i个房屋通过深度学习拟合的租金为yd(i)。

步骤3:为考虑附近房屋价格的影响,引入地理加权回归(gwr)模型。将房屋租金估价的深度学习结果与地理加权回归(gwr)模型结合。取数据集中的另一部分(约40%),将步骤2所得深度模型的拟合值(yd)与房租建筑因子a进行组合,得到[yd,a]作为gwr的自变量,将房租价格作为因变量,进行地理加权回归拟合。gwr的形式如下

这里(ui,vi)为第i个房屋的坐标,n表示数据集中房屋的数量,m表示gwr输入因子的个数,βk(ui,vi)是第i个房屋的第k个回归参数,εi为残差项。第i个房屋样本点的回归参数估计值为:其中w为n×n的对角矩阵,对角线上各元素表示各个样本点的数据对于本房屋观测点的地理加权权重,w(ui,vi)=dia(wi1,wi2……wi3.,…,win)。地理加权权重可通过高斯核函数来确定:wij=exp(-(dij/b)2)。其中,dij表示房屋i和房屋j之间的距离,b地理加权回归模型中的带宽,带宽通过akaike信息准则(aic)方法确定,使得模型的aicc值达到最小的b为gwr模型中确定的带宽。记通过gwr拟合得到的房屋租金为yg,第i个房屋通过gwr拟合的租金为yg(i)。

步骤4:统计各房屋附近的租金样本点个数。根据gwr模型的带宽b,可统计到位于房屋i的附近b距离内,数据集中的租金样本点为neari个,所有房屋的附近b距离内样本点个数的平均值为nearavg个。当附近的租房样本点较多(neari>nearavg)时,以地理加权回归模型的结果yg作为房租评估的最终结果;当附近的租房样本点较少时(neari<nearavg),以步骤3深度模型的结果yd作为房租评估的最终结果。即最终拟合值为

步骤5:采集一个城市的租房信息数据和poi数据,包含租赁房屋的建筑属性、租金、各poi的位置和类型等,将数据按照以上步骤进行位置叠加、深度学习和地理加权回归,从而得到深度学习模型和地理加权回归模型的各项参数。对于待估价的房屋,按同样的方式进行位置叠加,并将该房屋的相关属性输入到上述的深度学习模型和地理加权回归模型中,最终得到房屋的租金估价。方法的流程如图3所示。

本文中所描述的具体实施例仅对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例进行各种各样的修改、补充或采用类似的方式对其中部分技术特征进行等同替换,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。


技术特征:

1.一种基于位置信息叠加与深度神经网络的城市房屋租金估价方法,其特征在于:包括以下步骤,

步骤1、对房屋周边的各类兴趣点(poi)进行多尺度的位置信息叠加;

步骤2、将位置信息的叠加结果与房屋本身的建筑属性(如面积、楼层、建筑时间等)合并,作为输入向量,将房屋租金作为输出向量,使用深度神经网络进行深度学习,拟合房屋租金估价的深度模型;

步骤3、将深度模型得到的房屋租金拟合与地理加权回归(gwr)模型结合,使租金的评估更充分地考虑地理位置的临近因素;

步骤4、统计各房屋附近的租金样本点个数,当附近的租房样本点较多时,以步骤3地理加权回归模型的结果作为房租估价的最终结果;当附近的租房样本点较少时,以步骤2深度模型的结果作为房租估价的最终结果;

步骤5、采集一个城市的租房信息数据和poi数据,包含租赁房屋的建筑属性、租金、各poi的位置和类型,将数据按照步骤1-3进行位置叠加、深度学习和地理加权回归,从而得到深度学习模型和地理加权回归模型的各项参数;对于待估价的房屋,按同样的方式进行位置叠加,并将该房屋的相关属性输入到上述的深度学习模型和地理加权回归模型中,最终得到房屋的租金估价。

2.根据权利要求1所述的一种基于位置信息叠加与深度神经网络的城市房屋租金估价方法,其特征在于:在步骤1中,将房屋周边的每一类兴趣点(poi)的数量根据附近距离进行多尺度分别统计;记poi兴趣点为p1,p2,…,pn,根据各个距离尺度h1,h2,…,hm,对房屋周边各类型poi类型的数量单独计数,计数得到的各个数值放到一起,组成一个向量,记为区位属性向量l,l=[l11,l12,…,l1m,l21,…,l2m,…,ln1,…,lnm]。

3.根据权利要求1所述的一种基于位置信息叠加与深度神经网络的城市房屋租金估价方法,其特征在于:在步骤2中,将房屋本身的建筑属性因子(如:面积、楼层、建筑时间等属性,分别记为a1,a2,…,ak)组成建筑属性向量a,与步骤1中的区位属性向量l合并,得到的向量v(=[a1,a2,…,ak,l11,l12,…,l1m,l21,…,l2m,…,ln1,…,lnm])作为深度学习的输入向量,使用全连接深度神经网络进行深度学习;深度学习的损失函数为loss=sum(y-y*)2 0.0001*sum(wij2),其中y表示租金拟合值,y*表示租金真实值,wij为各隐藏层中的神经元参数,学习目标是使loss达到最小;记模型训练完成后,深度学习得到的租金拟合值为yd。

4.根据权利要求1所述的一种基于位置信息叠加与深度神经网络的城市房屋租金估价方法,其特征在于:在步骤3中,将步骤2所得深度模型的拟合值(yd)与房租建筑因子a进行组合,得到的向量[yd,a]作为gwr的自变量,将房租价格作为因变量,进行地理加权回归(gwr)拟合;gwr的形式为

其中(ui,vi)为第i个房屋的坐标,n表示数据集中房屋的数量,m表示gwr输入因子的个数,βk(ui,vi)是第i个房屋的第k个回归参数,εi为残差项;第i个房屋样本点的回归参数估计值为:其中w为n×n的对角矩阵,对角线上各元素表示各个样本点的数据对于本房屋观测点的地理加权权重,w(ui,vi)=dia(wi1,wi2……wi3.,…,win),可通过高斯核函数来确定,gwr模型的带宽b通过akaike信息准则方法确定;记通过gwr拟合得到的房屋租金为yg。

5.根据权利要求1所述的一种基于位置信息叠加与深度神经网络的城市房屋租金估价方法,其特征在于:在步骤4中,根据gwr模型的带宽b,统计得到位于房屋i的附近b距离内,包含数据集中的租金样本点为neari个,所有房屋的附近b距离内样本点个数的平均值为nearavg个;当房屋附近的租房样本点较多(neari>nearavg)时,将步骤3地理加权回归模型的结果yg(i)作为房租评估的最终结果;当附近的租房样本点较少时(neari<nearavg),将步骤2深度模型的结果yd(i)作为房租评估的最终结果;即最终拟合值为

技术总结
本发明提供一种基于位置信息叠加与深度神经网络的城市房屋租金估价方法,结合位置信息叠加、深度学习和地理加权回归(GWR)的方法,设计城市住房租金的定价模型。基于多尺度的位置信息叠加,可以充分挖掘、体现房屋所在的区位、邻里特征属性;将深度学习与地理加权回归相结合,可以一方面顾及到房价中的非线性、复杂特征,一方面体现房价的空间异质性特征,即反映了附近房价的影响。本模型可以较为准确地拟合、评估房租的价格。

技术研发人员:李霖;沈航;朱海红;罗振威;金榜;杨玉霖;刘羽
受保护的技术使用者:武汉大学
技术研发日:2021.04.30
技术公布日:2021.08.03

转载请注明原文地址:https://doc.8miu.com/read-8580.html

最新回复(0)