本发明属于测绘与地理信息领域,特别涉及城市制图与城市边界的识别技术方案。
背景技术:
在城市相应的技术研究中,首先需要面对的问题是如何定义城市。落脚到现实空间,这个问题即可以具体表述为:如何从空间上界定一个城市聚落。城市的空间界定也是城市研究需要面对的基本问题之一,这是因为城市的绝大多数统计指标,如城市人口、城市gdp,只有在空间范围明确的情况下,才能够被统计。尽管城市的空间界定是研究基础,非常重要,但它又是困难的,因为它可以有不同的社会、经济、文化意义。有的学者将城市的空间范围划分成行政地域、实体地域和功能地域三种;也有的学者认为“城市”的空间范围确定取决于它被定义为法律实体,如行政区域,还是物理实体,如“具有城市特征的区域”。以上的观点都反映了城市空间定义的多样性。城市定义的这种多样性,在城市比较研究中尤其需要注意,特别是城市的跨国比较研究。在城市的跨国比较研究中,城市不同界定的差异经常容易被忽视,这极大影响了城市比较研究结果的可靠性。当前,仍旧缺乏城市定义的全球共识和国际标准。同时,随着资本日益渗透到农村、工矿和偏远地区,城市和农村的景观日益混合,两者的空间边界日益模糊,传统常用的“城市/乡村”二分法也变得日益困难和不充分。因此,研究城市多层次边界的自动识别方法具有较强的科学研究意义和应用实践价值,是目前自动化空间数据测绘处理技术领域亟待解决的技术问题。
背景文献:
[1].周一星,2006.城市研究的第一科学问题是基本概念的正确性[j].城市规划学刊,(01):1–5.
[2].angels,bleiam,parentj,等,2016.atlasofurbanexpansion—2016edition[j].thenyuurbanizationproject:newyork,ny,usa.
[3].battym,fergusonp,2011.definingcitysize[j].environmentandplanningb:planninganddesign,38(5):753–756.
[4].escht,heldensw,hirnera,等,2017.breakingnewgroundinmappinghumansettlementsfromspace–theglobalurbanfootprint[j].isprsjournalofphotogrammetryandremotesensing,134:30–42.
[5].liuz,hec,zhouy,等,2014.howmuchoftheworld’slandhasbeenurbanized,really?ahierarchicalframeworkforavoidingconfusion[j].landscapeecology,29(5):763–771.
[6].liux,huangy,xux,等,2020.high-spatiotemporal-resolutionmappingofglobalurbanchangefrom1985to2015[j].naturesustainability,:1–7.
[7].parrjb,2007.spatialdefinitionsofthecity:fourperspectives[j].urbanstudies,44(2):381–392.
[8].rozenfeldhd,rybskid,andradejs,等,2008.lawsofpopulationgrowth[j].proceedingsofthenationalacademyofsciences,105(48):18702–18707.
[9].schneidera,friedlma,potered,2010.mappingglobalurbanareasusingmodis500-mdata:newmethodsanddatasetsbasedon‘urbanecoregions’[j].remotesensingofenvironment,114(8):1733–1746.
[10].setokc,fragkiasm,
[11].
[12].unitednationsdofeandsa,2018.theworld’scitiesin2018—databooklet[r].un[2020–02–14].
[13].wandldia,2014.beyondurban–ruralclassifications:characterisingandmappingterritories-in-betweenacrosseurope[j].landscapeandurbanplanning,:14.
[14].worldbank,2020.theworldbankdata[eb/ol](2020)[2020–12–24].https://data.worldbank.org/indicator/sp.urb.totl.in.zs.
[15].王新生,刘纪远,庄大方,等.2005.中国特大城市空间形态变化的时空特征[j].地理学报,60(3):392-400.
技术实现要素:
本发明的目的在于针对上述不足,研究一种城市多层次边界的自动识别方法及系统。
为了实现上述目的,本发明提出的技术方案一方面提供一种城市多层次边界的识别方法,包括以下步骤:
步骤1,对不透水面空间数据和水体空间数据进行预处理;
步骤2,对不透水面空间数据和水体空间数据进行焦点统计;
步骤3,基于决策树方法对步骤2的统计结果进行分类,生成城市化斑块的空间数据;
步骤4,对步骤3所得城市化斑块的空间数据,基于每个斑块的面积大小指标进行ruc聚类;
步骤5,对步骤4的聚类结果进行后处理,生成城市多层次边界。
而且,步骤1中对不透水面空间数据和水体空间数据进行预处理的过程为,对不透水面空间数据和水体空间数据分别进行异常值剔除,然后将两种数据转换成相同的空间坐标系,并重采样生成相同像元大小的栅格数据。
而且,步骤2中的焦点统计实现方式为,计算每个不透水面像元位置周围预设半径的统计邻域内不透水面像元的数量占比,公式如下,
其中,pbuilt指最终的统计结果,cimpervious指的统计邻域内的不透水面像元的数量,n指的统计邻域内的像元总数量,cwater指的统计邻域内的水体像元的数量。
而且,步骤3中的使用决策树对步骤2的统计结果进行分类,决策树实现过程为,将pbuilt≥0.5的格网指定为“urbanpatches”类别,将0.25≤pbuilt<0.5且与“urbanpatches”类别格网空间邻接的格网指定为“suburbanpatches”类别,将不满足以上两个条件的格网指定为“ruralpatches”类别;将“urbanpatches”和“suburbanpatches”类别合并,并从栅格数据转换为矢量数据,得到城市化斑块”。
而且,步骤4中ruc聚类方法,实现如下,
首先,对待处理的矢量数据斑块全部赋予“空”的类号,按照选定的规模指标从大到小进行排序,并降序依次进行处理:
判断当前处理的斑块半径距离d的搜索邻域内是否有类号非空的斑块;
如果有,则将距当前处理斑块最近的类号非空斑块的类号复制给当前处理斑块;
如果没有,则判断当前处理斑块的规模指标是否大于等于预设的相应阈值smin,如果是,则为当前处理斑块分配一个新的类号,如果不是,则不做处理;
当所有斑块遍历完一遍之后,聚类结束。
而且,步骤5中后处理,实现方式如下,
对步骤4所得结果中所有有类号的斑块,先进行外缓冲区分析操作,再进行内缓冲区操作,与步骤4的结果中所有有类号的斑块进行合并,从而得到最外围城市边界ue;
用ue去裁剪原始的不透水面数据,落入每个ue范围内的不透水面称为城市建成区ub;
对每个ue范围内值域在前10%的格网连接形成的最大斑块,以及值域在前10%的格网连接形成的、总面积大于预设面积阈值的斑块,称为城市核心区uc;
对落入每个ue的水体数据,称为城市内水体;
对于每个ue内的非ub且非水体的像元,称为城市开放空间;对步骤4所得结果中所有没有类号且没有落入任何ue范围内的斑块,称为远郊建成区。
本发明还提供一种城市多层次边界的识别系统,用于实现如上所述的一种城市多层次边界的识别方法。
而且,包括以下模块,
第一模块,用于对不透水面空间数据和水体空间数据进行预处理;
第二模块,用于对不透水面空间数据和水体空间数据进行焦点统计;
第三模块,用于基于决策树方法对第二模块的统计结果进行分类,生成城市化斑块的空间数据;
第四模块,用于对第三模块所得城市化斑块的空间数据,基于每个斑块的面积大小指标进行ruc聚类;
第五模块,用于对第四模块的聚类结果进行后处理,生成城市多层次边界。
而且,包括处理器和存储器,存储器用于存储程序指令,处理器用于调用存储器中的存储指令执行如上所述的一种城市多层次边界的识别方法。
而且,包括可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序执行时,实现如上所述的一种城市多层次边界的识别方法。
本发明的优点在于:
1)提出的城市边界识别方法,主要基于城市的物理形态特征进行识别,适用于全球不同区域的城市居民地,不受不同国家的城市的行政边界影响。本发明的应用前景广泛,可以用于支持全球的城市比较研究,并可以支持学术界以外的可持续发展全球资源自动化分析,满足科研和生产、管理需求。
2)提出的城市边界识别方法,可以识别城市的多层次边界,克服了传统的“城市/乡村”二分法的不足,可以为城市跨学科研究提供数据基础。
本发明方案实施简单方便,实用性强,解决了相关技术存在的实用性低及实际应用不便的问题,能够提高用户体验,具有重要的市场价值。
附图说明
图1为本发明实施例的流程图;
图2为本发明实施例的基于排名的城市聚类法示意图。
具体实施方式
以下结合附图和实施例具体说明本发明的技术方案。
如图1所示,本发明实施例提供的一种城市多层次边界的自动识别方法,包括以下步骤:
步骤1:对不透水面空间数据和水体空间数据进行预处理。
所述步骤1中对不透水面空间数据和水体空间数据进行预处理的过程具体为:对数据首先进行异常值剔除,然后将两种数据转换成相同的空间坐标系,并重采样生成相同像元大小的栅格数据。
实施例中步骤1的实现主要包括:首先,对数据首先进行异常值剔除;然后,可以使用esri公司的arcgis软件平台,将两种数据转换成相同的空间坐标系;最后,可以使用arcgis软件中的“重采样”工具将两种数据重采样生成相同像元大小的栅格。
如果使用的两种数据已经是坐标统一、像元大小一致的遥感数据产品,则本步骤可以省略。
步骤2:对不透水面空间数据和水体空间数据进行焦点统计。
焦点统计方法,是计算每个不透水面像元位置周围预设半径(优选建议1公里)的统计邻域内不透水面像元的数量占比,其计算公式如下:
其中,pbuilt指最终的统计结果,cimpervious指的统计邻域内的不透水面像元的数量,n指的统计邻域内的像元总数量,cwater指的统计邻域内的水体像元的数量。
具体实施时,对于焦点统计,可以对两种数据分别使用arcgis软件中的“焦点统计”工具进行数量统计,然后结合arcgis软件中的“栅格计算器”工具依据上述公式进行合并计算;或者可以借助googleearthengine这种云计算平台通过编程实现本步骤的完整过程。
步骤3:基于决策树方法对步骤2的统计结果进行分类,生成“城市化斑块”的空间数据。
决策树的具体过程为:
将pbuilt≥0.5的格网指定为“urbanpatches”类别;其中urbanpatches表示城区图斑块;
将0.25≤pbuilt<0.5且与“urbanpatches”类别格网空间邻接的格网指定为“suburbanpatches”类别;其中suburbanpatches表示郊区斑块;
将不满足以上两个条件的格网指定为“ruralpatches”类别。其中ruralpatches表示农村斑块;
将“urbanpatches”和“suburbanpatches”类别合并,并从栅格数据转换为矢量数据,称为“城市化斑块”。
具体实施时,本步骤可以通过python编程实现全过程,或者借助arcgis软件中的“按属性提取”工具和“重分类”工具结合来完成。
步骤4:对步骤3得到的“城市化斑块”数据,基于每个斑块的面积大小指标进行“ruc”聚类。
本发明提出的“ruc”聚类方法,其全称是“基于排名的城市聚类法”,英文是“rank-basedurbanclusteringalgorithm”,简称“ruc”,该方法主要有两个参数:搜索距离d和最小分类阈值smin。
参见图2,该方法的主要流程是:
首先,对待处理的矢量数据斑块全部赋予“空”的类号,按照选定的规模指标从大到小进行排序,并降序依次进行处理:
判断当前处理的斑块半径距离d的搜索邻域内是否有类号非空的斑块;
如果有,则将距当前处理斑块最近的类号非空斑块的类号复制给当前处理斑块;
如果没有,则判断当前处理斑块的规模指标是否大于等于预设的相应阈值smin,如果是,则为当前处理斑块分配一个新的类号,如果不是,则不做处理;
当所有斑块遍历完一遍之后,聚类结束。
具体实施时,该聚类可以基于esri软件平台中的arcgisforpythonapi结合python编程语言实现。阈值smin可以根据具体情况设定。
步骤5:对步骤4的聚类结果进行后处理,生成城市多层次边界。
本步骤可以借助python语音编程实现,也可使用arcgis软件平台中的arctoolbox工具包实现。
所述后处理,具体是指:
对步骤4的结果中所有有类号的斑块,先进行外缓冲区分析操作,再进行内缓冲区操作,与步骤4的结果中所有有类号的斑块进行合并,从而得到最外围城市边界(记为“urbanextent”,简称ue);
用ue去裁剪原始的不透水面数据,落入每个ue范围内的不透水面称为城市建成区(记为“urbanbuilt-uparea”,简称ub);
对每个ue范围内值域在前10%的格网连接形成的最大斑块,以及值域在前10%的格网连接形成的、总面积大于预设面积阈值(实施例中优选设置为50平方公里)的斑块,称为城市核心区(记为“urbandensecentre”,简称uc);
对落入每个ue的水体数据,称为城市内水体(记为“urbanwaterbody”);对于每个ue内的非ub且非水体的像元,称为城市开放空间(记为“urbanopenspace”);
对步骤4的结果中所有没有类号且没有落入任何ue范围内的斑块,称为远郊建成区(记为“ex-urbanbuilt-uparea”,简称eb)。
通过一系列后处理,最终输出包括“城市核心区”、“城市建成区”、“城市范围”、“城市开放空间”、“城市水体”和“远郊建成区”在内的多层次城市边界。
本发明是测绘与地理信息领域,在城市科学研究和城市可持续发展国际议程中面临城市空间界定不统一、城市多层次边界认识缺乏的背景下,提供一种城市多层次边界的识别方法。该方法主要基于城市的物理形态特征进行识别,适用于全球不同区域的城市居民地,不受不同国家的城市的行政边界影响;同时,方法可以自动识别城市的多层次边界,克服了传统的“城市/乡村”二分法的不足,可以为城市跨学科研究和多领域大数据应用提供数据基础。提出的方法具有较强的科学研究意义和应用实践价值。
具体实施时,本发明技术方案提出的方法可由本领域技术人员采用计算机软件技术实现自动运行流程,实现方法的系统装置例如存储本发明技术方案相应计算机程序的计算机可读存储介质以及包括运行相应计算机程序的计算机设备,也应当在本发明的保护范围内。
在一些可能的实施例中,提供一种城市多层次边界的识别系统,包括以下模块,
第一模块,用于对不透水面空间数据和水体空间数据进行预处理;
第二模块,用于对不透水面空间数据和水体空间数据进行焦点统计;
第三模块,用于基于决策树方法对第二模块的统计结果进行分类,生成城市化斑块的空间数据;
第四模块,用于对第三模块所得城市化斑块的空间数据,基于每个斑块的面积大小指标进行ruc聚类;
第五模块,用于对第四模块的聚类结果进行后处理,生成城市多层次边界。
在一些可能的实施例中,提供一种城市多层次边界的识别系统,包括处理器和存储器,存储器用于存储程序指令,处理器用于调用存储器中的存储指令执行如上所述的一种城市多层次边界的识别方法。
在一些可能的实施例中,提供一种城市多层次边界的识别系统,包括可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序执行时,实现如上所述的一种城市多层次边界的识别方法。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
1.一种城市多层次边界的识别方法,其特征在于,包括以下步骤:
步骤1,对不透水面空间数据和水体空间数据进行预处理;
步骤2,对不透水面空间数据和水体空间数据进行焦点统计;
步骤3,基于决策树方法对步骤2的统计结果进行分类,生成城市化斑块的空间数据;
步骤4,对步骤3所得城市化斑块的空间数据,基于每个斑块的面积大小指标进行ruc聚类;
步骤5,对步骤4的聚类结果进行后处理,生成城市多层次边界。
2.根据权利要求1所述城市多层次边界的识别方法,其特征在于:步骤1中对不透水面空间数据和水体空间数据进行预处理的过程为,对不透水面空间数据和水体空间数据分别进行异常值剔除,然后将两种数据转换成相同的空间坐标系,并重采样生成相同像元大小的栅格数据。
3.根据权利要求1所述城市多层次边界的识别方法,其特征在于:步骤2中的焦点统计实现方式为,计算每个不透水面像元位置周围预设半径的统计邻域内不透水面像元的数量占比,公式如下,
其中,pbuilt指最终的统计结果,cimpervious指的统计邻域内的不透水面像元的数量,n指的统计邻域内的像元总数量,cwater指的统计邻域内的水体像元的数量。
4.根据权利要求1所述城市多层次边界的识别方法,其特征在于:步骤3中的使用决策树对步骤2的统计结果进行分类,决策树实现过程为,将pbuilt≥0.5的格网指定为“urbanpatches”类别,将0.25≤pbuilt<0.5且与“urbanpatches”类别格网空间邻接的格网指定为“suburbanpatches”类别,将不满足以上两个条件的格网指定为“ruralpatches”类别;将“urbanpatches”和“suburbanpatches”类别合并,并从栅格数据转换为矢量数据,得到城市化斑块”。
5.根据权利要求1所述城市多层次边界的识别方法,其特征在于:步骤4中ruc聚类方法,实现如下,
首先,对待处理的矢量数据斑块全部赋予“空”的类号,按照选定的规模指标从大到小进行排序,并降序依次进行处理:
判断当前处理的斑块半径距离d的搜索邻域内是否有类号非空的斑块;
如果有,则将距当前处理斑块最近的类号非空斑块的类号复制给当前处理斑块;
如果没有,则判断当前处理斑块的规模指标是否大于等于预设的相应阈值smin,如果是,则为当前处理斑块分配一个新的类号,如果不是,则不做处理;
当所有斑块遍历完一遍之后,聚类结束。
6.根据权利要求1或2或3或4或5所述城市多层次边界的识别方法,其特征在于:步骤5中后处理,实现方式如下,
对步骤4所得结果中所有有类号的斑块,先进行外缓冲区分析操作,再进行内缓冲区操作,与步骤4的结果中所有有类号的斑块进行合并,从而得到最外围城市边界ue;
用ue去裁剪原始的不透水面数据,落入每个ue范围内的不透水面称为城市建成区ub;
对每个ue范围内值域在前10%的格网连接形成的最大斑块,以及值域在前10%的格网连接形成的、总面积大于预设面积阈值的斑块,称为城市核心区uc;
对落入每个ue的水体数据,称为城市内水体;
对于每个ue内的非ub且非水体的像元,称为城市开放空间;对步骤4所得结果中所有没有类号且没有落入任何ue范围内的斑块,称为远郊建成区。
7.一种城市多层次边界的识别系统,其特征在于:用于实现如权利要求1-6任一项所述的一种城市多层次边界的识别方法。
8.根据权利要求7所述城市多层次边界的识别系统,其特征在于:包括以下模块,
第一模块,用于对不透水面空间数据和水体空间数据进行预处理;
第二模块,用于对不透水面空间数据和水体空间数据进行焦点统计;
第三模块,用于基于决策树方法对第二模块的统计结果进行分类,生成城市化斑块的空间数据;
第四模块,用于对第三模块所得城市化斑块的空间数据,基于每个斑块的面积大小指标进行ruc聚类;
第五模块,用于对第四模块的聚类结果进行后处理,生成城市多层次边界。
9.根据权利要求7所述城市多层次边界的识别系统,其特征在于:包括处理器和存储器,存储器用于存储程序指令,处理器用于调用存储器中的存储指令执行如权利要求1-6任一项所述的一种城市多层次边界的识别方法。
10.根据权利要求7所述城市多层次边界的识别系统,其特征在于:包括可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序执行时,实现如权利要求1-6任一项所述的一种城市多层次边界的识别方法。
技术总结