• 一种支持多源数据的城市建成区智能提取方法

    • 摘要:

      本发明公开了一种支持多源数据的城市建成区智能提取方法,通过寻找与城市建成区信息存在关联的不同来源的低成本数据,通过核密度估计方法实现点、线和面三类数据源的归一化,并通过决策树算法实现统一的分类器的构建和评估,从而获得一个有效的分类器;这些数据可以单独或组合使用,通过分类器进行城市建成区信息的提取,从而估计城市建成区的空间分布.本提取方法,它能够以一个极低的成本为城市规划者和决策部门提供城市建成区的变动信息,从而为他们检测城市扩张和制定城市规划提供参考信息.

    • 专利类型:

      发明专利

    • 申请/专利号:

      CN201911153539.X

    • 申请日期:

      2019.11.22

    • 公开/公告号:

      CN111125553A

    • 公开/公告日:

      2020-05-08

    • 发明人:

      唐立娜 孙朗 邱全毅 李倩瑜

    • 申请人:

      中国科学院城市环境研究所

    • 主分类号:

      G06F16/9537(2019.01),G,G06,G06F,G06F16

    • 分类号:

      G06F16/9537(2019.01),G06F16/29(2019.01),G06K9/62(2006.01),G,G06,G06F,G06K,G06F16,G06K9,G06F16/9537,G06F16/29,G06K9/62

    • 主权项:

      1.一种支持多源数据的城市建成区智能提取方法,其特征在于,包括以下步骤: S1:输入地理空间数据集和与之对应的真实城市建成区数据集; S2:数据预处理,通过核密度估计算法,将地理空间数据集和真实城市建成区数据集归一化到同一平面下的设定分辨率的归一化空间数据; S3:图像数字化,将归一化空间数据转为二维数组并降为一维数组; S4:建立数据框,如果S1输入的地理空间数据集个数大于1,则会得到多个一维数组,将这些一维数组组合后转为数据框;否则,得到一个一维数组,将其直接转为数据框; S5:将数据框包含的样本数据分为训练样本和测试样本,通过决策树算法,实现分类器构建和评估; S6:根据训练完成的分类器,输入新的地理空间数据样本,提取城市建成区信息,估计城市建成区的空间分布. 2.如权利要求1所述的支持多源数据的城市建成区智能提取方法,其特征在于,所述地理空间数据包括点类型数据、线类型数据和面类型数据;所述S2的数据预处理包括以下步骤: S21,对于点类型数据、线类型数据通过核密度估计算法得到面类型数据; S22,对于真实的建成区数据进行二值化处理,是建成区则赋值为1,是非建成区则赋值为0; S23,将点类型数据、线类型数据、面类型数据和真实建成区数据归一化到同一平面下的设定分辨率的归一化空间数据. 3.如权利要求2所述的支持多源数据的城市建成区智能提取方法,其特征在于:所述点类型数据包括POI数据;所述线类型数据包括RN数据;所述面类型数据包括NTL数据. 4.如权利要求1所述的支持多源数据的城市建成区智能提取方法,其特征在于:所述S2中的设定分辨率为20m-50m. 5.如权利要求1所述的支持多源数据的城市建成区智能提取方法,其特征在于:所述S4中的数据框为有若干行和列的数据集,它的每列是一个变量,每行是一个观测样本. 6.如权利要求1所述的支持多源数据的城市建成区智能提取方法,其特征在于:所述S5包括: S51,将数据框包含的样本数据分为训练样本和测试样本; S52,将训练样本输入决策树,确定决策树的叶节点数,从而得到一个分类器,并输出训练样本的分类结果; S53,根据真实城市建成区数据,评估分类器对训练样本的分类结果,验证分类器的性能; S54,根据真实城市建成区数据,评估分类器对测试样本的分类结果,验证分类器的泛化能力即其对新数据样本的适用性. 7.如权利要求6所述的支持多源数据的城市建成区智能提取方法,其特征在于:所述分类器评估是采用双分类器进行分类,并采用指标Precision、recall和F1-score再对建成区分类进行评估; 所述双分类器的分类,根据参考数据,将分类结果分为四类:TP、TN、FP和FN;其中TP代表被正确归类的建成区的样本;FP代表非建成区被错误归类到建成区的样本;FN表示建成区被错误归类到非建成区的样本;TN代表被正确归类为非建成区的样本; 在所述指标中,Precision为精准度/查准率,Precision=TP/(TP+FP);recall为召回率/查全率,recall=TP/(TP+FN);F1-score是precision和recall的调和平均值,F1-score=2*(precision*recall)/(precision+recall). 8.如权利要求1所述的支持多源数据的城市建成区智能提取方法,其特征在于,所述城市建成区提取包括: S61,输入新的地理空间数据集; S62,数据预处理,将地理空间数据集预处理成归一化空间数据,将其转为二维数组并降为一维数组,将数组转为数据框; S63,使用训练完成的分类器,对数据框中的空间数据进行分类,提取城市建成区信息,估计城市建成区的空间分布. 9.一种计算机系统,其特征在于:包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于当执行所述计算机程序时,实现如权利要求1至8任一项所述的支持多源数据的城市建成区智能提取方法. 10.一种计算机可读存储介质,其特征在于:所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现如权利要求1至8任一项所述的支持多源数据的城市建成区智能提取方法.