↑ 点击上方「中国测绘学会」
可快速关注我们
初夏上午,未名湖畔,遥感楼静静矗立,与起伏的地势及湖岸浑然天成的融合在一起,在高大葱郁的树林中颇有隐逸之感。在二楼一隅的办公室中记者见到了本次燕园之行的寻访对象,杜世宏老师脸上带着真诚的学者微笑,声音里有着常年讲课造成的微微沙哑。已而,茶香飘散,一场关于地理空间的访谈也开始了……
杜世宏 北京大学遥感与 GIS 研究所副所长、博士生导师
记者:您长期从事地理空间关系计算、时空数据智能理解等方面的理论与应用研究,近期的主要研究方向?有哪些成果和经验分享?
杜世宏:主要有3个研究方向。
一是基于自然语言空间关系的地理信息智能理解。我们常说的大数据主要包含两类,第一类主要包含遥感数据、GIS数据、导航数据等。这类数据的共同点是都基于坐标系统,如平面直角坐标系统或地理坐标系统。基于坐标系统就可以进行几何计算和几何分析。
除了基于坐标系的数据,第二类主要包含文本数据、网络数据、签到数据等社会感知数据。普通大众生活中涉及的大部分信息是用自然语言来表达的。基于自然语言的地理信息没有坐标,比如此刻,我们在北京大学遥感楼交流,这也是一种包含位置的描述,但没有坐标的表达。在大数据时代,社交感知设备极其发达,人们生活中有关位置的描述大都是运用自然语言来表达的。
GIS脱胎于地图学,其早期目的是地图的数字化表达和绘制,面向的是基于坐标的数据。当前,由于GIS数据库建设已经基本完成,需要分析和重构人地关系,因此需要将地理现实世界在电脑的数字世界中建模、表达与分析。GIS更要面向大众化服务,为广泛的没有GIS专业背景的人提供地理信息服务,这就需要在没有坐标系的情况下处理地理信息。“我在何处,所见所为”,这就是自然语言对所含地理信息和地理事件的表达,比如《徐霞客游记》中,大量的地理信息就是通过自然语言和文本语言来表达的。
总之,大数据时代GIS面临的一个核心问题是,怎样把基于自然语言和文本语言的地理信息和基于坐标系统的几何数据统一表达和分析。
二是GIS几何数据和自然语言的无缝关联。现有GIS更关注地物的几何形态和空间分布,而自然语言更关注知识表达和推理。现有的GIS软件系统和信息服务需要专业化培养的人才来使用,不适合大众使用,反而文本语言能够更好地表达地理知识与地理推理。因此,需要把两种数据结合在一起进行分析表达,才能适合大众化应用。
我们经常讲的图文关联,指的是经过人脑思考和推理而进行的关联,现在要做的是由计算机进行思考推理和图文关联,将专业的地理数据所蕴含的信息和知识用自然语言表达出来。这就是大数据时代GIS面临的核心问题,即基于自然语言、文本语言的地理信息和基于坐标系统、几何的地理信息进行统一的关联表达和分析。
针对位置关系的表达,GIS用坐标和高程表达地理要素与地理现象的位置,称为“绝对位置”。所谓“绝对位置”,一定存在其“原点”,如二三维坐标系中的0点,以及地理坐标系中的大地原点;而在自然语言所表达的空间位置中是没有“原点”的,所表达的是“相对位置”。
所以,GIS另外一个任务就是,如何将自然语言表达的相对位置和GIS所表达的绝对位置进行共同分析。现在GIS所表示的更多是相对于坐标原点的绝对位置,不支持对相对位置的表达和分析,而相对位置是自然语言表达位置关系的核心,且在地理学中也有相对位置和绝对位置的概念。随着信息技术的发展,包括5G、互联网、物联网等,基于自然语言的数据获取途径越来越多,基于自然语言、文本语言的数据将和专业的遥感等数据同等重要。
三是面向更为广泛的人地系统,GIS表达方式上的革新。GIS系统采用分层分要素的存储和表达方式,比如房屋、道路、植被、水系等分别用不同的图层存储和表达。但是,人们理解地理信息的过程却不是分层分要素的,而是对一个地理综合体,即多要素综合单元的表达理解。例如,GIS在理解城市结构和经济活动的时候,是基于居住区、商业区、工业区等功能来划分,不同的功能区是一个综合体。GIS的表达是基于地图学的,是基于绝对位置对地理世界的分层分要素表达。未来,GIS要在地理信息表达方式上进行革新,要从自然语言及其关系的角度来表达地理信息,还要基于相对位置实现对地理格局、综合体的更广泛的表达。
GIS最终是要面向人地系统表达和研究的。从学科发展角度来看,GIS的发展也将更加关注人地系统。对人来说,主要研究人类活动的时空规律,包括人的活动规律、能源的消耗、废弃物的排放等;对地球来说,主要研究地表环境及各类生态系统的时空演化规律,包括植被、沙漠、城市等的格局和功能变化;同时,将人类活动规律和地表各类系统的格局耦合,探索人类活动与生态系统的相互作用和影响机制。GIS将从更深刻的意义上去帮助理解人类和地球的互动,进而为人地关系时空模拟和协同发展提供建议。
记者:说到人地系统,目前如火如荼开展的智慧城市建设,是否也是其中一部分?您认为智慧城市建设的基础是什么?GIS怎样才能更深入的参与其中?
杜世宏:智慧城市的核心体现在四个方面:从人的个体角度,追求个人生活的便利和舒适度;从社会角度,需要更合理更智慧的治理方式;从资源利用角度,寻求优化的资源分配;从环境保护角度,经济发展与环境保护协同进行。其本质就是要很好的理解人地系统,理解人的行为模式,理解不同人群对于资源的需求和消耗,理解人地合理的互动模式。不同人群的行为模式,以及对于资源的需求和消耗是不一样的。只有在理解了人地系统基础上,才能为群体或个人提供更为优质的服务,在政府治理的角度做合理的规划,为生态环境的保护治理提供合理方案策略。
基于此,智慧城市建设的两个核心就是时空大数据及云计算平台和城市运行系统优化模拟。时空大数据必须包含多个方面,一是传统的遥感、GIS等数据,基于这些数据能够对城市系统进行很好的表达、建模、分析等;二是各种社会感知数据,手机数据、公共交通数据、社交媒体数据、街景数据等,这些数据能很好的反映人类活动及其对资源的需求;三是各种地面观测和政府运营等数据。时空大数据及云计算平台就是要实现这些数据的无缝关联表达和管理、统一计算分析,全面摸清和掌握城市人类活动、社会经济运行、人地系统作用等现状和规律,以及它们在空间时间上的差异性和分异性,为各种智慧管理和治理提供本底信息。城市运行系统优化模拟是基于时空大数据,对各种城市系统运行模式进行时空模拟和预测,对城市系统的优化运行和态势调控提供基础。在时空大数据和大数据计算平台的基础上,还要和各种行业及应用相结合,比如政府的需求、人的需求、资源利用的需求、环境保护的需求等,这样才能实现整个人地系统的智能化管理。
以地理问题为导向的时空大数据挖掘
记者:随着遥感大数据时代的到来,数据的获取和数据的拥有量在不断丰富,怎样才能把这些丰富的大遥感大数据用起来?
杜世宏:从数据挖掘上来说,现在有3个方面有为可施。
首先要想对时空大数据进行挖掘,必须对海量异构的数据进行整合。从数据本身来看,我们处在传感器极大丰富的时代,从卫星到飞机、无人机,再到视频探头、手机、车辆等,以及各种无线传感器,构成了复杂的感知系统,无时无刻不在对人地系统进行感知。时空大数据的涵义是十分广泛的,包含了人地系统的各种尺度、各种类型、各种维度的数据,概括起来就是空天地一体化、室内室外、地上地下、人地一体的数据。要对时空数据进行整合融合和尺度转化,包括空间、时间、语义、属性等方面,在时空尺度统一的基础上,才能进行数据挖掘与分析。
二是需要高性能的云计算平台支撑大数据的挖掘。大数据的挖掘其核心是智能化的分析,找出人的活动规律,发现地球生态系统的时空规律,理解人地系统作用机制。
目前,在数据挖掘中提到最多的是深度学习。深度学习是数据驱动的,需要通过大量的样本学习来支持。此外,还需要地理知识的驱动,这种知识的获取需要通过数据的学习,以及在丰富的地理资料和实践中获取。人不同于机器,人对于地理知识的获取是多元化的,且存在系统完善的地理知识基础。
在知识和数据的双重驱动下,数据挖掘才能不再盲目,也能更符合实际需求。同时,也应认识到,目前深度学习在理论和实践中仍存在不确定性,在对地理知识的表达和应用上不够,仍然不能确保实现对地理知识的完全正确表达和运用。
此外,一般的大数据应用,如百度或谷歌搜索引擎,更多是基于属性上关联的知识图谱,而不是地理和空间上的知识图谱。我们也需要空间知识图谱来实现知识表达推理、智能思考,再和时空大数据结合,其挖掘成果会更好,当然其难度和复杂性也更甚。
三是以地理问题驱动时空大数据的挖掘。从计算机背景来看,数据、挖掘和分析这三者是技术的问题,但事实上数据挖掘离开了实际应用领域,价值就会打上折扣。因为数据挖掘的目的是获得知识和信息,而知识和信息是离不开应用领域的。
所以时空大数据不仅仅是技术的问题,一定要结合地理问题,结合人地系统的需要开展实际应用。通过时空大数据挖掘要理解人地系统,要全面了解人类的活动规律,自然要素格局和演化规律,人和自然要素间的相互关系,发现人地系统的时空变化和差异性;在数字世界里,从多个角度、多个尺度重构人地系统,掌握人地系统的现状,分析人地系统过去,模拟人地系统的未来。不了解这些就做不到智慧城市,智慧化的工作也会沦为空中楼阁。
记者:针对遥感数据的获取和应用,您认为还有哪些问题亟待解决?
杜世宏:一是遥感大数据引擎。截至2017年8月31日,全球在轨遥感卫星数量为620颗,每天的数据量是PB级的。整体而言,各类卫星的数据仍然是分散和孤立的。但是对应用领域而言,需要不同类型的数据关联、整合和综合分析,但是很难获取不同生产者拥有的分散的数据。同时,用户之间也是孤立的,但不同用户的需求可能是一样的。例如,在做土地覆盖分析,资源分析和环境保护分析中,都需要土地覆盖或土地利用信息,从遥感数据解译这些信息是类似的。这样,不同用户和应用往往重复获取数据、处理数据和分析数据,造成很大的资源浪费。
记者:从您的科研和教学经验来看,3S领域需要什么样的科研及产业人才?作为高校GIS创新人物,对保持创新精神及实践有什么见解?对于学生学习就业有何建议?
记者:谈谈您从事GIS科研和教学二十多年最深刻的感想?
再有,以我在武汉测绘科技大学、武汉大学7年,中科院遥感所3年,这10年的学习和研究经历,以及北京大学十几年的教学、科研经历,深感坚持的重要性,学习、科研一定要坚持在一定的专业方向上,才能有所收获。
人物介绍
杜世宏,北京大学遥感与 GIS 研究所副所长、博士生导师。现主要从事地理信息达、时空数据智能理解、城市环境感知与分析等方面的基础理论和应用研究。曾主持国家自然科学基金、国家863、国家重大专项“高分辨率对地观测系统”等项目多项。建立了地理空间关系计算理论,在国际上首次提出地理景观场景概念及其分析理论,主持研发的软件系统在“西部测图”和“地理国情监测”等国家重大工程中得到实际应用。已发表学术论文100余篇(SCI论文50余篇),出版第一作者专著 2部,获得国家测绘科技进步二等奖1项和国家发明专利3项。担任国际会议IWIDF2017和IWIDF 2019组委会Co-Chair、ISPRS Technical Commission IV Symposium 2018科学委员会成员,国际期刊 Journal of Geovisualization and Spatial Analysis和中文期刊《地理与地理信息科学》编委,中国地理学会地理建模与地理信息分析委员会委员、中国测绘学会摄影测量与遥感专业委员会委员、中国GIS协会理论与方法委员会委员等,20余国际SCI期刊审稿人。
来源:GIS时代
采访:白水亮、董慧