面向遥感大数据的地学知识图谱构想

科技工作者之家 2021-03-26

当前海量遥感观测数据到地学知识的转化过程,已成为一个关键制约瓶颈。从本质上看,遥感图像显示的是某一区域特定地理环境的信息综合体。它是地球表壳的大气圈、岩石圈、水圈、生物圈以及社会经济环境的综合反映。无论哪一种遥感信息都不是孤立存在的,而是作为区域地理环境的一个有机组成部分表现在图像上。不同专业由于研究对象和研究任务不同,各自从不同的专业角度,运用不同的专业方法和知识,从这一“综合信息”中各取所需,寻找与提取各自相关的专题信息,以解决各自的实际应用问题。例如,遥感影像在人文地理学家眼中是各种不同土地利用的数据源,而在地貌学家眼中是各种不同地貌的数据源。缺乏已有专业知识的支撑,很难在遥感综合信息体中获取更新、更广、更深层次的地学知识。

为此,本文提出一种面向遥感大数据的地学知识图谱构想,拟将地学知识以具有空间信息的形式反映在空间化的图模型结构上,用以展示地理对象空间特征、类型特征、地学属性特征的空间分布、关系、变化、规律,使其能够承载不同类型和层次的地学知识,并分别借助图模型结构方式进行这些知识的表达和关联,使其具有查询检索、知识推理、动态更新、知识拓展等功能,并尝试以此突破当前遥感解译的思维局限,为新时代地学知识驱动下的遥感大数据高精度智能解译服务,并最终实现地学知识的自动化精准和积累。

01、专家智能解译系统

专家智能解译系统,是模仿遥感解译专家在遥感解译过程中的视觉处理以及大脑决策过程,从而实现遥感影像的计算机自动解译。现阶段的“专家智能解译系统”,多是静态的应用地学知识,寄希望将现有的地学知识一次性转为可用的影像解译规则集,直接实现遥感影像的自动化解译结果,缺乏地学知识的校验和更新机制。事实上,已有的地学知识也会存在一些不确定性,并且也会随着地理学家的研究和认知而不断深化,甚至重改。当地学知识体量庞大时,缺乏校验和更新机制,必然会导致基于地学知识编制的专家智能解译规则出现冲突的情况。此外,由于地学知识地域性非常强、不确定性因素大,很难具有适用于大区域的固定、通用模式,导致当前阶段的专家智能解译系统的解决思路很难进行推广,多是停留在个别的局部案例研究方面。这些原因综合导致了专家智能解译系统精度有限,并且难以实现知识的积累和更新优化。

02、地学信息图谱

地学信息图谱是由我国现代地图学、遥感科学和地理信息科学的奠基人——陈述彭先生借鉴其它学科领域的图谱思维而提出的一种地球信息科学理论。它认为地球信息科学类似化学中的元素周期表、生物学中的基因图谱那样,借助这样一套规律或元素,可以进行地学规律的深入分析认知,例如地学规律的推理、反演,甚至预测。这其中,比较有代表性的就是河流水系的图形化图谱认知。受地学信息图谱启发,结合人对遥感图像的视觉认知,骆剑承等提出一种遥感信息认知模型——遥感信息图谱。其中“图”是指遥感信息在地物位置、形态、结构、空间分布等属性上的表征,遥感信息的“谱”,是指遥感信息在地物光谱、时间、功能等属性上的表征。并由此提出遥感认知“图谱转化”的3个阶段:“由谱聚图”→“图谱协同”→“认图知谱”。通过辨认已有的遥感“知识图”开展知识驱动的地物识别和专题信息提取智能化、精准化。

“地学信息图谱”面对的是整个地学领域知识的框架组织,并不能直接用于遥感影像解译的实践;“遥感信息图谱”借鉴了“地学信息图谱”的图谱化思维方式,从遥感影像的空间图和波段谱、时序谱中提炼地物目标的特征或者图谱模式,从而构建面向遥感信息的图谱,可直接用于遥感影像的解译实践。但是这种遥感信息图谱构建的数据源和构建的图谱本质都是来源于遥感数据,而遥感数据所能直接获取的地学信息是有限的,由此限制了已有地学知识在遥感解译过程中的融合。

知识图谱(Knowledge Graph)是通过有向图的方式表达实体、概念及其相互之间语义关系的数据组织形式,其中节点代表实体或者概念,边代表实体/概念的属性或者彼此之间的关系。从本质上讲,知识图谱是一种语义网络(Semantic Network)。知识图谱的过程主要包括知识抽取、知识融合、知识推理应用三个阶段。通过知识抽取,可获取实体、关系、属性等知识要素;通过知识融合,可消除实体、关系、属性等指称项与实体对象之间的歧义,得到一系列基本的事实表达;通过本体抽取、知识推理和质量评估形成最终的知识图谱库,实现知识的推理检索等应用。

地学知识作为科学知识的一种,同样也亟需其它科学知识所需要的查询检索与推理等功能。在语义网络或知识图谱出现伊始,就有相关的地理信息研究学者进行跟进研究,并将其称之为“地理知识图谱”或者“地学知识图谱”。这其中,尤其是将网络的地理信息和知识转化为知识图谱的表达和服务最为热门。其研究的主要目的是借助知识图谱的概念和相关理论方法,实现多源异构的大规模地理知识的图谱构建,用于融合语义关系和空间关系的地理智能搜索和地理知识自然语言智能问答,最终为智能虚拟地理环境系统的构建提供理论和技术支撑。

总体而言,传统的专家智能解译系统将目标锁定在专家解译的决策过程和规则上,属于一种浅表层的模仿,没有深入到地学专家所拥有的地学知识才是遥感智能解译的关键上来;地学信息图谱则将专家的地学知识进行系统化、抽象表达,进而实现推理、反演甚至预测等功能,是一种地学知识组织和计算的构想;“遥感信息图谱”则从遥感影像可获取特征角度构建了这样一种面向遥感信息提取的“地学信息图谱”;而知识图谱的引入则将面向整体地学知识的“地学信息图谱”这种构想变的更加切合可行,即可计算性。然而,这种新的思路尚未应用于遥感的智能解译实践中。在当前时代背景下,地学知识非常丰富,遥感影像海量获取,高性能计算、云计算、云存储都成为现实,然而传统算法思维却因地学知识融入困难导致遥感影像智能解译精度和实用性受限,这使得地学知识图谱驱动下的遥感大数据智能解译显示出非常广阔的前景。

01、地学知识图谱承载内容

地学知识图谱的核心就是使用图模型思维更好地表达和利用地学知识,所以承载何种地学知识是构建地学知识图谱首要考虑的问题。而如何将这些地学知识进行分门别类则又是地学知识图模型表达的首要问题。根据地学知识的抽象程度,将地学知识依次划分3个层次:数据性知识、概念性知识以及规律性知识。

01、地理实体的构建

地理实体具有时空多尺度性,高维特征明显。地理实体的表达是一种在具有5维或6维特征空间中节点与边的构建过程:空间的2维或3维+空间尺度1维+时间1维+时间尺度1维。这种高维度的复杂性极大地增加了地理实体的构建难度。此外,现有的地学知识来源多样,认识标准和获取手段都不尽相同,使得地理实体在高维度空间中的边界往往不一致,属性特征也难以对齐。

开展不同专题数据的精度评价,以精度最高、尺度最精细的专题所反应的地理实体为基础构建地理实体是一种容易联想到的解决思路,但如何客观地开展这样的精度评价并非一件易事。承认这种空间不一致性的客观存在,借鉴空间数据的不确定性原理,引入边界的模糊机制或者概率机制,并借助地学知识图谱的推理、校正、拓展功能,逐步逼近真实边界和属性是一种颇具前景的思路。

02、知识层级间的推理

这种推理包含了体量巨大的数据性知识,牵涉的地理实体和属性较多,复杂程度本身就高;推理涉及的地理实体具有空间和时间的多尺度性,相互之间的关系有强有弱,并且多数是间接的弱相关,而不是直接的强相关,这与现有的知识图谱理论中节点之间明确的关联关系极不相同;此外,地表区域具有异质性,不同区域的数据和规律往往并不相同,相应的推理计算过程也难免会存在差异性,这进一步加剧了知识层级间推理的难度。

传统的区域划分思路为解决地表区域异质性导致的知识层级间推理的困难以及大体量知识处理困难,提供了现成的思路,但这种思路亟需解决的一个难题就是区域划分的尺度该如何选择;针对地理实体的跨尺度关联关系强弱不同的问题,则可以引入概率机制,进行概率推理,这方面一个比较有前景的方向就是概率图模型。

01、促进地学知识精准化

地学知识图谱的初始构建依赖于大量的现有地学知识,尤其是数据性知识。然而,这些知识的来源、认知标准等都不相同,甚至存在一些矛盾。因为地学知识图谱的统一表达,尤其是地理实体为统一承载体,不同专题、概念、规律的知识得以交叉融通、相互校验,现有地学知识的各种矛盾或冲突也会在这个过程中集中凸显。为了实现知识图谱的表达和推理功能,这种矛盾和冲突也必须在这个过程中进行消除或者采用一定的手段进行处理。因此,构建地学知识图谱的过程也是一种地学知识精准化的过程。

02、提升遥感解译精度和实用性

遥感数据分析的主要目的就是建立遥感影像空间到人类主观认知的地学空间的映射关系。人类主观认知的地学空间多是从地域空间对人类可发挥的功能角度出发,而遥感影像多是从地物客观表象的自然属性角度描述。尽管功能和表象多数情况下是相耦合呼应的,但由于人类的主观认知归类问题,也还存在大量的不一致现象,“同物异谱”与“异物同谱”就是这类问题的经典总结。地学知识图谱承载的概念性知识和规律性知识,可以有效地利用地理实体在空间和时间上的群体特征,以及不同群体之间的时空相互关系,从而极大地提升地理实体在遥感影像中的辨识度。所提的地学知识图谱构想,正是围绕人类的地学知识为核心展开,瞄准传统算法思维中地学知识应用不足的痛点,理应可以大幅提升遥感大数据的解译精度和实用性。

03、深化地学规律认知

地学知识图谱借助多尺度地理实体将多种地学知识进行交叉融合的过程,这不仅是一个数据性知识校准的过程,同时也是一个创造和发现新知识的过程。这种伴随着新知识的创造和认知角度的丰富,地学规律的认知也必然会越来越深入,例如山地垂直带谱就是植被专题图与海拔数据融合的深度认知结果。此外,地学知识图谱借助不同类型的图模型表达,打通了数据到规律认知的推理链条,实现地学规律认知的数据驱动过程。这可以有效避免人们在进行规律总结时的主观认知偏见带入的偏差,让地学规律获取不以个人的意志为转移,从而更加可靠。另外,规律性知识能够反过来指导数据性知识获取更加精准,从而进一步获取更加深入的规律性知识。规律性知识能够在这种迭代循环认知的过程中,随着知识的积累不断深入。

针对算法思维在遥感大数据分析中越加凸显的困境,我们提出一种以地学知识为核心的地学思维构想——地学知识图谱。该构想将地学知识进行层次化分类、图模型表达,以及各种层次知识的关联推理,进而赋予其地学知识查询检索、推理校准、知识拓展等功能,从而促进地学知识精准化、实现遥感大数据地学知识获取精准性和实用性以及地学规律认知深化。

实现全自动化的面向遥感大数据分析的地学知识图谱构想,还需要很多的关键技术难题需要攻克,甚至需要一些理论方面的突破,例如概念、规律性知识的图模型表达以及知识层级间的推理。但其中蕴含的一些以地学知识为核心的遥感分析思维方式思路,例如地学知识核心化、知识分层、数据驱动、迭代优化等,确实是可以借鉴现有GIS技术应用于遥感解译。希望本文提出的这种思路在遥感大数据分析时代的未来发展方向能够有所启示和促进。

原文请在期刊官网或中国知网下载

作者信息

王志华副研究员  

中国科学院地理科学与资源研究所副研究员,硕士生导师,主要从事地理学、景观生态学、人工智能、计算机视觉等相结合的遥感大数据挖掘理论方法与应用分析研究。主持国家自然科学基金2项。在国内外学术期刊已发表论文40余篇,授权发明专利6项,获软件著作权1项。

  杨晓梅研究员 

中国科学院地理科学与资源研究所研究员,博士生导师,长期从事遥感影像地学理解与分析计算以及海洋海岸带遥感与地理信息系统综合集成与应用等方向的研究与系统开发。主持完成国家863计划项目、国家重大专项、国家自然基金、国际合作等多项课题,在国内外学术期刊已发表论文100余篇,出版《遥感影像地学理解与分析》、《海岸带遥感综合技术与实例研究》等理论专著6部。2005年获国家科技进步二等奖。

 周成虎院士  

中国科学院地理科学与资源研究所研究员,中国科学院院士、国际欧亚科学院院士,博士生导师。主要从事地图学与地理信息系统研究。在数字地貌制图、时空大数据分析与预测等方面完成了系统性工作,提出了全息位置地图、全空间信息系统的新概念新理论,引领着我国地理信息系统与导航位置服务的学科与技术发展。

全文可在中国知网或学报官网下载

来源:慧天地

原文链接:http://mp.weixin.qq.com/s?__biz=MzIwNDE1NjM2NA==&mid=2652156726&idx=5&sn=d4276549fd445c5395322a4ad2ca06ae

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn

大数据 遥感 地图知识

推荐资讯