陈军院士:基础地理知识服务的基本问题与研究方向

基础地理_安徽省普通高中学业水平测试人文与社会基础(地理)_国家基础地理信息系统

点击图片上方蓝色字体“汇天地”订阅

国家基础地理信息系统

本文发表于《武汉大学学报信息科学版》2019年第1期“测绘地理信息技术转型升级——从数字化到智能化”栏目。

基础地理_安徽省普通高中学业水平测试人文与社会基础(地理)_国家基础地理信息系统

安徽省普通高中学业水平测试人文与社会基础(地理)_基础地理_国家基础地理信息系统

关于作者

陈军 1 刘万增 1 吴昊 1 李智霖 2 赵勇 1 张兰 1

1个国家基础地理信息中心

2 香港理工大学土地测量与地理信息学系

陈军 中国工程院院士,教授,博士生导师,2012-2016年担任国际摄影测量与遥感学会(ISPRS)主席。主要从事地理信息建模的理论方法和工程应用研究,更新和服务。

概括

基础地理数据具有空间载体和知识储备两大功能。 过去,人们主要围绕其作为空间载体的作用,开发和提供各种基础地理数据服务和信息服务。 但其知识存量挖掘不足,提供的地理空间知识服务非常少。 近年来,“数据海量、信息爆炸、知识难求”的现象越来越突出。 从地理数据信息服务向知识服务转变势在必行,已成为测绘技术转型升级的重要任务。

借鉴知识图谱的最新研究进展,探讨了基础地理数据、信息和知识的基本内涵,提出了具有结构特征和关联特征的基础地理知识服务的总体思路,分析了由此带来的四个问题通过它。 ; 然后从领域知识体系建设、关键技术和应用服务三个方面探讨基础地理知识服务的研究方向和重点; 以GlobeLand30知识服务为例,介绍了初步研究进展。

众所周知,基础地理数据是地形地物分布和相互关系的数字化描述和表达。 以矢量地形、数字高程模型、正射影像、地表覆盖等主要形式呈现,具有空间载体和知识库两大功能。

经过多年努力,我国已建立起规模多、内容丰富、更新及时的地理信息基础数据库系统。 通过国家地理信息资源目录服务系统(.gov.cn)和全球地表覆盖信息服务系统(lobeland30.org)等平台,为社会各界提供一系列数据产品和相关信息服务,发挥在国家信息化建设和社会应用中发挥重要作用。

然而,当前地理基础服务普遍存在“数据海量、信息爆炸、知识难求”的现象,不能满足用户对地理基础知识的服务需求,制约了基础地理数据作用的发挥。信息。 这既是测绘行业转型升级的瓶颈问题,也是测绘技术创新面临的重大问题。

究其原因,主要是过去人们关注的是基础地理数据的空间载体作用。 虽然开发了元数据查询、数据浏览下载、按需专题制图、API调用等服务功能,但对基础地理数据的知识存量挖掘还不够。 , 提供很少的地理空间知识服务。

近年来,国内外有关专家学者提出要重视地理空间知识服务的研究,建设地理知识服务平台,将地理空间知识引入GIS软件系统,构建虚拟地理环境的地理知识体系,从网络文本资源中提取和构建地理空间知识。 地理知识图谱等,但仍处于概念探索和初步实验阶段。

相关机构或单位开始开展地理空间知识服务。 例如,大自然保护协会就全球发展对自然的影响浓缩了几个知识点,并与遥感影像、土地覆被等数据有机链接,形成基础知识导航系统。 “人类世”知识图谱服务(welove/anthropocene),但主要提供故事图谱服务,缺乏系统深入的知识服务。

总的来说,人们对地理基础知识服务的研究刚刚起步,对其基础问题和关键技术还缺乏深入的认识和研究,更谈不上一套完整的知识服务体系。 随着“互联网+”、大数据、云计算、人工智能2.0等的快速发展,以知识图谱和知识中心为代表的知识服务研究方兴未艾,为基础知识的开发和应用提供了有益的借鉴。地理知识服务。

其中,知识图谱以结构化的方式明确表达知识节点(包括概念、实体等)及其之间的语义关系,从文本与数据的互联到知识的互联,形成大数据环境下的知识服务。 知识中心以“数据海洋”为理念,构建知识收集、积累、创造、演化和利用的服务环境,提供智能化的知识演化和深度知识服务(等)。

本文借鉴知识图谱和新的基础测绘相关思想和理念,提出基础地理知识服务的基本概念和总体思路,分析面临的基本问题; 然后介绍了GlobeLand30知识服务系统的案例研究,讨论并提出了未来的研究方向。

1个

根本问题

基本地理数据是观察、测量或感知表面、地形和特征的位置、属性和关系的结果。 信息是对数据进行提取、挖掘和其他处理而获得的具有特定意义的结果。 地理基础知识以领域需求为导向,进一步挖掘、浓缩、梳理、升华基础地理数据和信息,并与现有地理知识关联起来,形成对地理空间格局、相互关系和时空变化的系统认识。环境要素。 知道,如图1所示。

国家基础地理信息系统

以土地覆盖为例,人们通过对地观测,从遥感影像中识别各类土地覆盖及其空间分布,开发单期或多期数据产品; 然后对这些数据产品进行统计分析等处理,可以获得面积、数量、变化等土地覆盖信息; 然后,根据地表过程的专业研究视角,以空间格局、区域差异、趋势特征、成因机制为主线,凝聚出一套具有结构关系的知识点(包括概念),从而形成对土地覆盖的系统理解或知识体系。

图2展示了基础地理知识服务的基本思路。 首先,要综合利用领域专业知识(如专业词库)、基础地理数据、专业文献、开放知识库和无处不在的网络资源等,提炼(或提炼)、浓缩相关知识,并使用知识描述语言,例如Webontology语言(OWL)或资源描述框架(RDF),可以形式化地表达,供计算机分析、访问和运行; 其次,对各种获取的知识进行结构建模和关联处理,建立由模型层和实体层组成的空间知识图谱,并将其发布为Web服务,方便知识在互联网环境下的互联互通和利用; 然后,针对该领域的应用需求,研发地理基础知识的浏览、搜索、问答和推荐等知识服务。

安徽省普通高中学业水平测试人文与社会基础(地理)_基础地理_国家基础地理信息系统

由此可见,结构化和关联是构建基础地理知识服务的两个重要技术环节。 结构化是指采用自上而下或自下而上的方法,梳理相关知识点(或概念)、实体和属性之间的结构关系,形成结构有序的概念知识图谱; 分析挖掘概念知识之间的层级关系、地域关系和事件关系,将其与相关的图片、文字、声音、视频等多媒体信息有机关联起来,形成物理知识图谱。

这些多媒体信息作为地理基础知识的辅助描述,可以描述客观事实,反映动态情况,帮助用户更好地理解和应用知识。 例如亚马逊河是世界上最大的分水岭,青藏高原湖泊是世界上最大的高原湖泊等,属于典型的事实性地表水知识。 分布图等可视化展示。

进一步分析表明,基础地理知识服务不同于一般的知识图谱和基于文档的知识中心,至少面临四个基本问题。

首先,它不仅从多种类型的文本数据(如专业文献)中提取知识,还可以从地形、土地覆盖、图像等基础地理数据中挖掘多粒度、多尺度、多维度的空间知识. 因此,有必要采用或借鉴计算机领域的文本信息抽取技术(如实体抽取、关系抽取、属性抽取等),发展空间数据挖掘、机器学习等技术,开发知识空间与文字信息的综合利用。 提取方法。

二、空间知识图谱的节点既包括非空间知识单元或实体(如坐标系、书籍、作者等),也包括空间知识单元或实体,如“长江”、“北京” . 节点之间存在平等、隶属等非空间层次关系,如“影像”是“影像”的近似名称,“遥感影像”是“影像”的子类; 还可能存在大量的时空关系或者时空关系,比如“嘉陵江”是“长江”的上游支流,2000年到2010年全球建设用地扩大了5.08%等等。需要明确不同尺度的空间实体与不同粒度的知识单元之间的逻辑顺序排列和尺度对应关系,这对知识排序提出了更高的要求。

第三,传统知识图谱的构建是借助关联数据等技术实现概念和实体的层次关联,实现地理基础知识的空间互联,往往需要利用地理关联技术将概念和实体进行关联。语义信息和知识单元的空间位置。 利用事件关联技术,实现新产生(或更新、扩充)的知识与引起变化的事件之间的关联。 第四,要实现空间知识检索、问答和推荐,需要同时使用语义推理和空间推理。 例如,查询“流经苏南地区的主要河流”,不仅需要主要河流的语义知识,还需要苏南地区的空间概念。 这些都需要根据地理基础知识服务的特点,深入分析地理基础知识服务的基本问题,研发知识抽取(抽取)、建模组织、推理的理论和方法。

2个

研究方向

上述分析表明,基础地理知识服务面临着地理空间特性带来的诸多新问题和新挑战。 未来应从领域知识体系建设、关键技术和应用服务三个方面加强研究。

领域知识体系构建研究

1个

基础地理数据用于描述和表达边界、地形、地物、土地覆盖等自然现象的空间位置、边界(或轮廓)。 根据需求对数据进行抽取和挖掘,可以获得具有特定意义的信息,然后通过结构化和关联处理形成领域知识体系,如表1所示。

基础地理_国家基础地理信息系统

其中,国土知识是指关于国土范围、地形特征、邻国和陆地边界等的知识体系,可用于指导底图的选取和“问题地图”的识别。 ;

地理知识是关于地形地貌特征,重要自然和人文地理实体的位置、高程、深度、面积、长度等属性及其空间关系的知识体系;

土地覆盖知识是关于空间格局、区域差异、时间变化、归因机制等方面的知识体系,主要用于人地关系、生态环境、气候变化、可持续发展等方面的研究;

领域文献知识是指基于文献空间化技术在空间维度(研究机构和研究领域的空间范围)建立研究主题、作者等属性之间的关系;

知识专家合作关系是指从事基础地理学及相关学科的专家在发表论文、承担项目、获奖、学术组织等方面形成的合作关系。 期刊名称、合著者等、特征属性(年龄、学历、职称、研究方向等)、社会性(学习机构、工作机构、导师、学生等)构建专家合作关系网络; 专业概念知识由词汇表、词库、分类法等提供,描述领域专业概念及其相互关系,主要用于解释概念和查询概念关系,自动分类和索引信息。

为构建基础地理学领域知识体系,需要明确每一类基础地理学知识的内涵、来源和用途,进行细致的粒度划分,有效揭示和描述其全面深层次的概念关系,并实现知识组织。 深度测序。

大数据时代,数据是基础资源,也是最宝贵的资源。 只有充分利用高科技在数据上下功夫,才能把数据的海洋变成聚宝盆。

关键技术研究

2个

构建和提供地理基础知识服务的影响因素众多,技术过程复杂,涉及知识挖掘或抽取、知识图谱自动构建、空间推理、空间知识服务、可视化表示等关键技术。 图3展示了其技术研究的主要内容。

安徽省普通高中学业水平测试人文与社会基础(地理)_国家基础地理信息系统

1)知识挖掘或提取的智能化

首先,需要开发直接从基础地理数据中提取高级语义信息的方法和技术。 例如,利用深度学习方法,直接从单级地形图中识别地物类型,判断地貌类型; 或利用两期或多期土地覆盖数据或影像数据,判断全球或指定地理区域内哪些局部海域的建设用地将大幅减少,或建设用地大幅增加。

其次,利用自然语言处理技术,研究如何从领域文档、网络文本或其他无处不在的文本资源中提取地理相关的概念、实体、关系等知识,如基于开放知识库提取水体概念、实体间的上下文等和百科数据。 位关系,并建立其概念模型。 为构建基础地理学领域知识体系,需要明确每一类基础地理学知识的内涵、来源和用途,进行细致的粒度划分,有效揭示和描述其全面深层次的概念关系,并实现知识组织。 深度测序。

2)空间知识图谱自动构建

在地理基础知识图谱构建的初期,往往需要借鉴已有的分类体系,发挥专家的主体作用,预先定义和固定地理基础知识的概念模型,包括上下关系概念和实体。 概念之间的类关系。 但是,随着知识的不断扩展,应该逐渐走向自动化,研究知识的自动关联和领域文献知识图谱的自动生成,并建立适当的质量控制机制来保持知识图谱的持续更新。 因此,需要根据地理基础知识图谱的时空特征,研究解决空间关联关系的自动提取和关联数据的动态维护等问题,发展自动动态关联技术。

例如,通过分析科技文献(科研成果)中专家之间的关系(如指导、同事、朋友等),设计专家关系抽取模型,自动构建专家关系网络。 这主要是通过模式匹配和深度学习等自然语言处理方法,挖掘和提取文献中的地理信息特征(如研究机构和研究领域的位置),并利用统计分析和统计等文献计量统计相关技术。关联规则抽取构建空间维度上主题、作者等属性之间关系的研究。

3)空间知识推理

基于知识图谱衍生新知识是基础地理知识服务的新方向。 为此,有必要研究基于规则的推理、基于图的推理、基于深度学习的推理和混合推理等方法,对知识元素和知识关联进行结构重组,形成并提供描述和诊断模型。 、预测型和程序型知识服务。 例如,利用领土知识和“问题地图”的相关判断规则,我们开发了基于深度学习的智能筛选算法和软件,可以进行智能地图识别。 自动图谱识别准确率达90%以上,大大提高了“问题图谱”筛选效率。

4)空间知识服务

为了方便用户获取服务,需要将很多与地理基础知识服务相关的模型和算法进行抽象和封装,发布成可调用的Web服务接口,形成注册的服务资源,供用户选择和调用。 系统可根据用户需求,通过自动服务组合和编排,形成个性化的知识服务,如地理知识检索、地理知识问答、问题图谱识别、专家推荐等。

5)视觉表达

适当的知识可视化表达可以帮助和增强用户对基本地理空间知识的理解。 根据知识的特点和要突出的主题,如何综合运用静态表达(统计图表、相似图、密度图等)、动态表达(动态gif文件、Js动态图表等)框等)等手段,实现图谱与知识的联动,在保持简洁的同时,增强图谱的表现力,使隐性知识显性化,显性知识个性化,让用户看得见、看得懂、看得懂、看得见、看得懂、看得见、看得见、看得懂、看得懂、看得见、看得见、看得懂、看得见。

应用工程研究

3个

近年来,我国工程科技研究和咨询所涉及的各种配套数据和知识增长迅速,往往零散、无序地隐藏在国内外专业数据库、数字图书馆和网络上层出不穷的数据中。 存在三大问题,即大量数据源无法访问,数据源之间难以打通,数据搜索深度不够(),难以提供所需的知识服务给广大用户。

国家基础地理信息中心的主要任务是整合综合工程技术研究和咨询所需的基础地理空间信息,为数据聚合、知识分析和服务提供统一的地理参考,开发新的工具和方法来支持用户在工程地理空间中进行科技数据和知识的关联和搜索分析,从地理空间数据中发现新知识和新规律。 目前已初步建成地理信息专业知识服务系统(http://kmap.ckcest.cn/),为工程技术界提供空间知识服务。

未来,为满足自然资源保护、社会经济发展、生态环境评价等领域的应用需求,以基础地理信息和相关专业知识(如水资源、城镇化)为基础,构建并提供山、水、林、田、湖、草等信息。 地理基础知识服务。

3个

案例分析

GlobeLand30是我国自主研发的全球30m分辨率地表覆盖数据产品。 从2014年开始,在线向世界提供数据信息服务,包括数据下载、浏览、统计等。为了从数据信息走向知识服务,笔者开展了基于GlobeLand30的土地覆盖知识服务研究,建立了GlobeLand30知识服务系统(http://kmap.ckcest.cn/otherSearch/searchDbfgPage)。

知识提取

1个

参考学术界同仁对地理知识的定义,土地覆盖知识可以看作是对地表水体、湿地、耕地、建设用地、林地、草地、冰川等概念和现象的描述。

GlobeLand30涵盖全球陆地面积,包括水体、耕地和林地等十种土地覆盖类型,有两个时间段(2000年和2010年)。 根据其全球尺度和时空特征,设计采用地理统计、时空分析、关联分析等方法,从GlobeLand30中提炼出地理分布、时空变化、遗传学等三类知识。水体和建设用地机制。

图4以建设用地为例,展示了基于GlobeLand30的全球土地覆盖知识抽取方法。 全球建设用地知识示例如下:

基础地理_安徽省普通高中学业水平测试人文与社会基础(地理)_国家基础地理信息系统

①世界建设用地总面积118.75万平方公​​里,占陆地总面积的0.88%,其中美国和中国占全球建设用地的30%; 地理空间分布极不均匀,北半球城乡建设用地面积占世界的90.69%,其中82.28%分布在20°N至60°N的中纬度地区; 世界上70%以上的建设用地分布在0-5海拔之间,由于在相对平坦、海拔较低的地区进行土地开发,建设相对容易。

②2000-2010年十年间,全球新增建设用地5.8万平方米,中国和美国占全球新增建设用地的近一半; 城乡建成区占6.16%,建成区占9.50%; 而全球新增城乡建设用地占耕地的50.26%。

③不到全球面积1%的建设用地,养活了约70亿人; 全球平均人口集中度为0.963,全球平均国内生产总值(GDP)集中度为2.954%。 人工地表增长带来2.6%的人口增长和近20%的GDP增长,大部分地区城乡建设用地利用效率与人口社会经济发展水平成正比。 需要注意的是,对于不同的土地覆盖类型,采用的统计分析方法往往不同,需要有针对性地设计统计单位、分析指标和计算方法。

知识图谱构建

2个

土地覆盖的空间分布和变化反映了人类社会经济活动的过程,影响着陆地生态系统和人地关系。 为了系统地表达和展示地表覆盖的相关知识,将地表水体、人工覆盖、耕地、湿地等地表覆盖类型作为一级节点,空间格局、时态等知识类型空间变化和遗传机制作为二级节点。 并逐步细分每个二级节点下的知识点,形成结构化的GlobeLand30多层次概念知识网络,如图5所示。

国家基础地理信息系统

对于每一个提取的知识点,又可以细分为两种类型:地理空间知识单元或语义知识单元。 其中,地理空间单元是指可以通过地理空间数据(如坐标、矢量数据、图像数据、在线地图等)来表达的知识; 语义单元是指通过地理标记、地理编码(Geocoding)、地理网格化等过程完成空间知识的非显性空间知识,如图片、表格或专题地图。

两者通过空间关系、时间关系和语义关系进一步关联,形成土地覆盖知识点。 例如陆表水域“空间格局”知识点描述为“全球陆表水域总面积367.67万平方公里,占全球陆地面积的2.73%”,对应的全球水域密度图6所示。

同时,各大陆水域面积比例、地表水体纬度分布图、地表水体经向分布图等其他知识单元也可以通过空间关系联系起来。 此外,还可能与“2000年至2010年全球陆地表层水域面积减少6.52万平方公里”和一些陆地表层水域面积发生显着变化的地区有关。

国家基础地理信息系统

视觉表达

3个

为了方便用户更好地了解土地覆盖知识,可以利用多媒体在线地图,融合多种知识表达形式,呈现更加丰富多彩的土地覆盖知识。 其主要特点是充分发挥互联网地图的缩放、移动、超链接等交互优势,使各种知识和信息相互补充、相互支持,从而达到更全面的效果和目的。介绍土地覆盖知识。

从制图表达的角度看,土地覆盖知识的制图形式可以包括专题图、统计图表、网络图、制图、信息图等。如图7所示,利用Cartogram的方法来形象直观地反映土地覆盖知识的不平衡性。通过改变制图单位的面积得到全球建设用地面积。 在媒体形式上,土地覆盖知识的媒体形式包括静态图片、动态图片(如动态gif文件)、可缩放矢量图形(scalable vector graphics,SVG)HTML5+JS图形(如WebGL图形、在线切片地图底图)等。

基础地理_国家基础地理信息系统

知识服务

4个

GlobeLand30知识服务系统提供两种类型的知识服务(典型地表覆盖景观和知识导航)。 前者是世界上最具或代表性的景观,可以让用户浏览了解十大土地类型,如千湖之国-芬兰,水域面积最大的国家-加拿大,世界最大分水岭-亚马逊盆地、最长河流——尼罗河下游河口三角洲、世界最大高原湖泊群——青藏高原湖泊群、辫状水系——俄罗斯勒拿河下游、世界最大湿地等(见图8)。 后者是提供知识导航服务。 用户可了解地表水体、建设用地、耕地等地表覆盖类型的全球分布格局、变化及成因(见图9)。

国家基础地理信息系统

基础地理_安徽省普通高中学业水平测试人文与社会基础(地理)_国家基础地理信息系统

4个

结语

概括起来,基础地理数据具有四大重要属性:规模性、时效性、共享性和知识性。 过去,人们对其规模性、时效性、共享性等方面进行了深入研究,取得了许多基础研究和技术研发成果,组织了一大批重大测绘信息化工程。 但对其知识特性关注不够,理论和技术研究较少。 除编制了一些专题图集外,组织的相关重大测绘项目不多。

当前,从传统的地理数据信息服务向空间知识服务转变,更好地支持科学研究、管理决策和服务公众,已经被各级测绘领导提上议事日程,并成为重大课题测绘转型升级和科技创新任务。 新任务。

为有效推进地理基础知识服务的开发和应用,需要站在国家战略的高度进行需求调研和问题分析,做好顶层设计; 积极争取国家重大科技专项、自然科学基金等支持,发展地理基础知识服务。 理论研究和关键技术研发,着力构建地理基础知识建模与服务技术体系。

此外,根据国家自然资源管理、生态环境监测和“一带一路”战略实施需要,设计并组织实施地理基础知识项目,实施地理基础知识服务,为国家和地区提供精准信息。实施中国重大国家战略。 、前瞻及时的知识服务。

谢谢

国家基础地理信息中心陈立军博士、殷川博士、翟曦博士,西南交通大学徐竺教授、彭鹏副教授参与了部分实验研究或讨论。 我们想在这里表达我们的谢意。

引用

陈军、刘万增、吴昊、李智霖、赵勇、张兰。 基础地理知识服务的基本问题与研究方向[J]. 武汉大学学报·信息科学版, 2019, 44(1): 38-47

陈军,刘万增,吴浩,李志林,赵勇,张兰。 地理空间知识服务的基本问题与研究方向[J]. 武汉大学测绘与信息科学, 2019, 44(1): 38-47.

安徽省普通高中学业水平测试人文与社会基础(地理)_基础地理_国家基础地理信息系统

扫描上方二维码下载全文