空间信息搜索引擎研究.pdf
第3 3 卷第1 期 2 0 0 4 年1 月 中国矿业大学学报 J o u r n a lo fC h i n aU n i v e r s i t yo fM i n i n g &T e c h n o l o g y V 0 1 .3 3N O .1 ] a n .2 0 0 4 文章编号1 0 0 0L9 6 4 2 0 0 4 0 10 0 9 00 5 空间信息搜索引擎研究 白玉琪,杨崇俊 中国科学院遥感应用研究所,北京1 0 0 1 0 1 摘要在借鉴现有4 种在线空间信息搜索策略的基础上,提出了一种遵循空间信息网络服务规 范、基于空间信息网络服务集成的动态空间信息搜索引擎系统设计方案.介绍了在国产优选 W e b G I S 平台软件地网G e o B e a n s 的基础上开发成功的阶段性研究成果一一文图自通,该系 统的研制成功表明了本文提出的动态空间信息搜索引擎设计方案具有可行性. 关键词空间信息;网络搜索引擎;网络服务;文图自通 中图分类号T P3 0 1文献标识码;A R e s e a r c ho nS p a t i a lI n f o r m a t i o nS e a r c hE n g i n e B A IY u q i ,Y A N GC h o n g j u n T h eI n s t i t u t eo fR e m o t eS e n s i n gA p p l i c a t i o n s ,C h i n e s eA c a d e m yo fS c i e n c e s ,B e i i i n g1 0 0 1 0 1 ,C h i n a A b s t r a c t T h i sp a p e ri n v e s t i g a t e st h ef o u ro n l i n es p a t i a li n f o r m a t i o ns e a r c hs t r a t e g i e s ,n a m e l yG e o f o o t p r i n t ,C l e a r i n g h o u s e ,O p e n G I Ss p e c i f i c a t i o n s a n dG e o g r a p h i c a lN e t w o r k .AS p a t i a lW e b S e r v i c e b a s e dd y n a m i cs p a t i a li n f o r m a t i o ns e a r c he n g i n ew i t han o v e lc l i e n te n dn a m e dM a p C o m p a s s i sd i s c u s s e d .As e a r c h e n g i n ei sd e s i g n e dw i t hf o u rp a r t s o n l i n es p a t i a li n f o r m a t i o ns p i d e r , d i s t r i b u t e ds p a t i a li n f o r m a t i o ni n d e x e r ,d y n a m i cs p a t i a lw e bs e r v i c ea d a p t o r ,a n dq u e r yp r o c e s s o r , w h i c ha r ei n t r o d u c e di nt h i sp a p e rr e s p e c t i v e l y .I tc a nb ec o n c l u d e dt h a tp r o p o s e dc o n c e p td e s i g no f s p a t i a li n f o r m a t i o ns e a r c he n g i n ec a ng r e a t l yp r o m o t et h eo n l i n es p a t i a li n f o r m a t i o nr e t r i e v i n g . K e yw o r d s s p a t i a Ii n f o r m a t i o n ;s e a r c he n g i n e ;s p a t i a lw e bS e r v i c e s ;M a p C o m p a s s 人类生活中的数据有8 0 %都和空间数据有 关o ] ,以建设空间信息系统为契机,推动相关产业 的迅速发展已成为国家的一项战略决策.空间数据 的采集、整理、加工、存储和管理的成本非常大,因 此需要从技术、政策和法规等多个层面推动空间数 据的共享和空间应用系统之间的互操作,并从宏观 上加速从空间数据到空间信息进而到空间知识的 转化过程. 借助于互联网制图技术 W e bM a p p i n g ,众多 的数字图像和地图数据等空问信息已经实现了在 线发布.这些空间数据的种类和数量越来越多,从 元数据到卫星图像、航空像片、地理基础图和专题 图等。几乎无所不含口] .随着空间信息网络应用的 不断深入,人们可以在线访问到越来越多的空间信 息.但是这些网络空间信息系统之间相互独立,所 提供的空间信息查询界面过于专业化,因此目前这 种空间信息查询系统并不能满足最终用户的查询 需求.他们真正需要的是一种简便而有效,能够与 他们的工作环境紧密结合的查询方式. 由于空间信息在互联网上具有特殊的存在形 式,加之它们所独有的海量性和异构性等特点,所 以到目前为止,此类研究还没有成熟的技术方案. 1 研究现状 目前,互联网上的空间信息主要由网络空间信 息系统提供,为了在它们的支持下实现空间信息的 自动化搜索,人们进行了大量有益的探索,其过程 可划分为4 个阶段设计地理标注、建立空间元数 收稿日期;2 0 0 3 0 4 1 0 基金珥目;国家8 6 3 “十五叶f 划项目 2 0 0 1 A A l 3 5 0 9 0 作者简介,白玉琪 1 9 7 6 1 ,男,安徽省宿县人,中国科学院遥感应用研究所博士研究生,从事空间信息科学方面的研究 万方数据 第1 期白玉琪等空间信息搜索引擎研究 据交换站、制订开放式标准和实现地理信息网络. 1 .1 地理标注 地理标注是由瑞典一家公司 S w e d i s hS p a c e C o r p o r a t i o n 提出的创意o ] .其基本思想是尝试通 过在网页中引入标准化的说明性标注,以显式地给 出该页面所包含的空间信息的属性描述比如参考 坐标系和相应的坐标范围、时间标志等. 但是由于近年来先进的对地观测技术所获得 的空问信息量迅速增长,它们只能够存储于后端的 空间数据库中,而不能够作为网页的静态成分,所 以这种思路不再适合目前互联网上的网络空间信 息系统的基本结构.此外,这种方法也没有从根本 上解决异构数据源的集成问题,因此没有能对空问 信息网络搜索产生很大的推动作用. 1 .2 建立空间元数据交换站 随着空间数据量的与日俱增和空间数据提供 者的日益广泛,从空间数据提供者到空间数据需求 者之间的一次性传递过程变得越来越不现实.为了 加快空间数据的交换和流通,空间数据提供者必须 从其所拥有的空间数据精选信息并提供给大众,这 些信息就是元数据. 为了完备、翔实地描述空间信息,联邦地理数 据委员会 F G D C 致力于该项研究,并于1 9 9 4 年 建立了为美国联邦机构所使用的地理空间元数据 内容标准“] .该标准为数据生产者在一个已知的范 围内描述其所拥有的空问数据提供了可能.潜在的 数据用户使用该元数据标准可为其独特的应用检 索到最合适的已知数据. 空间元数据交换站就是把来自于不同的空间 数据提供者的空间数据元数据描述信息集中存储 起来,并提供面向提供者的更新手段、面向数据用 户的查询机制.目前,已有为数众多的地理空间数 据交换站分布在世界各地,典型的有联邦地理数 据委员会r “、全球信息定位服务[ “、环境服务数据 地址簿r 7 1 等. 这种空间元数据交换站作为一个用户需求与 信息源提供者之间的路由中心,在很大程度上帮助 了最终用户找到其所需要的空间数据的提供者,但 是却不能够帮助他们完成实时的数据获取.用户必 须经由别的方式再次与提供者联系进而获得所需 的数据.因此,这种方式对于需要付费的空间数据 的交换是比较合适的,然而却不是一个面向社会多 层次、普适、方便的解决方案. 1 .3 开放式标准 这一阶段开始于开放地理信息系统协会 O G C 提出O p e n G I S 规范.O p e n G I S 规范规定了 网络空问信息系统之问需要互操作的空问数据应 包含的各种标准数据类型和相应的基本操作.它规 定r 互操作的规范和对数据语义的共同理解,从而 为软件开发人员提供了一个接口框架.遵循这个框 架开发的空问信息应用系统可眦允许用户在一个 开放的信息技术环境中访问和处理不同来源的空 间数据.其中,网络地图服务器接口规范 O p e n G I S W e bM a pS e r v e rS p e c i f i c a t i o n ,正式规范 、网络矢 量元素服务器接口规范 O p e n G I SW e bF e a t u r e S e r v e rS p e c i f i c a t i o n ,正式规范 、网络栅格元素服务 器规范 O p e n G I SW e bC o v e r a g eS e r v e rS p e c i f i c a t i o n ,正式规范 等网络制图服务规范0 1 通过定义 不同级别的操作接口和相应的执行流程,允许符合 规范的服务器间实时地进行查询、获取、处理和综 合等操作,同时也为单一客户程序透明地访问和集 成不同的网络制图服务器提供的空间信息提供了 可能.此外,目录服务接口规范 C a t a l o gS e r v i c e I n t e r f a c eS p e c i f i c a t i o n ,正式规范 提供了A P I 级别 的接口操作规范,支持不同的应用程序对一个分布 的异构的目录服务器群的发现、浏览和查询操作. 它进一步定义了面向目录服务器建立和结束一个 有状态的目录查询流程查询目录服务器属性,检 查请求的状态,取消当前请求,发送一个查询,显示 查询结果和得到当前查询结果集的元数据描述信 息o ] .因此,O p e n G I S 规范从根本上改变了网络空 间信息系统的“信息孤岛”的状况,也为空间信息的 网络搜索提供了很好的实现途径. 1 .4 地理伯息网络 E S R I 公司借助于其互联网地图服务器 A r c I M S ,于2 0 0 0 年6 月2 6 日启动了自己的基于 I n t e r n e t 的地理信息发布和共享方案地理信 息网络 G e o g r a p h yN e t w o r k “⋯.作为空间信息访 问的互联网门户,地理信息网络连接着全球范围内 的空间信息的使用者和空间信息的提供者,它提供 了在全球范围内的空间数据提供者、空间信息服务 提供者和空间信息用户之间实现互联互通的技术 架构.通过地理信息网络,用户可以查询并访问到 多种多样的空间信息,包括动态地图、可下载的数 据以及更多的高级空间信息网络服务. 但是E S R I 的G e o g r a p h yN e t w o r k 不能够集成 那些不是采用E S R I 技术的网络空间信息系统,因 此还不能够作为一种有效的面向异质异构网络空 间信息系统的整体解决方案.但客观上,这种空间 信息共建共享的方式无疑给实现空间信息的网络 万方数据 中国矿业大学学报 第3 3 卷 搜索提供了很好的思路走开放式道路,支持开放 式标准. 2 设计方案 通过以上的分析,可以明确空间信息搜索引擎 的难点在于提出面向异质异构的网络空间信息系 统的发现、访问和集成的技术方案.在遵循 O p e n G I S 规范的基础上,我们借鉴了W e b 服务的 思想,在相关前期工作的基础上o “。给出了如图1 所示的系统设计方案. 图1 空间信息搜索引擎系统结构 F i g .1 S y s t e ma r e h i t e e t u r eo fs p a t i a l i n f o r m a t i o ns e a r c he n g i n e 从如图1 可知,空间信息搜索引擎分为客户端 和服务器端两大部分. 2 .1 客户端 空间信息搜索引擎支持的客户端可以是一种 通用查询界面 W e b 页面 以供最终用户直接查 询,还可以是与最终用户的工作环境紧密集成的 专用查询界面.此外.作为一个地理信息搜索的服 务提供者,空间信息搜索引擎还可以向其他中间层 程序通过标准的高级A P I 接口提供服务. 2 .2 服务器端 服务器端展示了基于W e b 服务[ I ”的系统构 架.每一个空间信息搜索引擎服务器都以地理信 息网络服务的形式存在,它们都把自身的描述、所 提供服务的描述以及服务访问方式的描述在 U D D I [ 1 ”中注册,以供动态查询和动态连接.每一 个空间信息搜索引擎服务器包括以下4 个部分 2 .2 .1 分布式空间信息组织管理系统 为了加快对用户查询的快速响应,每一个空问 信息搜索引擎服务器都将逐步积累已查询的空间 信息的快照.考虑到空间信息海量性的特点,这些 信息只能够采用分布式的存储方式以满足用户以 后的查询需求. 为了快速的存储、查询和检索这些种类繁多且 格式多样的空闯信息就需要研究如何有效地组织 和管理这些空间信息,这涉及到元数据建模与集 成、多维数据建模技术、异构数据的转换和集成技 术、海量数据集成管理机理、分布式空间信息索引 以及高效的压缩存储策略等. 2 .2 .2 面向I n t e r n e t 的空问信息智能分析和提取 系统 该子系统将提供面向U D D I 的查询策略.它可 以在已有信息不能够满足当前用户查询的条件下, 自动启动,根据U D D I 中的地理信息网络服务提供 者的技术指纹信息快速选择最有效的提供者,然后 引导系统尝试根据注册的服务访问方式描述信息 进行访问. 此外,根据空间信息现势性的特点,该子系统 还必须通过一定的策略,自动引导系统进行已有空 间信息快照的数据更新,从而更好地满足用户以后 的查询需求. 2 .2 .3 面向W e b 服务动态链接系统 该子系统在面向I n t e r n e t 的空间信息智能分 析和提取系统的调度下,负责动态地与候选的地理 信息网络服务提供者链接,根据U D D I 中相应的技 术指纹进行查询,并在成功获取相应的空间信息之 后,通过智能查询请求处理系统提交给用户,并负 责把当前的空间信息提交给本地的分布式空间信 息组织管理系统. 2 .2 .4 面向最终客户的智能查询请求处理系统 该子系统直接接收最终用户通过通用或者专 用的查询界面发来的查询请求,在分析和处理后, 按照标准的格式向服务器后端模块提交查询,并负 责返回相应的查询结果.该子系统的两个重要特点 是1 在不能够直接满足用户查询的情况下,根据 空间关系运算,提交满足空间最近邻的候选结果; 2 支持基于空间方位的模糊查询. 3 一期原型系统文图自通1 .0 基于前期研究开发的国产优选W e b G I S 平台 软件地网G e o B e a n s ,我们实现了搜索引擎一 期原型系统文图自通. 一期原型系统的主要工作定位在提供一种简 万方数据 第1 期白玉琪等空间信息搜索引擎研究 洁直观的空间信息搜索引擎查询专用界面.这是一 种可以和用户端工作环境紧密集成的空间信息查 询入口程序,系统可以在浏览器或者W o r d 等环境 下通过右键菜单选项启动,也可以单独启动.在获 取用户输入的地名后,系统自动与特定服务器通 讯,在返回候选结果并得到用户的确认后,能够以 图形化的方式向用户提交查询结果.目前文图自 通1 .0 已经实现了客户端程序与相应的应用服务 器和W e b 服务器的分离,从而完全支持后期采用 集群方式达到商业化软件所需的性能需求. 图2 举例说明了在浏览器环境下用户如何在 浏览网页时,通过文图自通方便地获取与网页中地 名内容相应的地理地图信息. 图2 文图自通截图 F i g .2M a p C o m p a s s8 t r e e n s h o t 1 用户浏览网页,选取了一个感兴趣的地名 以“美国”为例 后。可以从快捷菜单中选择“文图 自通”以启动文图自通客户端程序 图2 a ; 2 文图自通客户端在向服务器发送查询请求 后得到查询结果,显示给用户;在返回的页面中还 提供了放大、缩小和漫游功能,用户可以进一步提 交请求 图2 b ; 3 如果地名不能够唯一匹配,则服务器会返 回多项查询结果,提请用户确认 图2 c ; 4 文图自通客户端维护着一个查询历史记 录,供用户查阅 图2 d ; 5 文图自通客户端程序支持动态修改参数配 置以连接不同的已知文图自通服务器 图2 e ; 6 基于G e o B e a n s 符合O p e n G I S W M S 的 M a pS e r v e r 技术开发的文图白通服务器程序1 .0 . 提供了相关的参数配置和用户请求监控等功能 图 2 f . 文图自通1 .0 系统加载了如下的数据 1 D C W1 10 0 0 万全球数据,取城市、国家、 河流和湖泊专题; 2 1t1 0 0 万全国基础地理数据,取全国公 路、河流、湖泊、铁路、省级行政区划和市县级别行 政区划专题; 3 24 5 9 个市县点 比例1 1 0 0 万 } 4 81 8 5 个乡镇点 比例1 ;1 0 0 万 . 目前用户可以通过下载后安装的文图自通客 户端程序访问位于数字地球中国网站上 w w w . d i g i t a l e a r t h .n e t .c n 的文图白通服务. 4 结束语 本文立足于地理信息网络服务,首次完整地给 出了空间信息搜索引擎的接体设计方案.论文介绍 的一期原型系统“文图自通”在空间信息查询 方式上具有独特的优点,它大大简化了最终用户查 询空间信息的复杂步骤,提供了一种与最终用户的 工作环境紧密集成的解决方案,是一种空间信息应 用模式的突破,也是促进空间信息应用真正大众 化、社会化的有效途经. 参考文献; [ 1 ] 镣冠华.全社会要高度关注数字地球E R 3 .科学新 闻,] 9 9 9 .1 . [ 2 ]杨崇俊.在互联网络上能找到地理空间数据吗 E A ] .陈述彭.数字地球百问[ c ] .北京科学出版 社,1 9 9 9 .1 7 6 1 7 7 . [ 3 3V r e t b L a d0 .G I R g e o g r a p h i ci n f o r m a t i o nr e t d e v a l [ E B /O L ] .h t t p //w w w .s s e .s e /g i r ,1 9 9 5 一I I - 2 4 1 2 0 0 30 7 0 2 . [ 4 3F e d e r a lG e o g r a p h mD a t aC o m m i t t e e .G e o s p a t i a lm e t a d a t as t a n d a r d s [ S /O L ] .h t t p //w w w .f g d c .g o v / m e t a d a t a /m e t a s t a n d .h t m l .2 0 0 3 0 4 1 6 /2 0 0 3 0 7 0 2 . [ 5 ] F e d e r a l G e o g r a p h i cD a t aC e n t e rC l e a r i n g h o u s e . C l e a r i n g h o u s ei n f o r m a t i o nr e ∞㈣p a g e [ E B /O L ] . h t t p //w w w .f g d c .g o v /c l e a r i n g h o u s e /c l e a r i n g h o u s e . 万方数据 中国矿业大学学报第3 3 卷 h t m l ,2 0 0 3 一0 51 2 /2 0 0 3 0 70 2 . r 6 ]F e d e r a lI n f o r m a t i o nC e n t e r .G l o b a li n { o r m a t i o n1 0 c a t o rs e r v i c e [ E B /O L ] .h t t p //w w w .g i l s .n e t /i n d e x . h t m l 。2 0 0 3 0 5 一0 2 /2 0 0 3 0 70 2 . [ 7 ] N a t i o n a lO c e a n i ca n dA t m o s p h e r i cA d m i n i s t r a t i o n . N o A Ae n v i r o n m e n t a ls e r v i c e sd a t ad i r e c t o r yn E B / O L ] .h t t p //w w w .e s d i m .n o f l a .g o v /N O A AC a t a l o g , 1 9 9 6 一1 2 0 5 /2 0 0 30 7 0 2 . [ 8 ] O p e n G l SC o n s o r t i u m .O v e r v i e wo fo p e nG I Si m p l e m e n t a t i o ns p e c i f i c a t i o n s [ S /O L ] .h t t p //w w w . o p e n g i s .o r g /p r e s s r m /s u m m a r i e s /2 0 0 1 0 9 1 1 .T S . S p e e O v e r .h t m .2 0 0 1 0 9 1 1 /2 0 0 30 7 0 2 . [ 9 ] D o u g l a sN .I n t e r o p e r a b l es p a t i a ld a t ac a t a l o g sE J ] . P h o t o g r a m m e t r i cE n g i n e e r i n g &R e m o t eS e n s i n g t 1 9 9 9 ,6 5 5 7 3 5 7 6 . [ 1 0 j B i l lHE S R Il a u n c h e st h eg e o g r a p h yn e t w o r k E B / 0 1 ,] h t t p //w w w .d i r e e t i o n s m a g .c o m /a r t i c l e .a s p a r t i c l ei d 7 l - 2 0 0 20 62 7 1 2 0 0 3 0 7 0 2 . [ 1 l 王兴玲基于X M L 的地理信息W e b 服务平台研究 与应用[ D ] .北京中国科学院遥感应用研究所, 2 0 0 2 . [ 1 2 ]w o r l dW i d eW e bC o n s o r t i u m .W e bs e r v i c e sa r c h i t e c t u r e [ E B /O L ] .h t t p //w w w .w 3 .o r g /T R /w s a r c h /,2 0 0 21 1 一1 4 /2 0 0 30 7 一0 2 . [ 1 3 ] O A S I Ss t a n d a r d sc o n s o r t i u m .U D D IS p e c i f i c a t i o n s 3 .0 [ S /O L ] .h t t p //w w w .o a s i s o p e n .o r g / e o m m i t t e e s /u d d i s p e c /d o c /t c s p e c s .h t m u d d i v 3 . 2 0 0 2 0 7 一1 9 /2 0 0 30 70 2 . 我校喜捧第八届“挑战杯”竞赛优胜杯 责任编辑邓群 由团中央、中国科协、教育部、全国学联、广东省人民政府主办,华南理工大学承办的第八届 “挑战杯”全国大学生课外学术科技作品决赛日前揭晓.我校获得佳绩,选送的4 件参赛作品分别 获得特等奖1 项,一等奖1 项,二等奖2 项,我校荣获“优胜杯”.能源学院秦波涛等同学的作品“防治 煤炭自燃的三相泡沫装备与技术获特等奖,机电学院王永胜等同学的作品花生收获机获一等 奖,资源学院沈玉林等同学的作品鄂尔多斯盆地北部苏里格庙地区上古生界层序地层研究、化 工学院孙乾等同学的作品用重介方法生产超低灰煤的半工业性试验研究分获二等奖. 中国矿业大学报1 2 0 0 3 年第9 5 l 期 万方数据