Geochemistry Science Database System for East China Based on Relational Database and WebGIS
-
摘要: 如何高效管理、利用中国东部已有地球科学研究数据是急需解决的问题.在地球化学数据模型研究基础上, 应用关系数据库和WebGIS技术, 建立了中国东部地球化学科学数据库(ECGD).ECGD深度整合WebGIS技术, 研究者可利用ECGD基于Web对地球化学数据进行检索、分析、输出和空间可视化, 查询结果可以标注于基于WebGIS的网络地图, 生成分类、分级专题图, 并对查询结果进行地球化学图解等专业分析.ECGD是第一个基于Web, 集成了数据检索、空间数据可视化和数据分析功能的地球化学科学数据库, 为地学工作者提供了一个地球化学数据管理、共享、获取、交流的协作平台, 具有重要的实用价值.Abstract: How to efficiently manage and reuse the existeing geoscience data of eastern China is an urgent problem.Based on the geochemical data model, we established the East China geochemical science database (ECGD) that applied the relational database and WebGIS technology.Using the ECGD, researchers can query, analyze, output and implement spatial visualization to the geochemical data via a website.Because integration of WebGIS technology, the query results can be mapped on digital map based on WebGIS and can generate classification thematic maps.Meanwhile, researchers can make online analysis of the query results using offered geochemical diagram.ECGD is the first web-based geochemical science database that integrated the functions of data retrieval, spatial visualization and online analysis, and it provides a geochemical data sharing, access and exchange collaboration platform for researchers.
-
Key words:
- North China craton /
- data model /
- relational database /
- WebGIS
-
0. 引言
华北克拉通是研究中国东部岩浆活动、构造作用及成矿作用的天然实验室(Gao et al., 2004; 魏文博等, 2007).研究人员在该区已开展了大量的地球化学研究, 发表了大量高质量的地球化学数据(郑建平等, 2006; 刘勇胜和高山, 2007), 但这些数据广泛分布在不同的文献、报告和研究机构而得不到充分的利用.一些研究者通过收集少量已发表数据进行深入研究做出了重要的研究成果(李江海等, 2006; 周新华和张宏福, 2006; 刘勇胜和高山, 2007).地球化学数据的共享、管理、深入研究已成为地球化学学科及其相关领域迫切需要解决的重要问题.科学数据库研究为解决这一问题提供了良好契机.科学数据库指利用数据库技术和其相关技术实现对海量科学数据的合理、高效管理, 使科研人员能够利用该数据库方便地进行数据查询、分析和深入研究(Gray and David, 2005).目前, 国内外很多学科都开展了科学数据库和科学数据共享的相关研究, 著名的科学数据库有SDSS SkyServer (Alexander et al., 2000)、TerraService (Barclay et al., 2000)等.在地球化学领域, 著名的国际科学数据库系统有PetDB、GEOROC (Nohl and Sarbas, 1999; Sarbas et al., 1999)、NAVDAT、EarthChem和EarthRef等; 国内主要地球化学数据库系统有火山岩岩石化学-地球化学数据库(尚如相等, 1989)、全国区域化探数据库系统(刘如英等, 1994)、全国主要大中型金铜多金属矿区域地球化学数据库(史长义和张金华, 2001)、中国同位素地球化学数据库等.
这些数据库存在以下问题: (1) 数据库覆盖区域或专业领域有限, 例如NAVDAT、EarthChem主要针对北美地区, 国内的一些数据库主要面向矿产等领域; (2) 国内的大多数据库没有Web版本, 不利于推广利用; (3) 部分数据库缺乏对地球化学数据模型的深入研究, 数据模型存在一定的问题; (4) 没有或者只有很弱的数据分析功能; (5) 没有引入GIS的相关功能; (6) 元数据信息缺乏, 例如缺乏数据来源、精度、采样位置等信息, 不利于或者无法用于进一步深入研究.
与其他数据相比, 地质数据, 尤其是地球化学数据本身具有复杂性、地域性、空间性的特征, 传统的关系数据库技术无法体现地球化学数据的空间性特征, 更不能将定量数据与空间特性结合起来.GIS (地理信息系统) 技术, 以计算机软硬件为基础, 具有对空间信息的采集、管理、存储、分析、显示、输出等功能; 具有丰富的空间分析及模型能力, 能基于地理空间数据库, 对复杂的现实地理世界进行描述、抽象、分析、模拟、预测和优化.为开展基于空间数据库的地球化学数据应用研究提供了很好的基础平台(吴冲龙, 1998; 郑贵洲, 1998).目前, 基于GIS的地质数据库系统的设计及数据共享有较多的学术探讨(胡光道和李振华, 2002; 孙九林和李爽, 2002; 吴信才和吴亮, 2006), 但基于WebGIS的地球化学数据库的研究报道很少, 相关的地球化学数据库也比较少.
中国东部地球化学科学数据库(ECGD) 是以关系数据库技术、GIS和WebGIS技术、网络技术为基础, 基于Web平台建立的地球化学数据库系统, 不仅实现了对中国东部已发表地球化学数据的统一管理、存储、共享、查询, 而且具有已有地球化学数据库没有的空间可视化、空间分析、专业分析等功能.本文主要介绍该系统的地球化学数据模型、系统结构和主要功能.
1. 地球化学数据模型
地球化学数据模型研究是地球化学科学数据库研究的基础.在对地球化学数据本身特点、组成、内容、使用方式分析基础上, 根据数据库技术发展最新现状, 参考已有国际国内同类数据库, 应用关系数据模型, 对中国东部地球化学科学数据库的数据模型进行了深入研究和分析, 在此基础上, 完成了数据库的逻辑结构设计和数据编码设计.
1.1 地球化学数据
完整的地球化学数据不仅包含基本的岩石样品分析数据, 而且包括样品的描述性辅助信息, 即元数据信息.ECGD存储的地球化学数据包括两类: 第一类, 岩石样品的地球化学分析结果, 包括主量元素、微量元素、放射性同位素和稳定同位素等分析结果, 以及利用不同岩石样品、不同测试方法得到的测年结果; 第二类, 数据的元数据信息, 主要包括: (1) 分析方法相关的元数据信息(分析方法、仪器等)和分析样品的类型(全岩、矿物等); (2) 样品元数据, 包括样品描述、岩性、采样地点等; (3) 参考文献元数据, 包括参考文献题目、作者、摘要、关键词、发表期刊、年限等相关信息.
1.2 地球化学数据模型
在地球化学数据内容和特点研究基础上, 应用关系数据理论建立了ECGD地球化学关系数据模型.ECGD的所有数据被储存在一系列具有唯一名称、相互关联的关系数据表中, 这些数据表涵盖了地球化学数据的分析结果、属性信息和元数据.例如, “Sample”表记录了ECGD中保存的样品信息, “Reference”表包含了所有与参考文献有关的元数据信息.每个关系数据表都由“字段” (行)和“记录” (列) 组成.每个“字段”记录了具体的信息, 以名称区分; 每个“记录”为表格中的一行数据.为了在特定表格中找到所需信息, 必须保证数据库表格中的每条记录都不会重复, 即每条记录都有唯一特定的识别方式, 称之为主键.主键可以是样品名称或者样品Id, 一般更倾向于选择样品Id (样品名称有时会重复), 以确保记录的唯一性.图 1说明了ECGD关系数据模型的基本概念.在图 1的“Sample”表中, 由于样品名称有可能重复, 笔者选择样品的Id为主键.关系数据库中的各种表格之间通过外键相互关联, 而这些外键是关联表格的主键.在图 1“Sample_Reference”表中, “Sample_Id”和“Reference_Id”分别为与“Sample”表和“Reference”表相关联的外键.主键一般是唯一确定的, 外键可以重复出现, 例如图 1“Sample_Reference”表中, 同一篇参考文献可以重复出现.
1.3 数据库结构
ECGD根据上述关系数据模型及地球化学数据所包含的内容, 建立ECGD关系数据库, 数据库包括10个关系数据表、228个字段.数据库结构及其数据表内容如图 2所示, 主要包括样品名称、位置、年龄、岩性、主量元素、微量元素、同位素及参考文献等信息, 这些信息在数据库中分别存储在具有唯一命名的数据表中, 包含了相关内容的地球化学数据属性和元数据记录.例如, “Sample”表中包括样品名称、地理位置、经纬度等; “Major Elements”表中包括“SiO2、MgO、Fe2O3等”.图 2a列出了地球化学数据库中存储的关系表及其所包括的具体数据项.这些表之间存在一定的关系.“Sample”表为主表, 其他表与“Sample”表之间存在“一对一”或“一对多”或“多对多”的关系.其中, “Sample”表与“Major Elements”表、“Trace Elements”表、“Rare Earth Elements”表、“Isotope System”表、“Sample Characteristics”表及“Modal Data”表之间存在“一对一”的关系.也就是说, 一个样品Id在这些表中只有一条记录相对应; “一对多”的关系存在于“Sample”表和“Age”表之间, 也就是说, 一个样品Id表中, 在数据库中有多条年龄信息记录; “多对多”的关系存在于“Sample”表和“Reference”表之间, 即一篇参考文献中可能包含多个样品或一个样品出现在多篇参考文献中(各个表之间的关系如图 2b所示).“Sample”表中, 样品“Id”字段为主键, 其他字段为外键.存在所有关系表中的字段通过唯一的样品Id链接以确保数据库中不会出现重复记录.
2. 系统结构与功能
2.1 系统结构
ECGD基于关系数据库系统SQL Server 2005、WebGIS平台ArcIMS 9.2、Microsoft.net Frame-work 2.0构建; 使用ASP.net和C#语言开发; 采用了基于B/S的分布式、松耦合的多层体系结构; 应用了Ajax、多级缓存、Web服务等技术; 应用了基于服务器端文件缓存和Ajax技术的WebGIS (ArcIMS) 开发, 具有良好的运行性能、扩展性和开放性(图 3).
如图 3所示, ECGD由以下部分组成:
(1) 数据库: 基础的地球化学数据存储于SQL Server数据库, 在地球化学数据模型研究基础上, 设计了10个关系数据表, 228个字段, 各个数据表通过1对1、1对多关系关联, 多对多关系通过辅助表分解为1对多关系关联;
(2) 数据服务层: 建立在ADO.net基础上, 为功能模块提供数据查询、数据获取服务;
(3) ArcIMS: 基础的地图服务由ArcIMS提供, 并通过地图服务层为系统提供网络地图服务;
(4) 地图服务层: 充当ArcIMS和系统之间的中间层, ASP.net编写, 为系统提供地图服务.该层对ArcIMS的地图服务做了服务器端的文件缓存, 以提高ArcIMS服务器的效率和负载;
(5) 功能模块: 包括数据查询、数据可视化、数据分析等功能模块, 基于.net和C#语言编写, 以.net程序集(.dll) 的方式提供, 可以随时替换和升级;
(6) 界面层: 基于ASP.net构建, 应用了Ajax技术, 并提供了Web服务的数据查询和获取接口;
(7) News和Events服务: 一个单独的通用信息发布系统, 通过JS直接在Web界面层集成;
(8) 系统工具: 主要包括了属性数据、空间数据更新工具和地图服务管理工具等系统维护工具, 数据输入和更新是一个可以插入Microsoft Excel的Rich Client客户端, 可以快速、方便地对数据进行更新、维护.
ECGD各个模块可以部署于同一台服务器, 也可以分别部署于不同服务器, 具有较好的伸缩性、扩展性和开放性.
2.2 系统功能和特点
从最终用户角度, ECGD包括数据查询、空间可视化、数据分析、数据输出4个主要功能模块, 各模块的具体功能见表 1.
表 1 ECGD的主要功能模块Table Supplementary Table Major function modules of ECGDECGD主要特点包括:
(1) ECGD集成了基于Web的数据检索、数据可视化和空间可视化、数据分析等功能;
(2) ECGD深度整合了基于WebGIS的网络电子地图技术, 查询结果可以通过采样位置标注于网络地图, 并根据数据的不同属性信息生成分类、分级专题图以及相关的统计图表;
(3) 基于服务器端文件缓存和Ajax技术的ArcIMS开发, 极大地提高了用户体验, 降低了基于ArcIMS的WebGIS服务器负担, 提高了WebGIS服务器的运行效率;
(4) 通过对专业应用领域和WebGIS、Web设计的深入分析, 对ECGD的功能、界面、操作进行了优化设计, 使得ECGD的大部分功能都可以通过一到两次鼠标点击完成, 和同类系统相比, 具有非常好的易用性和可操作性.
3. 讨论与结论
地球化学科学数据库为解决地质、地球化学等科学研究中数据管理、共享、交流和深入研究提供了良好的解决方案, 通过与GIS技术结合, 为地球化学研究提供了新的思路和工具.利用中国东部地球化学科学数据库, 研究者不仅可以对数据进行查询、检索等一般操作, 而且查询结果可以通过空间位置标注于电子地图中(可缩放、平移、点选), 进行空间信息和属性信息的互动查看, 解决了传统数据库将地质数据与其空间属性脱节的问题; 可以根据查询结果的岩性等属性生成分类专题图, 也可以根据主量、微量、同位素等属性信息生成分级专题图和对应的统计图表, 同时可以在线进行常规的地球化学专业分析(包括常用图解、稀土模式图及微量元素蛛网图等).通过对查询结果进行分类专题图解及统计研究, 可以对数据进行探索性(空间) 数据分析(EDA, SEDA), 识别感兴趣的或特殊的特征, 检查数据错误等.在线地球化学专业图解分析使原来要花大量时间完成的地球化学图解可以一键完成, 研究者可以随时分析感兴趣的样品, 大大提高了工作效率.
例如可以利用中国东部地球化学科学数据库检索得到Wang et al. (2006)一文中的四合屯地区火山岩样品, 检索结果可以直接标注在数字地图上(图 4), 研究者可以查看其分布特征及采样位置等空间信息.利用数据库提供的分类分级专题图空间分析方法对该数据进行Nb的分级专题图分析, 如图 4所示, 分析结果按照Nb的大小分为5个等级, 以不同大小的圆及不同深浅的颜色显示在地图上.可以看出, 在该文的采样剖面上, 具有高Nb含量的样品主要分布在采样位置的两端, 该结果对数据分析及地质成因解释具有重要的参考价值.
图 4 四合屯地区火山岩的Nb分级专题图(据Wang et al., 2006)Fig. 4. Classification thematic map of Nb in Sihetun volcanic rocks中国东部地球化学科学数据库(ECGD) 在地球化学数据模型研究基础上, 应用关系数据库和WebGIS技术构建, 实现了对海量地球化学数据的统一存储和管理.利用该数据库, 研究者可以基于Web对数据库进行各种条件的检索, 筛选出有研究价值的数据; 通过与WebGIS结合, 可以对查询结果进行空间可视化, 并生成分类、分级专题图; 可以在线对查询结果进行地球化学图解等分析研究.ECGD是第一个基于Web, 集成了数据检索、空间数据可视化和数据分析功能的地球化学科学数据库, 为地学工作者提供了一个地球化学数据共享、获取、交流的协作平台, 对华北克拉通地质、地球化学研究具有重要的实用价值.
-
图 4 四合屯地区火山岩的Nb分级专题图(据Wang et al., 2006)
Fig. 4. Classification thematic map of Nb in Sihetun volcanic rocks
表 1 ECGD的主要功能模块
Table 1. Major function modules of ECGD
-
Alexander, S. S., Gray, J., Ani, R. T., et al., 2000. The SDSS SkyServer-Public access to the sloan digital Sky Server data. Technical report. Microsoft Corporation, USA. Barclay, T., Slutz, D. R., Gray, J., 2000. "TerraServer: A spatial data warehouse. "Proc. ACM SIGMOD, 307-318. Gao, S., Rudnick, R. L., Yuan, H. L., et al., 2004. Recycling lower continental crust in the North China craton. Nature, 432: 892-897. doi: 10.1038/nature03162 Gray, J., David, T. L., 2005. Scientific data management in the coming decade. Technical report. Microsoft Corporation, USA. Hu, G. D., Li, Z. H., 2002. Basic platform of land and resources information systembased on data center and its technical questions. Earth Science-Journal of China University of Geosciences, 27(3): 306-310(in Chinese with English abstract). doi: 10.1007/s11769-002-0045-5 Li, J. H., Niu, X. L., Cheng, S. H., et al., 2006. The Early Precambrian tectonic evolution of continental craton: A case study from North China. Earth Science-Journal of China University of Geosciences, 31(3): 285-293(in Chinese with English abstract). doi: 10.1007/s11442-006-0415-5 Liu, R. Y., Wu, K. L., Jin, C. H., et al., 1994. Geochemical exploration database for all regions in China. Computing Techniques for Geophysical and Geochemical Exploration, 16(2): 102-146(in Chinese with English abstract). http://en.cnki.com.cn/Article_en/CJFDTOTAL-WTHT402.002.htm Liu, Y. S., Gao, S., 2007. High Nb/Ta ratios of the Mesozoic basalts from North China: Records of continental crustrecycling. Bulletin of Mineralogy, Petrology and Geochemistry, 26(1): 19-28(in Chinese with English abstract). Nohl, U., Sarbas, B., 1999. GEOROC, the MPI geochemical rock database: Introduction of the web interface (abstract). EOS Trans. AGU, Fall Meeting, 80(46): F1177. Sarbas, B., Jochum, K. P., Nohl, U., et al., 1999. GEOROC, the MPI geochemical rock database: A new tool for geochemists (abstract). EOS Trans. AGU, Fall Meeting, 80(46): F1184. Shang, R. X., Zeng, G. Y., Li, D. X., 1989. The management system and application program of volcanic lithological and geochemical database. Acta Petrologica et Mineralogica, (4): 331-337(in Chinese with English ab-stract). Shi, C. Y., Zhang, J. H., 2001. Regional geochemical database of main large-middle gold and copper polymetallic orefields and deposits of China. Geology and Prospecting, 37(3): 41-44(in Chinese with English abstract). http://en.cnki.com.cn/Article_en/CJFDTOTAL-DZKT200103010.htm Sun, J. L., Li, S., 2002. Geo-data sharing and data-grid. Earth Science-Journal of China University of Geosciences, 27(5): 539-543(in Chinese with English abstract). http://en.cnki.com.cn/Article_en/CJFDTOTAL-DQKX200205010.htm Wang, X. R., Gao, S., Liu, X. M., et al., 2006. Geochemistry of high-Mg andesites from the Early Cretaceous Yixian Formation, western Liaoning: Implications for lower crustal delamination and Sr/Y variations. Science in China (Ser. D), 49: 904-914. doi: 10.1007/s11430-006-2016-7 Wei, W. B., Ye, G. F., Jin, S., et al., 2007. Three dimensional P-wave velocity structure of the crust of North China. Earth Science-Journal of China University of Geosciences, 32(4): 441-452(in Chinese with English abstract). Wu, C. L., 1998. Development and application of geological and mineral resources point-source information system (GMPIS). Earth Science-Journal of China University of Geosciences, 23(2): 193-198(in Chinese with English abstract). http://en.cnki.com.cn/Article_en/CJFDTOTAL-DQKX802.018.htm Wu, X. C., Wu, L., 2006. Service-oriented distributed spatial information supporting system. Earth Science-Journal of China University of Geosciences, 31(5): 585-589(in Chinese with English abstract). Zheng, G. Z., 1998. Application of geographic information system in geology. Earth Science-Journal of China University of Geosciences, 23(4): 420-423(in Chinese with English abstract). http://en.cnki.com.cn/Article_en/CJFDTOTAL-DQKX804.028.htm Zheng, J. P., Lu, F. X., Yu, C. M., et al., 2006. Peridotitic petrochemistry of the eastern North China: Significance for lithospheric mantle evolution. Earth Science-Journal of China University of Geosciences, 31(1): 49-56(in Chinese with English abstract). Zhou, X. H., Zhang, H. F., 2006. Highly chemical heterogeneity of subcontinental lithosphere mantle beneath North China and its major transformation. Earth Science-Journal of China University of Geosciences, 31(1): 8-13(in Chinese with English abstract). http://en.cnki.com.cn/Article_en/CJFDTOTAL-DQKX200601002.htm 胡光道, 李振华, 2002. 基于数据中心的国土资源信息系统基础平台的构建及技术问题. 地球科学——中国地质大学学报, 27(3): 306-310. https://www.cnki.com.cn/Article/CJFDTOTAL-DQKX200203016.htm 李江海, 牛向龙, 程素华, 等, 2006. 大陆克拉通早期构造演化历史探讨: 以华北为例. 地球科学——中国地质大学学报, 31(3): 285-293. https://www.cnki.com.cn/Article/CJFDTOTAL-DQKX200603000.htm 刘如英, 邬宽廉, 金淳浩, 等, 1994. 全国区域化探数据库(REG-291). 物探化探计算技术, 16(2): 102-146. https://www.cnki.com.cn/Article/CJFDTOTAL-WTHT402.002.htm 刘勇胜, 高山, 2007. 华北地区中生代玄武岩高Nb/Ta值对地壳岩石再循环的直接记录. 矿物岩石地球化学通报, 26(1): 19-28. doi: 10.3969/j.issn.1007-2802.2007.01.003 尚如相, 曾广瑜, 李德兴, 1989. 火山岩岩石化学、地球化学数据库管理系统及应用程序. 岩石矿物学杂志, (4): 33-337. https://www.cnki.com.cn/Article/CJFDTOTAL-YSKW198904004.htm 史长义, 张金华, 2001. 全国主要大中型金铜多金属矿区域地球化学数据库. 地质与勘探, 37(3): 41-44. doi: 10.3969/j.issn.0495-5331.2001.03.011 孙九林, 李爽, 2002. 地球科学数据共享与数据网格技术. 地球科学——中国地质大学学报, 27(5): 539-543. https://www.cnki.com.cn/Article/CJFDTOTAL-DQKX200205010.htm 魏文博, 叶高峰, 金胜, 等, 2007. 华北地区地壳P波三维速度结构. 地球科学——中国地质大学学报, 32(4): 441-452. https://www.cnki.com.cn/Article/CJFDTOTAL-DQWJ201403003.htm 吴冲龙, 1998. 地质矿产点源信息系统的开发与应用. 地球科学——中国地质大学学报, 23(2): 193-198. https://www.cnki.com.cn/Article/CJFDTOTAL-DQKX802.018.htm 吴信才, 吴亮, 2006. 面向服务的分布式空间信息支撑平台. 地球科学——中国地质大学学报, 31(5): 585-589. https://www.cnki.com.cn/Article/CJFDTOTAL-DQKX200605001.htm 郑贵洲, 1998. 地理信息系统(GIS) 在地质学中的应用. 地球科学——中国地质大学学报, 23(4): 420-423. https://www.cnki.com.cn/Article/CJFDTOTAL-DQKX804.028.htm 郑建平, 路凤香, 余淳梅, 等, 2006. 华北东部橄榄岩岩石化学特征及其岩石圈地幔演化意义. 地球科学——中国地质大学学报, 31(1): 49-56. https://www.cnki.com.cn/Article/CJFDTOTAL-DQKX200601007.htm 周新华, 张宏福, 2006. 中生代华北岩石圈地幔高度化学不均一性与大陆岩石圈转型. 地球科学——中国地质大学学报, 31(1): 8-13. https://www.cnki.com.cn/Article/CJFDTOTAL-DQKX200601002.htm -