Formulation of an evaluation index system of geological hazard data quality in China
-
摘要:
基于支撑全国地质灾害研究和服务地质灾害防治的目的,针对全国地质灾害数据库,提出了包括完整性、时效性、准确性、一致性、规范性五个维度为一级指标的评价指标体系,其下涵盖10个二级指标、28个三级指标;利用德尔菲法确定各指标评价权重,并以中部某省地质灾害数据库为例完成其质量评价,结果显示该省地质灾害数据库建设总体情况较好。此次地质灾害数据质量评价体系研究融科学性、实用性、探索性为一体,对于提高全国地质灾害数据库质量,开展基于数据挖掘的地质灾害科学研究,提升数据对全国地质灾害防治支撑能力具有重要意义和作用。
Abstract:This paper provides an exploratory study about data quality evaluation index system of geological hazard. To serve geological hazard research and national geological hazard prevention, select five dimensions of completeness, timeliness, accuracy, consistency, and standardization as first-level indicators, which contains 10 secondary indicators and 28 tertiary indicators. Take the geological hazard database of a province in central China as an example, conduct data quality evaluation with Delphi method, the results show that is good the overall situation of the province's geological hazard database quality. This quality evaluation of geological hazard data is an exploratory research that integrates science and practicability, it is of great significance for improving the data quality to support geological hazard research and national geological hazard prevention.
-
Key words:
- geological hazard /
- database /
- quality evaluation /
- index system
-
表 1 地质灾害数据质量评价指标
Table 1. Evaluation index of geological hazard data quality
一级指标 二级指标 三级指标 指标说明 完整性 数据类型
完整性属性表 地质灾害数据库核心数据,记录地质灾害点从发现到核销全生命周期相关信息,结构化数据 调查报告 描述地质灾害点数量、分布规律、发育机制、灾情特征、险性特征的文档 空间图层 包括地质灾害点分布、易发程度分区、地层岩性、地质构造等相关空间矢量图层 多媒体 记录地质灾害现象、专业监测设备安装、工程治理现场、搬迁避让现场的照片或录像 测绘数据 描述地质灾害点位置、形状、大小、地层结构等平面、剖面特征的图件 勘查数据 记录地质灾害点上的勘查点平面布置图、钻孔柱状图、岩土参数表 遥感数据 记录地质灾害点及周边地形地物的卫星影像、航片 属性表数据
完整性滑坡表 记录滑坡点统一编号、名称、经度、纬度、隐患点类型、规模等级、威胁人口、威胁财产、威胁对象、险情等级、稳定性、是否隐患点、是否群测群防点、是否专业监测点、是否治理点、滑坡类型、地层时代、地层岩性、斜坡类型、滑坡体积。 崩塌表 记录崩塌点统一编号、名称、经度、纬度、隐患点类型、规模等级、威胁人口、威胁财产、威胁对象、险情等级、稳定性、是否隐患点、是否群测群防点、是否专业监测点、是否治理点、崩塌类型、地层倾向、地层倾角、斜坡类型、堆积体体积。 泥石流表 记录泥石流点统一编号、名称、经度、纬度、隐患点类型、规模等级、威胁人口、威胁财产、威胁对象、险情等级、稳定性、是否隐患点、是否群测群防点、是否专业监测点、是否治理点、相对主河位置、泥石流冲出方量、泥石流类型、物源区特征、水动力来源及特征。 群测群防表 记录群测群防员姓名、群测群防员电话 专业监测表 记录专业监测内容、监测方法、监测设备名称、监测频率、监测数据(位移X、位移Y、位移Z、水位埋深、降雨量) 气象预警预报信息 记录气象预警的预报词、预警矢量产品、预警图片产品。 搬迁避让表 记录搬迁避让项目名称、搬迁户数、搬迁人数、搬迁人员姓名、搬迁人员身份证、保护财产 工程治理表 记录工程治理项目名称、中央资金、地方资金、保护人数 时效性 更新频率 专业监测数据更新频率 是否按设备固定频率持续更新 灾害点调查数据更新频率 是否每年至少更新1次 群测群防信息更新频率 是否每年至少更新1次 搬迁避让数据更新频率 是否按照项目进度安排持续更新 工程治理数据更新频率 是否按照项目进度安排持续更新 准确性 位置准确性 灾害点坐标 地质灾害点经纬度是否准确 数量准确性 灾害点数据准确率 地质灾害点数量、体积、威胁人口数、威胁财产数是否准确 信息准确性 群测群防信息准确率 群测群防员姓名、群测群防员电话是否准确 一致性 规模一致性 体积数量与等级一致性 滑坡、崩塌、泥石流的规模等级是否根据体积或流域面积按规范划分 灾情一致性 受灾情况与等级一致性 滑坡、崩塌、泥石流的灾情等级是否根据造成的死亡人数和直接经济损失数量按规范划分 险情一致性 受威胁情况与等级一致性 滑坡、崩塌、泥石流的险情等级是否根据威胁人数和财产数量按规范划分 规范性 重要字段
内容规范性稳定性 是否按“不稳定、基本稳定、稳定”规定字段填写,为单选项。 威胁对象 是否按“地级市及地级以上市区,县城,乡镇,村寨,居民点,学校,医院,矿山,工厂,水库,电站,景区,农田,饮灌渠道,森林,公路,大江大河,铁路,输电线路,通讯设施,国防设施,其它”规定字段填写,为多选项。 表 2 一级指标权重计算结果
Table 2. List of the frist index weight
一级指标 最大值 最小值 平均值 中位数 完整性 0.88 0.52 0.62 0.63 时效性 0.19 0.09 0.15 0.13 准确性 0.16 0.06 0.09 0.10 一致性 0.14 0.05 0.09 0.10 规范性 0.09 0.02 0.05 0.04 表 3 指标权重一览表
Table 3. List of index weight
一级指标 二级指标 三级指标 完整性(0.62) 数据类型完整性(0.20) 属性表(0.11) 调查报告(0.04) 空间图层(0.01) 多媒体(0.01) 测绘数据(0.01) 勘查数据(0.01) 遥感数据(0.01) 属性表数据完整性(0.42) 滑坡表(0.10) 崩塌表(0.10) 泥石流表(0.10) 群测群防表(0.04) 专业监测表(0.03) 气象预警预报信息(0.03) 搬迁避让表(0.01) 工程治理表(0.01) 时效性(0.15) 更新频率(0.15) 专业监测数据更新频率(0.01) 灾害点调查数据更新频率(0.01) 群测群防信息更新频率(0.01) 搬迁避让数据更新频率(0.01) 工程治理数据更新频率(0.01) 准确性(0.09) 位置准确性(0.04) 灾害点坐标(0.04) 数量准确性(0.03) 灾害点数据准确率(0.03) 信息准确性(0.02) 群测群防信息准确率(0.02) 一致性(0.09) 规模一致性(0.03) 体积数量与等级一致性(0.03) 灾情一致性(0.03) 受灾情况与等级一致性(0.03) 险情一致性(0.03) 受威胁情况与等级一致性(0.03) 规范性(0.05) 重要字段内容规范性
(0.05)稳定性(0.02) 威胁对象(0.03) 表 4 某省地质灾害数据质量得分表
Table 4. Geological hazard data quality score of a province
序号 一级评价 二级评价 指标 得分 指标 得分 1 完整性 52 数据类型完整性 20 属性表数据完整性 32 2 时效性 15 更新频率 15 3 准确性 6 数量准确性 3 位置准确性 2 信息准确性 1 4 一致性 9 规模一致性 3 灾情一致性 3 险情一致性 3 5 规范性 5 重要字段内容规范性 5 合计 87 87 -
[1] 张宁, 袁勤俭. 数据质量评价述评[J]. 情报理论与实践,2017,40(10):135 − 139. [ZHANG Ning, YUAN Qinjian. A review of data quality evaluation[J]. Information Studies: Theory & Application,2017,40(10):135 − 139. (in Chinese with English abstract)
[2] 刘冰, 庞琳. 国内外大数据质量研究述评[J]. 情报学报,2019,38(2):217 − 226. [LIU Bing, PANG Lin. Review of domestic and international research on big data quality[J]. Journal of the China Society for Scientific and Technical Information,2019,38(2):217 − 226. (in Chinese with English abstract) doi: 10.3772/j.issn.1000-0135.2019.02.011
[3] 潘旭, 王金丽, 赵晓龙, 等. 智能配电网多维数据质量评价方法[J]. 中国电机工程学报,2018,38(5):1375 − 1384. [PAN Xu, WANG Jinli, ZHAO Xiaolong, et al. Multi dimensional data quality evaluation method for intelligent distribution network[J]. Proceedings of the CSEE,2018,38(5):1375 − 1384. (in Chinese with English abstract)
[4] 肖雅元, 文明, 盛鵾, 等. 基于评价指标的电网数据质量评价系统设计[J]. 信息技术,2020,44(4):155 − 158. [XIAO Yayuan, WEN Ming, SHENG Kun, et al. Design of grid data quality evaluation system based on evaluation index[J]. Information Technology,2020,44(4):155 − 158. (in Chinese with English abstract)
[5] 南琦琦, 穆云飞, 董晓红, 等. 电动汽车快速充电网综合评估指标体系与方法[J]. 电力系统自动化,2020,44(1):83 − 91. [NAN Qiqi, MU Yunfei, DONG Xiaohong, et al. Comprehensive evaluation index system and method for fast charging network of electric vehicles[J]. Automation of Electric Power Systems,2020,44(1):83 − 91. (in Chinese with English abstract) doi: 10.7500/AEPS20190408004
[6] BOES L, HOUAREAU C, ALTMANN D, et al. Evaluation of the German surveillance system for hepatitis B regarding timeliness, data quality, and simplicity, from 2005 to 2014[J]. Public Health,2020,180:141 − 148. doi: 10.1016/j.puhe.2019.11.012
[7] PEZOULAS V C, KOUROU K D, KALATZIS F, et al. Medical data quality assessment: On the development of an automated framework for medical data curation[J]. Computers in Biology and Medicine,2019,107:270 − 283. doi: 10.1016/j.compbiomed.2019.03.001
[8] VANBRABANT L, MARTIN N, RAMAEKERS K, et al. Quality of input data in emergency department simulations: Framework and assessment techniques[J]. Simulation Modelling Practice and Theory,2019,91:83 − 101. doi: 10.1016/j.simpat.2018.12.002
[9] ÁLVAREZ SÁNCHEZ R, BERISTAIN IRAOLA A, EPELDE UNANUE G, et al. TAQIH, a tool for tabular data quality assessment and improvement in the context of health data[J]. Computer Methods and Programs in Biomedicine,2019,181:104-824. doi: 10.1016/j.cmpb.2018.12.029
[10] 张晓冉, 袁满. 通用数据质量评估模型及本体实现[J]. 计算机研究与发展,2018,55(6):1333 − 1344. [ZHANG Xiaoran, YUAN Man. General data quality assessment model and ontological implementation[J]. Journal of Computer Research and Development,2018,55(6):1333 − 1344. (in Chinese with English abstract) doi: 10.7544/issn1000-1239.2018.20160764
[11] RIESENER M, DÖLLE C, SCHUH G, et al. Framework for defining information quality based on data attributes within the digital shadow using LDA[J]. Procedia CIRP,2019,83:304 − 310. doi: 10.1016/j.procir.2019.03.131
[12] HARYADI A F. Requirements on and antecedents of big data quality: An empirical examination to improve big data quality in financialservice organizations[D]. Delft: Delft University of Technology, 2016: 13.
[13] AGGARWAL A. Data quality evaluation framework to assess the dimensions of 3V’s of big data[J]. International Journal of Emerging Technology and Advanced Engineering,2017,7(10):503 − 506.
[14] HARYADI A F, HULSTIJN J, WAHYUDI A, et al. Antecedents of big data quality: an empirical examination in financial service organizations[C]//2016 IEEE International Conference on Big Data (Big Data). December 5-8, 2016, Washington, DC, USA. IEEE, 2016: 116-121.
[15] GLOWALLA P, BALAZY P, BASTEN D, et al. Process-driven data quality management: an application of the combined conceptual life cycle model[C]//2014 47th Hawaii International Conference on System Sciences. January 6-9, 2014, Waikoloa, HI, USA. IEEE, 2014: 4700-4709.
[16] CLARKE. The OECD guidelines[EB/OL]. 2017-4-4[2021-09-04]. http://www.rogerclarke.com/DV/PaperOECD.html.
[17] 查先进, 陈明红. 信息资源质量评估研究[J]. 中国图书馆学报,2010,36(2):46 − 55. [ZHA Xianjin, CHEN Minghong. Research on quality assessment of information resources[J]. Journal of Library Science in China,2010,36(2):46 − 55. (in Chinese with English abstract)
[18] BATINI C, RULA A, SCANNAPIECO M, et al. From data quality to big data quality[J]. Journal of Database Management,2015,26(1):60 − 82. doi: 10.4018/JDM.2015010103
[19] TOIVONEN M. Big data quality challenges in the context of business analytics[D]. Helsinki: University of Helsinki, 2015: 47-48.
[20] 张绍华, 潘蓉, 宗宇伟. 大数据治理与服务[M]. 上海: 上海科学技术出版社, 2016: 120.
ZHANG Shaohua, PAN Rong, ZONG Yuwei. Big data governance and services[M]. Shanghai. Shanghai Science and Technology Press. 2016: 120. (in Chinese)
[21] 丁可. 金融扶贫绩效评价体系构建与案例应用研究[D]. 河南: 河南工业大学, 2020.
DING Ke. Research on Construction of Financial Poverty Alleviation Performance Evaluation System and Case Application[D]. Henan: Henan University of Technology, 2020. (in Chinese with English abstract)
[22] 魏劲如. 基于神经网络和模糊推理的VGI数据质量评价研究[D]. 西安: 长安大学, 2019.
WEI Jinru. Research on VGI data quality assessment based on neural network and fuzzy inference[D]. Xi'an: Changan University, 2019. (in Chinese with English abstract)
[23] “一带一路”眼科人工智能研发国际联盟, “2019医学人工智能数据库管理规范方案修订研讨会”专家组. 人工智能眼病图像数据库入库数据质量评价指南[J]. 中华实验眼科杂志,2019(12):937 − 941. ["One belt, one road" International Alliance for ophthalmic artificial intelligence research and development, Expert group of 2019 medical artificial intelligence database management specification revision Seminar. Guidelines for image quality assessment of artificial intelligence ophthalmic disease imaging database[J]. Chinese Journal of Experimental Ophthalmology,2019(12):937 − 941. (in Chinese with English abstract)
[24] 陶凯, 杨文, 杜中, 等. 轨道检测数据集成存储与数据质量评价[J]. 铁道建筑,2019,59(9):116 − 120. [TAO Kai, YANG Wen, DU Zhong, et al. Integrated storage for track inspection data and data quality evaluation[J]. Railway Engineering,2019,59(9):116 − 120. (in Chinese with English abstract) doi: 10.3969/j.issn.1003-1995.2019.09.28
[25] IMMONEN A, PÄÄKKÖNEN P, OVASKA E. Evaluating the quality of social media data in big data architecture[J]. IEEE Access,2015(3):2028 − 2043. doi: 10.1109/ACCESS.2015.2490723
[26] 刘博浩. 我国开放政府数据质量评价研究[D]. 郑州: 郑州大学, 2019.
LIU Bohao. Research on the evaluation of open government data quality in China[D]. Zhengzhou: Zhengzhou University, 2019. (in Chinese with English abstract)