ISSN 1003-8035 CN 11-2852/P
  • 中国科技核心期刊
  • CSCD收录期刊
  • Caj-cd规范获奖期刊
  • Scopus 收录期刊
  • DOAJ 收录期刊
  • GeoRef收录期刊
欢迎扫码关注“i环境微平台”

中国地质灾害数据质量评价指标体系构建

尹春荣, 李媛, 曲雪妍, 张艳玲, 佟彬, 杨旭东, 房浩

尹春荣, 李媛, 曲雪妍, 张艳玲, 佟彬, 杨旭东, 房浩. 中国地质灾害数据质量评价指标体系构建[J]. 中国地质灾害与防治学报, 2021, 32(4): 120-125. DOI: 10.16031/j.cnki.issn.1003-8035.2021.04-16
引用本文: 尹春荣, 李媛, 曲雪妍, 张艳玲, 佟彬, 杨旭东, 房浩. 中国地质灾害数据质量评价指标体系构建[J]. 中国地质灾害与防治学报, 2021, 32(4): 120-125. DOI: 10.16031/j.cnki.issn.1003-8035.2021.04-16
Chunrong YIN, Yuan LI, Xueyan QU, Yanling ZHANG, Bin TONG, Xudong YANG, Hao FANG. Formulation of an evaluation index system of geological hazard data quality in China[J]. The Chinese Journal of Geological Hazard and Control, 2021, 32(4): 120-125. DOI: 10.16031/j.cnki.issn.1003-8035.2021.04-16
Citation: Chunrong YIN, Yuan LI, Xueyan QU, Yanling ZHANG, Bin TONG, Xudong YANG, Hao FANG. Formulation of an evaluation index system of geological hazard data quality in China[J]. The Chinese Journal of Geological Hazard and Control, 2021, 32(4): 120-125. DOI: 10.16031/j.cnki.issn.1003-8035.2021.04-16

中国地质灾害数据质量评价指标体系构建

详细信息
    作者简介:

    尹春荣(1972-),女,硕士,水文地质工程地质专业,高级工程师,主要从事全国地质灾害数据库建设及综合研究。E-mail:yinchunrong@mail.cgs.gov.cn

    通讯作者:

    曲雪妍(1985-),女,硕士,地下水科学与工程专业,高级工程师,主要从事全国地质灾害数据库建设及综合研究。E-mail:quxueyan@mail.cgs.gov.cn

  • 中图分类号: P694

Formulation of an evaluation index system of geological hazard data quality in China

  • 摘要: 基于支撑全国地质灾害研究和服务地质灾害防治的目的,针对全国地质灾害数据库,提出了包括完整性、时效性、准确性、一致性、规范性五个维度为一级指标的评价指标体系,其下涵盖10个二级指标、28个三级指标;利用德尔菲法确定各指标评价权重,并以中部某省地质灾害数据库为例完成其质量评价,结果显示该省地质灾害数据库建设总体情况较好。此次地质灾害数据质量评价体系研究融科学性、实用性、探索性为一体,对于提高全国地质灾害数据库质量,开展基于数据挖掘的地质灾害科学研究,提升数据对全国地质灾害防治支撑能力具有重要意义和作用。
    Abstract: This paper provides an exploratory study about data quality evaluation index system of geological hazard. To serve geological hazard research and national geological hazard prevention, select five dimensions of completeness, timeliness, accuracy, consistency, and standardization as first-level indicators, which contains 10 secondary indicators and 28 tertiary indicators. Take the geological hazard database of a province in central China as an example, conduct data quality evaluation with Delphi method, the results show that is good the overall situation of the province's geological hazard database quality. This quality evaluation of geological hazard data is an exploratory research that integrates science and practicability, it is of great significance for improving the data quality to support geological hazard research and national geological hazard prevention.
  • 2019年,全国地质灾害数据库首次实现了与大陆地区除上海外的30个省(区、市)互联互通和数据共享,集成了调查评价、监测预警、工程治理、搬迁避让等全方位地质灾害防治数据,并实现在线更新,对于开展地质灾害科学研究,支撑全国地质灾害防治意义重大。数据质量是数据研究的前提,是一切数据分析、挖掘、决策支持的基础[1],本文拟建立地质灾害数据质量评价体系,通过对地质灾害互联互通共享数据进行评估,提出数据优化方向。

    如前所述,全国地质灾害数据来源于省级地质灾害数据库,具备三个明显特点。一是动态性,为服务地质灾害科学研究和防灾管理,保证数据真实有效,各省(区、市)通过每年汛期前、汛期中、汛期后地质灾害排查对数据进行增加、修改、补充,以保证其时效性和准确性;二是平台多样性,各省级数据库采用的系统平台不尽相同,库结构各有差异;三是数据多样性,地质灾害数据类型包括结构化的属性表、空间图层及非结构化的文档、多媒体、DEM、InSAR等多种类型。以上三点客观上使得全国地质灾害数据集成和更新较为复杂。

    在确保安全的前提下,为了实现各省级地质灾害数据库与全国库实时在线交换共享,针对各省异地、异主、异构分布式数据库,设计了省级和国家级地质灾害数据更新前置库,采用触发器技术实现库间数据动态增量更新,利用ETL等中间件技术实现多源异构数据快速抽取、清洗、变换和集成;为保障数据连续、稳定、安全传输,建立了基于专用传输网络的地质灾害数据传输模式(图1)。图中1、2数据库的类型和结构可以不同,3、4数据库类型和结构与国家级数据库一致,1、3以及2、4的数据库内容一致,“数据同步服务”负责按一定的时间间隔(分钟、小时、天)执行省级-国家级数据可靠传输;“数据中间件”执行数据抽取、清洗、加工、加载;“交换服务”执行多源数据库表与文件交换。

    图  1  地质灾害数据互联互通共享交换平台
    Figure  1.  Interconnection and sharing platform of geological hazard data

    数据质量评价相关研究由来已久,国内外已经积累了不少成果,主要可分为三类:第一类为综述型,如张宁等[1]从数据质量评价模型、评价方法、评价主体、评价对象4个角度对当前数据质量评价研究现状进行了总结,并对研究中存在的问题进行了概述;刘冰等[2]以国内外大数据质量研究文献为对象,从基本内涵、质量管理、质量评价、应用实践等角度对相关研究进行梳理与综述,分析国内外相关研究进展。第二类为应用研究型,针对某一特定类型数据开展评价,如潘旭、肖雅元、南琦琦分别构建了智能配电网和电动汽车快速充电网数据质量评价体系,提出相应数据质量评价方法[3-5];BOES等在医学领域开展了数据质量评价研究[6-9];第三类研究试图探索一种综合多数模型与质量评价维度的通用型数据质量评价模型[10-11],RIESENER等[11]介绍了一个根据数据相关属性和系统相关属性确定信息质量的框架。目前未见针对地质灾害数据质量开展的评估研究。

    数据质量因项目质量目标不同而存在差异,并非所有质量特征均会明显地出现在每个评价项目之中[12],只有符合相关用途和满足用户要求的数据才是质量良好数据,即数据质量为“适合使用”,并取决于数据用户[13]。大数据的多源、多种类型、多种结构等特点决定其质量的动态性和情境化;与此同时,数据质量与数据生命周期的阶段或过程高度耦合[14]。因此,数据质量不是一个绝对概念,而是贯穿于包括数据收集、处理、存储直至进入数据系统的整个数据周期;不是一个静态概念,其价值会因存储过程中的衰减而动态变化[15-16]。基于以上分析,地质灾害数据从服务目标出发,以完整性、动态性、生命周期角度开展质量评价。

    目前关于数据质量评价方法的研究主要包括定性评价、定量评价、定性定量相结合的评价。其中定性评价主要用于满足数据用户需求,采用数据质量调查的方式构建评价指标体系;定量评价是一种客观评价方法,常用于结构化数据评价;在数据质量的多维度评价上,定性定量相结合评价是对前两种单一评价方法的有益补充和完善[1],其主要做法是在定性评价的基础上引入数学手段,定性问题通过人工设定的标准进行评分并做出量化处理,评分的过程都是针对事先建立的指标体系,具有部分数理统计的特征,如德尔菲法、模糊综合评估法、层次分析法等[17]。地质灾害数据类型多样,即有结构化数据,也包括非结构化数据,本次选用定性定量相结合的德尔菲法进行数据质量评价。

    数据质量评价指标已有若干学者进行了深入研究[18-26],涉及电力、医学、金融等领域。参考这些研究结果,结合地质灾害数据特征和评价目的,本次选用完整性等5个一级指标、数据类型完整性等10个二级指标、属性数据表完整性等28个三级指标开展评价,建立我国地质灾害数据评价指标体系(表1)。

    表  1  地质灾害数据质量评价指标
    Table  1.  Evaluation index of geological hazard data quality
    一级指标二级指标三级指标指标说明
    完整性数据类型
    完整性
    属性表地质灾害数据库核心数据,记录地质灾害点从发现到核销全生命周期相关信息,结构化数据
    调查报告描述地质灾害点数量、分布规律、发育机制、灾情特征、险性特征的文档
    空间图层包括地质灾害点分布、易发程度分区、地层岩性、地质构造等相关空间矢量图层
    多媒体记录地质灾害现象、专业监测设备安装、工程治理现场、搬迁避让现场的照片或录像
    测绘数据描述地质灾害点位置、形状、大小、地层结构等平面、剖面特征的图件
    勘查数据记录地质灾害点上的勘查点平面布置图、钻孔柱状图、岩土参数表
    遥感数据记录地质灾害点及周边地形地物的卫星影像、航片
    属性表数据
    完整性
    滑坡表记录滑坡点统一编号、名称、经度、纬度、隐患点类型、规模等级、威胁人口、威胁财产、威胁对象、险情等级、稳定性、是否隐患点、是否群测群防点、是否专业监测点、是否治理点、滑坡类型、地层时代、地层岩性、斜坡类型、滑坡体积。
    崩塌表记录崩塌点统一编号、名称、经度、纬度、隐患点类型、规模等级、威胁人口、威胁财产、威胁对象、险情等级、稳定性、是否隐患点、是否群测群防点、是否专业监测点、是否治理点、崩塌类型、地层倾向、地层倾角、斜坡类型、堆积体体积。
    泥石流表记录泥石流点统一编号、名称、经度、纬度、隐患点类型、规模等级、威胁人口、威胁财产、威胁对象、险情等级、稳定性、是否隐患点、是否群测群防点、是否专业监测点、是否治理点、相对主河位置、泥石流冲出方量、泥石流类型、物源区特征、水动力来源及特征。
    群测群防表记录群测群防员姓名、群测群防员电话
    专业监测表记录专业监测内容、监测方法、监测设备名称、监测频率、监测数据(位移X、位移Y、位移Z、水位埋深、降雨量)
    气象预警预报信息记录气象预警的预报词、预警矢量产品、预警图片产品。
    搬迁避让表记录搬迁避让项目名称、搬迁户数、搬迁人数、搬迁人员姓名、搬迁人员身份证、保护财产
    工程治理表记录工程治理项目名称、中央资金、地方资金、保护人数
    时效性更新频率专业监测数据更新频率是否按设备固定频率持续更新
    灾害点调查数据更新频率是否每年至少更新1次
    群测群防信息更新频率是否每年至少更新1次
    搬迁避让数据更新频率是否按照项目进度安排持续更新
    工程治理数据更新频率是否按照项目进度安排持续更新
    准确性位置准确性灾害点坐标地质灾害点经纬度是否准确
    数量准确性灾害点数据准确率地质灾害点数量、体积、威胁人口数、威胁财产数是否准确
    信息准确性群测群防信息准确率群测群防员姓名、群测群防员电话是否准确
    一致性规模一致性体积数量与等级一致性滑坡、崩塌、泥石流的规模等级是否根据体积或流域面积按规范划分
    灾情一致性受灾情况与等级一致性滑坡、崩塌、泥石流的灾情等级是否根据造成的死亡人数和直接经济损失数量按规范划分
    险情一致性受威胁情况与等级一致性滑坡、崩塌、泥石流的险情等级是否根据威胁人数和财产数量按规范划分
    规范性重要字段
    内容规范性
    稳定性是否按“不稳定、基本稳定、稳定”规定字段填写,为单选项。
    威胁对象是否按“地级市及地级以上市区,县城,乡镇,村寨,居民点,学校,医院,矿山,工厂,水库,电站,景区,农田,饮灌渠道,森林,公路,大江大河,铁路,输电线路,通讯设施,国防设施,其它”规定字段填写,为多选项。
    下载: 导出CSV 
    | 显示表格

    表1的一级指标,代表本次对地质灾害数据开展质量评价的5个维度,包括完整性、时效性、准确性、一致性和规范性;二级指标是对一级指标的进一步细化分类;三级指标是在二级指标分类的基础上,对应到地质灾害数据的具体内容;指标说明是对数据质量考核标准的细化和解释。

    按照德尔菲法评价方法,需要选定地质灾害专业数位专家进行数据评价指标权重打分。图2是德尔菲法评价方法流程图。

    图  2  指标权重确定方法
    Figure  2.  The process of index weight determination

    本次共邀请20位专家参与打分,最后返回有效打分表18份。打分表说明中明确要求5个一级指标权重总计为1,其细分的二级指标权重之和应当与对应的一级指标权重相同,三级指标权重之和与其所属二级指标权重一致。所有专家打分计算后的指标权重平均值、中位数分别合计并不为1,因此表2是一级指标统计后归一的结果。二级、三级指标权重也同样计算统计得出。

    表  2  一级指标权重计算结果
    Table  2.  List of the frist index weight
    一级指标最大值最小值平均值中位数
    完整性0.880.520.620.63
    时效性0.190.090.150.13
    准确性0.160.060.090.10
    一致性0.140.050.090.10
    规范性0.090.020.050.04
    下载: 导出CSV 
    | 显示表格

    统计得出的三级指标权重结果再次请专家投票,最后12位专家赞同采用平均权重值,6位专家赞同采用中位数权重值,根据最大值法确定本次评价采用平均值权重。表3为德尔菲法确定的一、二、三级指标权重表。

    表  3  指标权重一览表
    Table  3.  List of index weight
    一级指标二级指标三级指标
    完整性(0.62)数据类型完整性(0.20)属性表(0.11)
    调查报告(0.04)
    空间图层(0.01)
    多媒体(0.01)
    测绘数据(0.01)
    勘查数据(0.01)
    遥感数据(0.01)
    属性表数据完整性(0.42)滑坡表(0.10)
    崩塌表(0.10)
    泥石流表(0.10)
    群测群防表(0.04)
    专业监测表(0.03)
    气象预警预报信息(0.03)
    搬迁避让表(0.01)
    工程治理表(0.01)
    时效性(0.15)更新频率(0.15)专业监测数据更新频率(0.01)
    灾害点调查数据更新频率(0.01)
    群测群防信息更新频率(0.01)
    搬迁避让数据更新频率(0.01)
    工程治理数据更新频率(0.01)
    准确性(0.09)位置准确性(0.04)灾害点坐标(0.04)
    数量准确性(0.03)灾害点数据准确率(0.03)
    信息准确性(0.02)群测群防信息准确率(0.02)
    一致性(0.09)规模一致性(0.03)体积数量与等级一致性(0.03)
    灾情一致性(0.03)受灾情况与等级一致性(0.03)
    险情一致性(0.03)受威胁情况与等级一致性(0.03)
    规范性(0.05)重要字段内容规范性
    (0.05)
    稳定性(0.02)
    威胁对象(0.03)
    下载: 导出CSV 
    | 显示表格

    根据前文确定的指标体系及评价方法,选择地质灾害发育程度较高、数据库与信息系统建设较为完善的我国中部某省为例,按百分制开展其与全国互联互通共享数据的质量评价(表4)。

    表  4  某省地质灾害数据质量得分表
    Table  4.  Geological hazard data quality score of a province
    序号一级评价二级评价
    指标得分指标得分
    1完整性52数据类型完整性20
    属性表数据完整性32
    2时效性15更新频率15
    3准确性6数量准确性3
    位置准确性2
    信息准确性1
    4一致性9规模一致性3
    灾情一致性3
    险情一致性3
    5规范性5重要字段内容规范性5
    合计8787
    下载: 导出CSV 
    | 显示表格

    从完整性分析,被评价省地质灾害属性表、调查报告、地质灾害相关空间图层、多媒体,以及测绘、勘查、遥感各类型数据均具备,类型完整性得满分;但滑坡等属性表中字段内容有缺失,按照字段缺失数量扣掉属性表数据完整性相应分数。从时效性分析,其省级前置库数据可实时同步至全国库,时效性得满分。从准确性分析,省级库中地质灾害数量与其推送至全国库中数量相同,但其坐标稍有出界,少量群测群防员信息更新未及时入库,扣掉相应准确性分数。从一致性分析,其地质灾害规模、灾情、险情等级划分严格按国家相关标准,其等级与相应数量关系逻辑一致性好,该项得满分。从规范性分析,其稳定性描述和威胁对象选项完全符合规定,规范性得满分。

    通过分析可以看出,该省地质灾害数据库建设总体情况较好,数据管理类型全面、数据项规范、时效性强,综合评价可达良好水平。但该数据库属性表内容还需大力补充,地质灾害点坐标信息亟需校正,群测群防员信息需及时入库更新,以提高其对地质灾害科学研究和防治的支撑作用。

    数据质量评价是地质灾害数据库建设中不可或缺的组成部分,对于提高数据使用价值意义重大。本次数据质量评价是全国地质灾害数据库建设中的探索性研究,首次建立了我国地质灾害数据质量评价指标体系,并以某省数据为例完成了评价。然而其指标体系建设和评价还需进一步研究:

    (1)数据质量不是一个绝对概念,而是贯穿于收集、处理、存储、应用整个数据生命周期,因此指标体系全面性应当与之相匹配,本次质量评价一定程度上考虑了地质灾害的全生命周期质量评价,但在全面性和具体化等方面还需研究和深化;

    (2)数据质量不是一个静态概念,其价值会因存储过程中的衰减而动态变化,如何设置适当反应数据价值的动态指标是今后数据质量评价研究的一个重点和难点;

    (3)数据质量评价维度与指标选择以目标为导向,因此质量评价指标应当是一个立体、开放、动态、多层次体系,伴随地质灾害数据库进一步完善和服务功能扩展,其质量评价指标体系和方法也需要不断深化和优化。

  • 图  1   地质灾害数据互联互通共享交换平台

    Figure  1.   Interconnection and sharing platform of geological hazard data

    图  2   指标权重确定方法

    Figure  2.   The process of index weight determination

    表  1   地质灾害数据质量评价指标

    Table  1   Evaluation index of geological hazard data quality

    一级指标二级指标三级指标指标说明
    完整性数据类型
    完整性
    属性表地质灾害数据库核心数据,记录地质灾害点从发现到核销全生命周期相关信息,结构化数据
    调查报告描述地质灾害点数量、分布规律、发育机制、灾情特征、险性特征的文档
    空间图层包括地质灾害点分布、易发程度分区、地层岩性、地质构造等相关空间矢量图层
    多媒体记录地质灾害现象、专业监测设备安装、工程治理现场、搬迁避让现场的照片或录像
    测绘数据描述地质灾害点位置、形状、大小、地层结构等平面、剖面特征的图件
    勘查数据记录地质灾害点上的勘查点平面布置图、钻孔柱状图、岩土参数表
    遥感数据记录地质灾害点及周边地形地物的卫星影像、航片
    属性表数据
    完整性
    滑坡表记录滑坡点统一编号、名称、经度、纬度、隐患点类型、规模等级、威胁人口、威胁财产、威胁对象、险情等级、稳定性、是否隐患点、是否群测群防点、是否专业监测点、是否治理点、滑坡类型、地层时代、地层岩性、斜坡类型、滑坡体积。
    崩塌表记录崩塌点统一编号、名称、经度、纬度、隐患点类型、规模等级、威胁人口、威胁财产、威胁对象、险情等级、稳定性、是否隐患点、是否群测群防点、是否专业监测点、是否治理点、崩塌类型、地层倾向、地层倾角、斜坡类型、堆积体体积。
    泥石流表记录泥石流点统一编号、名称、经度、纬度、隐患点类型、规模等级、威胁人口、威胁财产、威胁对象、险情等级、稳定性、是否隐患点、是否群测群防点、是否专业监测点、是否治理点、相对主河位置、泥石流冲出方量、泥石流类型、物源区特征、水动力来源及特征。
    群测群防表记录群测群防员姓名、群测群防员电话
    专业监测表记录专业监测内容、监测方法、监测设备名称、监测频率、监测数据(位移X、位移Y、位移Z、水位埋深、降雨量)
    气象预警预报信息记录气象预警的预报词、预警矢量产品、预警图片产品。
    搬迁避让表记录搬迁避让项目名称、搬迁户数、搬迁人数、搬迁人员姓名、搬迁人员身份证、保护财产
    工程治理表记录工程治理项目名称、中央资金、地方资金、保护人数
    时效性更新频率专业监测数据更新频率是否按设备固定频率持续更新
    灾害点调查数据更新频率是否每年至少更新1次
    群测群防信息更新频率是否每年至少更新1次
    搬迁避让数据更新频率是否按照项目进度安排持续更新
    工程治理数据更新频率是否按照项目进度安排持续更新
    准确性位置准确性灾害点坐标地质灾害点经纬度是否准确
    数量准确性灾害点数据准确率地质灾害点数量、体积、威胁人口数、威胁财产数是否准确
    信息准确性群测群防信息准确率群测群防员姓名、群测群防员电话是否准确
    一致性规模一致性体积数量与等级一致性滑坡、崩塌、泥石流的规模等级是否根据体积或流域面积按规范划分
    灾情一致性受灾情况与等级一致性滑坡、崩塌、泥石流的灾情等级是否根据造成的死亡人数和直接经济损失数量按规范划分
    险情一致性受威胁情况与等级一致性滑坡、崩塌、泥石流的险情等级是否根据威胁人数和财产数量按规范划分
    规范性重要字段
    内容规范性
    稳定性是否按“不稳定、基本稳定、稳定”规定字段填写,为单选项。
    威胁对象是否按“地级市及地级以上市区,县城,乡镇,村寨,居民点,学校,医院,矿山,工厂,水库,电站,景区,农田,饮灌渠道,森林,公路,大江大河,铁路,输电线路,通讯设施,国防设施,其它”规定字段填写,为多选项。
    下载: 导出CSV

    表  2   一级指标权重计算结果

    Table  2   List of the frist index weight

    一级指标最大值最小值平均值中位数
    完整性0.880.520.620.63
    时效性0.190.090.150.13
    准确性0.160.060.090.10
    一致性0.140.050.090.10
    规范性0.090.020.050.04
    下载: 导出CSV

    表  3   指标权重一览表

    Table  3   List of index weight

    一级指标二级指标三级指标
    完整性(0.62)数据类型完整性(0.20)属性表(0.11)
    调查报告(0.04)
    空间图层(0.01)
    多媒体(0.01)
    测绘数据(0.01)
    勘查数据(0.01)
    遥感数据(0.01)
    属性表数据完整性(0.42)滑坡表(0.10)
    崩塌表(0.10)
    泥石流表(0.10)
    群测群防表(0.04)
    专业监测表(0.03)
    气象预警预报信息(0.03)
    搬迁避让表(0.01)
    工程治理表(0.01)
    时效性(0.15)更新频率(0.15)专业监测数据更新频率(0.01)
    灾害点调查数据更新频率(0.01)
    群测群防信息更新频率(0.01)
    搬迁避让数据更新频率(0.01)
    工程治理数据更新频率(0.01)
    准确性(0.09)位置准确性(0.04)灾害点坐标(0.04)
    数量准确性(0.03)灾害点数据准确率(0.03)
    信息准确性(0.02)群测群防信息准确率(0.02)
    一致性(0.09)规模一致性(0.03)体积数量与等级一致性(0.03)
    灾情一致性(0.03)受灾情况与等级一致性(0.03)
    险情一致性(0.03)受威胁情况与等级一致性(0.03)
    规范性(0.05)重要字段内容规范性
    (0.05)
    稳定性(0.02)
    威胁对象(0.03)
    下载: 导出CSV

    表  4   某省地质灾害数据质量得分表

    Table  4   Geological hazard data quality score of a province

    序号一级评价二级评价
    指标得分指标得分
    1完整性52数据类型完整性20
    属性表数据完整性32
    2时效性15更新频率15
    3准确性6数量准确性3
    位置准确性2
    信息准确性1
    4一致性9规模一致性3
    灾情一致性3
    险情一致性3
    5规范性5重要字段内容规范性5
    合计8787
    下载: 导出CSV
  • [1] 张宁, 袁勤俭. 数据质量评价述评[J]. 情报理论与实践,2017,40(10):135 − 139. [ZHANG Ning, YUAN Qinjian. A review of data quality evaluation[J]. Information Studies: Theory & Application,2017,40(10):135 − 139. (in Chinese with English abstract)
    [2] 刘冰, 庞琳. 国内外大数据质量研究述评[J]. 情报学报,2019,38(2):217 − 226. [LIU Bing, PANG Lin. Review of domestic and international research on big data quality[J]. Journal of the China Society for Scientific and Technical Information,2019,38(2):217 − 226. (in Chinese with English abstract) DOI: 10.3772/j.issn.1000-0135.2019.02.011
    [3] 潘旭, 王金丽, 赵晓龙, 等. 智能配电网多维数据质量评价方法[J]. 中国电机工程学报,2018,38(5):1375 − 1384. [PAN Xu, WANG Jinli, ZHAO Xiaolong, et al. Multi dimensional data quality evaluation method for intelligent distribution network[J]. Proceedings of the CSEE,2018,38(5):1375 − 1384. (in Chinese with English abstract)
    [4] 肖雅元, 文明, 盛鵾, 等. 基于评价指标的电网数据质量评价系统设计[J]. 信息技术,2020,44(4):155 − 158. [XIAO Yayuan, WEN Ming, SHENG Kun, et al. Design of grid data quality evaluation system based on evaluation index[J]. Information Technology,2020,44(4):155 − 158. (in Chinese with English abstract)
    [5] 南琦琦, 穆云飞, 董晓红, 等. 电动汽车快速充电网综合评估指标体系与方法[J]. 电力系统自动化,2020,44(1):83 − 91. [NAN Qiqi, MU Yunfei, DONG Xiaohong, et al. Comprehensive evaluation index system and method for fast charging network of electric vehicles[J]. Automation of Electric Power Systems,2020,44(1):83 − 91. (in Chinese with English abstract) DOI: 10.7500/AEPS20190408004
    [6]

    BOES L, HOUAREAU C, ALTMANN D, et al. Evaluation of the German surveillance system for hepatitis B regarding timeliness, data quality, and simplicity, from 2005 to 2014[J]. Public Health,2020,180:141 − 148. DOI: 10.1016/j.puhe.2019.11.012

    [7]

    PEZOULAS V C, KOUROU K D, KALATZIS F, et al. Medical data quality assessment: On the development of an automated framework for medical data curation[J]. Computers in Biology and Medicine,2019,107:270 − 283. DOI: 10.1016/j.compbiomed.2019.03.001

    [8]

    VANBRABANT L, MARTIN N, RAMAEKERS K, et al. Quality of input data in emergency department simulations: Framework and assessment techniques[J]. Simulation Modelling Practice and Theory,2019,91:83 − 101. DOI: 10.1016/j.simpat.2018.12.002

    [9]

    ÁLVAREZ SÁNCHEZ R, BERISTAIN IRAOLA A, EPELDE UNANUE G, et al. TAQIH, a tool for tabular data quality assessment and improvement in the context of health data[J]. Computer Methods and Programs in Biomedicine,2019,181:104-824. DOI: 10.1016/j.cmpb.2018.12.029

    [10] 张晓冉, 袁满. 通用数据质量评估模型及本体实现[J]. 计算机研究与发展,2018,55(6):1333 − 1344. [ZHANG Xiaoran, YUAN Man. General data quality assessment model and ontological implementation[J]. Journal of Computer Research and Development,2018,55(6):1333 − 1344. (in Chinese with English abstract) DOI: 10.7544/issn1000-1239.2018.20160764
    [11]

    RIESENER M, DÖLLE C, SCHUH G, et al. Framework for defining information quality based on data attributes within the digital shadow using LDA[J]. Procedia CIRP,2019,83:304 − 310. DOI: 10.1016/j.procir.2019.03.131

    [12]

    HARYADI A F. Requirements on and antecedents of big data quality: An empirical examination to improve big data quality in financialservice organizations[D]. Delft: Delft University of Technology, 2016: 13.

    [13]

    AGGARWAL A. Data quality evaluation framework to assess the dimensions of 3V’s of big data[J]. International Journal of Emerging Technology and Advanced Engineering,2017,7(10):503 − 506.

    [14]

    HARYADI A F, HULSTIJN J, WAHYUDI A, et al. Antecedents of big data quality: an empirical examination in financial service organizations[C]//2016 IEEE International Conference on Big Data (Big Data). December 5-8, 2016, Washington, DC, USA. IEEE, 2016: 116-121.

    [15]

    GLOWALLA P, BALAZY P, BASTEN D, et al. Process-driven data quality management: an application of the combined conceptual life cycle model[C]//2014 47th Hawaii International Conference on System Sciences. January 6-9, 2014, Waikoloa, HI, USA. IEEE, 2014: 4700-4709.

    [16]

    CLARKE. The OECD guidelines[EB/OL]. 2017-4-4[2021-09-04]. http://www.rogerclarke.com/DV/PaperOECD.html.

    [17] 查先进, 陈明红. 信息资源质量评估研究[J]. 中国图书馆学报,2010,36(2):46 − 55. [ZHA Xianjin, CHEN Minghong. Research on quality assessment of information resources[J]. Journal of Library Science in China,2010,36(2):46 − 55. (in Chinese with English abstract)
    [18]

    BATINI C, RULA A, SCANNAPIECO M, et al. From data quality to big data quality[J]. Journal of Database Management,2015,26(1):60 − 82. DOI: 10.4018/JDM.2015010103

    [19]

    TOIVONEN M. Big data quality challenges in the context of business analytics[D]. Helsinki: University of Helsinki, 2015: 47-48.

    [20] 张绍华, 潘蓉, 宗宇伟. 大数据治理与服务[M]. 上海: 上海科学技术出版社, 2016: 120.

    ZHANG Shaohua, PAN Rong, ZONG Yuwei. Big data governance and services[M]. Shanghai. Shanghai Science and Technology Press. 2016: 120. (in Chinese)

    [21] 丁可. 金融扶贫绩效评价体系构建与案例应用研究[D]. 河南: 河南工业大学, 2020.

    DING Ke. Research on Construction of Financial Poverty Alleviation Performance Evaluation System and Case Application[D]. Henan: Henan University of Technology, 2020. (in Chinese with English abstract)

    [22] 魏劲如. 基于神经网络和模糊推理的VGI数据质量评价研究[D]. 西安: 长安大学, 2019.

    WEI Jinru. Research on VGI data quality assessment based on neural network and fuzzy inference[D]. Xi'an: Changan University, 2019. (in Chinese with English abstract)

    [23] “一带一路”眼科人工智能研发国际联盟, “2019医学人工智能数据库管理规范方案修订研讨会”专家组. 人工智能眼病图像数据库入库数据质量评价指南[J]. 中华实验眼科杂志,2019(12):937 − 941. ["One belt, one road" International Alliance for ophthalmic artificial intelligence research and development, Expert group of 2019 medical artificial intelligence database management specification revision Seminar. Guidelines for image quality assessment of artificial intelligence ophthalmic disease imaging database[J]. Chinese Journal of Experimental Ophthalmology,2019(12):937 − 941. (in Chinese with English abstract)
    [24] 陶凯, 杨文, 杜中, 等. 轨道检测数据集成存储与数据质量评价[J]. 铁道建筑,2019,59(9):116 − 120. [TAO Kai, YANG Wen, DU Zhong, et al. Integrated storage for track inspection data and data quality evaluation[J]. Railway Engineering,2019,59(9):116 − 120. (in Chinese with English abstract) DOI: 10.3969/j.issn.1003-1995.2019.09.28
    [25]

    IMMONEN A, PÄÄKKÖNEN P, OVASKA E. Evaluating the quality of social media data in big data architecture[J]. IEEE Access,2015(3):2028 − 2043. DOI: 10.1109/ACCESS.2015.2490723

    [26] 刘博浩. 我国开放政府数据质量评价研究[D]. 郑州: 郑州大学, 2019.

    LIU Bohao. Research on the evaluation of open government data quality in China[D]. Zhengzhou: Zhengzhou University, 2019. (in Chinese with English abstract)

  • 期刊类型引用(8)

    1. 李晓玮,刘翠娜. 基于AHP法山区公路边坡稳定性评价及危害性分析. 河北地质大学学报. 2024(02): 61-65+134 . 百度学术
    2. 林毅,马强,张凯,李岚,李嘉宁,陆井龙,肇毓. 有效降雨量在辽宁省内公路水毁风险评价中的应用. 中国地质灾害与防治学报. 2024(04): 85-92 . 本站查看
    3. 谷梦瑶,徐新胜,何雨辰. 面向变电站机器人巡检的加权嵌套决策树数据质量协同评价方法. 智慧电力. 2024(09): 65-71 . 百度学术
    4. 陈红旗,方志伟,祁小博. 地质灾害危害程度分级标准优化研究. 灾害学. 2023(04): 18-22 . 百度学术
    5. 胡志瑞,范宏涛,马欣,黄玮,赵大江,李鹏,李小琼. 高分辨率格网模型在地质灾害风险普查数据坐标转换中的应用研究. 宁夏大学学报(自然科学版). 2023(03): 275-281 . 百度学术
    6. 任静. 流域超标准洪涝灾害数据库的构建研究. 农业灾害研究. 2023(11): 302-304 . 百度学术
    7. 惠春,宁立新,程昌秀. 中国东南沿海城市海啸灾害风险评估. 自然灾害学报. 2022(01): 49-59 . 百度学术
    8. 杨志全,杨溢,朱颖彦. “地质灾害防治”课程在人才培养中的目标定位及面临的主要问题与解决对策探讨. 大学. 2020(33): 53-54 . 百度学术

    其他类型引用(6)

图(2)  /  表(4)
计量
  • 文章访问数:  220
  • HTML全文浏览量:  142
  • PDF下载量:  408
  • 被引次数: 14
出版历程
  • 收稿日期:  2020-09-03
  • 修回日期:  2020-10-15
  • 网络出版日期:  2021-08-17
  • 刊出日期:  2021-08-24

目录

/

返回文章
返回