基于CatBoost-SHAP模型的滑坡易发性建模及可解释性

曾韬睿; 王林峰; 张俞; 程平; 吴帆

doi:10.16031/j.cnki.issn.1003-8035.202309035

基于CatBoost-SHAP模型的滑坡易发性建模及可解释性

曾韬睿^{1, 2,},
王林峰^{1, 2, ,},
张俞^{3, 4},
程平^{1, 2},
吴帆⁵

1.
重庆交通大学山区公路水运交通地质减灾重庆市高校市级重点实验室，重庆　400074
2.
重庆交通大学河海学院，重庆　400074
3.
浙江省地矿科技有限公司，浙江杭州　310007
4.
温州工程勘察院有限公司，浙江温州　325006
5.
山地灾害与地表过程重点实验室/中国科学院山地灾害与环境研究所，四川成都　610299

基金项目: 国家自然科学基金联合基金项目（U22A20600）；重庆市研究生导师团队建设项目（JDDSTD2022009）；重庆人才计划创新与创业示范团队（CQYc-201903204）；国家自然科学基金项目（51708068）

详细信息

作者简介:
曾韬睿（1995—），男，重庆，博士研究生，主要从事滑坡灾害风险评价与管理研究。E-mail：zengtaorui@cug.edu.cn

通讯作者:
王林峰（1983—），男，教授，博士，研究方向为地质灾害减灾理论与技术。E-mail：wanglinfeng@cqjtu.edu.cn

中图分类号: P642.22
计量
- 文章访问数: 787
- HTML全文浏览量: 32
- PDF下载量: 164
出版历程
- 收稿日期: 2023-09-25
- 修回日期: 2024-01-03
- 网络出版日期: 2024-01-30
- 刊出日期: 2024-01-31

Landslide susceptibility modeling and interpretability based on CatBoost-SHAP model

Taorui ZENG^{1, 2,},
Linfeng WANG^{1, 2, ,},
Yu ZHANG^{3, 4},
Ping CHENG^{1, 2},
Fan WU⁵

1.
Key Laboratories of Mountainous Area Highway Transportation and Transportation Geological Disaster Reduction in University of Chongqing, Chongqing Jiaotong University, Chongqing　400074, China
2.
School of Hehai, Chongqing Jiaotong University, Chongqing　400074, China
3.
Zhejiang Geology and Mineral Technology Co. Ltd., Hangzhou, Zhejiang　310007, China
4.
Wenzhou Engineering Survey Institute Co. Ltd., Wenzhou, Zhejiang　325006, China
5.
Key Laboratory of Mountain Hazards and Earth Surface Process, Institute of Mountain Hazards and Environment, Chinese Academy of Sciences, Chengdu, Sichuan　610299, China

HTML全文

摘要

摘要:
文章致力于深入探索滑坡易发性建模中集成学习模型的不确定性和可解释性。以浙江省东部沿海山区为研究对象，利用谷歌历史影像与Sentinel-2A影像，记录了2016年超级台风“鲇鱼”触发的552起浅层滑坡事件。研究首先对连续型因子进行了不分级、等间距法和自然断点法的工况设计，进一步划分为4，6，8，12，16，20级。随后，引入了类别增强提升树模型（CatBoost）以评估不同工况下的滑坡易发性值，再结合受试者曲线与沙普利加性解释法分析，对建模过程中的不确定性和可解释性进行了深入研究，目的在于确定最优建模策略。结果表明：（1）在CatBoost模型计算中，河流距离成为最关键的影响因子，其次是与地质条件、人类活动相关的因子；（2）不分级工况下，模型能够获得最高的AUC值，达到0.866；（3）相较于等间距法，自然断点法的划分策略展现出更佳的泛化能力，且模型预测性能随着分级数量的增加而增加；（4）沙普利加性解释法模型揭示了主要影响因子道路距离、河流距离、DEM和坡向对台风诱发滑坡的控制机制。研究成果能够加深对滑坡易发性的理解，提高滑坡预测的准确性和可靠性，为相关地区的防灾减灾工作提供科学依据。
- 滑坡；易发性建模 /
- 可解释性 /
- CatBoost模型 /
- 沙普利加性解释法模型 /
- 台风诱发滑坡
Abstract:
This study is dedicated to delving deeply into the uncertainty and interpretability of ensemble learning models in landslide susceptibility modeling. Focusing on the eastern coastal mountainous region of Zhejiang Province as the study area, this research utilizes historical Google imagery and Sentinel-2A imagery to document 552 shallow landslide events triggered by the super typhoon "Megi" in 2016. Initially, the study designs scenarios for continuous factors using non-grading, equal interval method, and natural breaks method, subsequently subdividing them into 4, 6, 8, 12, 16, 20 levels. Thereafter, the Category Boosting Model (CatBoost) is introduced to assess landslide susceptibility values under different scenarios. Coupled with the analysis of ROC (receiver operating characteristic) curves and SHAP (SHapley Additive exPlanation), in-depth investigation into uncertainty and interpretability during the modeling process is conducted, with the aim of determining the optimal modeling strategy. The results indicate that: (1) In the computations of the CatBoost model, aspect emerges as the most critical influencing factor, followed by factors related to water and geological conditions; (2) Under the non-grading scenario, the model achieves the highest AUC value, reaching 0.866; (3) Compared to the equal interval method, the natural breaks method demonstrates superior generalization capability, and the model’s predictive performance imrpoves with an increase in the number of classifications; (4) The SHAP model reveals the controlling mechanisms of the principal influencing factors (aspect, lithology, elevation, and road distance) on typhoon-induced landslides. The findings of this research can deepen our understanding of landslide susceptibility, enhance the accuracy and reliability of landslide predictions, and provide a scientific basis for disaster prevention and mitigation efforts in the related regions.
- landslide; susceptibility modeling /
- interpretability /
- CatBoost model /
- shapley additive explanation model /
- typhoon-induced landslides

HTML全文

0. 引言

随着全球气候的变化，由人类活动导致的极端天气事件愈显频发。尤其是百年一遇的台风渐成常态，频触山体滑坡，对全球特别是中国东南沿海地区造成重大影响^{[1 − 2]}。受地理、气候和地质环境的影响，中国东南沿海地区已经成为台风的高风险区域。近些年，如“拉娜妮姆”“苏迪洛”“鲇鱼”“利奇马”等台风席卷该地区，触发了大量滑坡灾害，造成了人员伤亡和巨大的经济损失^[3]。浙江省约90%的突发性地质灾害由降雨引发^[4]。因此，开展滑坡易发性制图研究对于加强东南沿海灾害风险管理具有重大实际意义和紧迫性^{[5 − 9]}。

滑坡易发性评估考虑历史滑坡灾害与地质、地形、地貌、土壤性质及人类活动等多个影响因素的关系，以估算特定区域发生滑坡的概率^{[10 − 11]}。机器学习模型为这种评估提供了一个工具，它能从大量数据中学习并揭示影响滑坡发生的复杂非线性关系^{[12 − 13]}。常用的机器学习模型包括决策树、支持向量机、人工神经网络等^{[13 − 17]}。近年来，人工智能技术取得了显著的发展，先进的集成模型，为传统方法带来了革命性的改进。例如刘海知等^[18]采用了随机森林（bagging集成）和梯度提升树（boosting集成）构建了的山区中小流域滑坡易发区早期识别方法。曾韬睿等^[19]采用Stacking算法集成了随机森林和极端梯度提升树算法预测了三峡库区滑坡发生的空间位置。尽管这些模型在预测滑坡易发性方面表现出色，模型建模过程中的不确定性仍然是一个问题。黄发明等^[14]探究了影响因子的不同分级数量对模型性能的影响，得到随着分级数量增加，随机森林预测精度越高。分级处理可以简化数据复杂性，提高模型的稳定性和解释能力，并使数据的可视化更为直观。然而，过度的或盲目的分级处理可能导致模型损失原始数据的细节信息。同时，分级边界的选择可能受到主观因素的影响，从而对模型的预测性能产生不良效果。因此，如何在先进的集成模型中恰当地应用分级策略，已成为当前研究的关键焦点。

尽管集成学习模型在结果的优越性和准确性上表现出色，其却常被视为“黑盒子”，缺乏可解释性^[20]。为解决这一问题， Lundberg等^[21] 在2017年提出了沙普利加性解释法（shapley additive explanation，SHAP）模型，为模型的结构解读和结果解释带来了新的视角。部分学者已着手于滑坡易发性的可解释性研究，如陈丹璐等^[22]基于 LightGBM-SHAP 建立滑坡易发性评价模型。Dahal等^[23]使用SHAP模拟响应Gorkha地震（2015年4月25日）发生的山体滑坡，为模型的设计和解读提供了有价值的见解。尽管如此，SHAP方法在滑坡易感性研究中的应用仍处于起步阶段，深入探讨模型中存在的不确定性和增强其解释性显得至关重要^{[10, 14, 24 − 25]}。

目前，迫切需要研究先进模型在滑坡易发性建模及其预测结果的可解释性方面的应用。因此，本文利用了谷歌及Sentinel-2A影像，获取了超级台风“鲇鱼”导致的浙江省东部沿海山区的滑坡事件清单。CatBoost模型被用来构建该地区的滑坡易发性评估，并深入探讨了多种连续性因子的分级策略。另外，SHAP模型被用于定量分析这些分级策略对于滑坡发生在全局和局部的影响和贡献。期望这一研究能为滑坡潜在易发区的预测及机器学习模型的可解释性提供有价值的参考。

1. 研究区域及数据

1.1 研究区域

研究区位于浙江省东部海岸，见图1（a）。该地区处于温州—临海凹陷地带，主要地形为低山和中山，这些地貌主要是由于构造侵蚀作用形成的，见图1（b）。区域内丰富的火山岩、火山沉积岩和侵入岩构成了其独特的地质结构。整个研究区大约82.5%的面积是山地，陡峭的地形上广泛分布着大量松散残留土。过去十年里，该区域进行了众多的人工工程活动，如建筑、农田开发、山地工程和采矿，这些活动不可避免地降低了斜坡的稳定性。该区域属于亚热带海洋季风气候，年均降雨量为1884.7 mm，其中大约60%的降雨量集中在5—10月。

图 1 研究区概况图

Figure 1. Overview of the study area

下载: 全尺寸图片幻灯片

1.2 滑坡清单

2016年，该地区遭受了第17号超级台风“鲇鱼”的侵袭，该台风于9月27日在台湾登陆后，于9月29日消散。在台风影响下，9月27日20:00至9月28日20:00间，文成、平阳和泰顺的降雨量分别达到了388 mm、342 mm和324 mm，创下了历史单日降雨量记录。根据中国气象局和中国地质环境监测所的记录，台风导致的降雨触发了多起滑坡事件，造成32人遇难，3人失踪，并对许多建筑和基础设施，如输电线塔和道路，造成了严重损害。在强降雨事件之后，多时相高分辨率光学卫星遥感技术已成为获取滑坡清单的关键工具。本研究利用谷歌地球平台上的高分辨率卫星图像进行了滑坡的详细视觉解释，以确保数据的准确性和完整性。所有使用的遥感图像都基于谷歌地球平台，覆盖了整个研究区域。本文主要关注的图像日期是2016年2月7日（降雨事件前）和2016年12月21日（降雨事件后），分别展示在图1（c）和图1（d）中。考虑到在降雨事件前后的图像之间存在较长时间间隔，引入了Sentinel-2A卫星的影像（获取日期为2016-08-22和2017-04-29）进行交叉验证，增强了研究结果的可靠性。Sentinel-2A卫星提供了10 m的高空间分辨率和高复查周期，为灾后分析和救援工作提供了宝贵支持。所有获取的图像均经过辐射校正、大气校正和坐标系统转换处理，确保数据质量。图1（e）和图1（f）展示了事件发生前后的Sentinel-2A卫星图像。滑坡的识别是通过目视判读完成的，并在ArcGIS10.6平台上绘制成多边形形式。由于研究区域内植被覆盖率高，卫星图像成为了描绘山体滑坡的优选工具。通过这种方法，成功在609 km²的区域内绘制了552起滑坡事件。通过对遥感图像的详细分析，发现滑坡主要以平面滑动为主，同时也观察到了少量的崩塌和泥石流事件。这些滑坡覆盖总面积达1.53 km²，其中最大的滑坡面积约为63862 m²，最小的滑坡面积为150 m²，平均滑坡面积约为2688 m²，标准差为5011 m²。

1.3 影响因子

影响因子主要包括与滑坡易发性密切相关的各类地理、地质和气候要素。这类因子的获取，一般是借助于遥感影像、地形分析以及其他地理信息系统（GIS）工具实现的。参考降雨滑坡文献调研^{[4, 11, 26]}及数据可用性，本文选取的影响因子包括数字高程模型（digital elevation model, DEM）、坡度、平面曲率、剖面曲率、地形湿润指数（topographic wetness index，TWI）、地形位置指数（topographic position index，TPI）、距离道路的距离和距离河流的距离和土地利用（图2）。所使用的DEM数据来源于ALOS PALSAR DEM，原始分辨率为12.5 m，随后通过双线性插值算法被重采样至30 m分辨率。在ArcGIS 10.6软件平台上，本文利用这一DEM数据计算了各地区的坡度、坡向、平面曲率以及剖面曲率。而TWI则是一种能够反映地区地形对径流流向和积累影响的物理量指标，其具体的计算方法如下所示：

图 2 影响因子

Figure 2. Influencing factors

下载: 全尺寸图片幻灯片

$$ TWI = \ln \left[ {\frac{{S CA}}{{{{\mathrm{tan}}} \alpha }}} \right] $$

(1)

式中：SCA——单位面积的流域流量，通过ArcGIS平台上的水文分析进行计算；

α——坡度/（°）。

TPI是一个描述地形位置或地形曲率的指标，计算公式如下：

$$ TPI = {T_0} - \frac{{\displaystyle\sum^n_{i=1} {{T_n}} }}{n} $$

(2)

式中：T₀——待评价单元的高程；

T_n——网格栅格的高程；

n——评价中计算的指定邻域周围单元的总数。

岩性数据是从中国地质调查局发布的1∶20万地质图上收集的。土壤类型数据来源于由中科院南京土壤研究所矢量化的栅格数据。道路和水系数据是从Open Street Map（https://www.openstreetmap.org/）中下载，并通过ArcGIS平台中的欧式距离计算得到整个研究区的数据。土地利用数据由中国科学院资源与环境数据中心下载（http://www.resdc.cn）。为了实现数据一致性，所有影响因子均被重新采样为具有30 m空间分辨率的像元数据，以满足分析的精确性和一致性要求。

2. 研究方法

本文构建了不同分级策略的滑坡易发性建模及可解释性研究，具体流程如图3所示。首先，利用谷歌历史影像和Sentinel-2A影像，本文获取了2016年超级台风“鲇鱼”事件所诱发的滑坡清单。其次，选取了12个影响因子，并对其中的连续型因子进行了3种不同的策略：不分级、等间距法、自然断点法，分别将其划分为4，6， 8，12，16，20等级。接下来，利用CatBoost模型，对不同分级策略下的空间易发性结果进行了对比分析。通过受试者曲线（receiver operation characteristic curves，ROC）和SHAP模型，不仅分析了模型的不确定性，还探讨了各因子的可解释性，最终确定了最优的滑坡易发性模型。

图 3 不同分级策略的滑坡易发性建模及可解释性流程图

Figure 3. Flowchart of landslide susceptibility modeling and interpretability under different grading strategies

下载: 全尺寸图片幻灯片

2.1 CatBoost模型

Boosting是一种旨在通过集成多个弱模型以构建一个强有力模型的学习策略。该方法逐步训练各个模型，对每次训练中错误分类的样本加大权重，以此促使后续模型更加关注前一模型未能正确分类的样本。由Yandex于2018年开发的CatBoost是一种基于Boosting策略的机器学习算法^[27]。与其他 Boosting 算法相似，CatBoost 致力于最小化给定的损失函数L(y, f(x))，其中y为真实标签，f(x)为模型的预测值。CatBoost在更新每一步时，会计算损失函数相对于预测的一阶和二阶导数，即梯度g和Hessian矩阵 h。对于样本i，这2个量分别由以下公式求取：

$$ {g_i} = \frac{{\partial L\left( {{y_i},f\left( {{x_i}} \right)} \right)}}{{\partial f\left( {{x_i}} \right)}} $$

(3)

$$ {h_i} = \frac{{{\partial ^2}L\left( {{y_i},f\left( {{x_i}} \right)} \right)}}{{\partial f{{\left( {{x_i}} \right)}^2}}} $$

(4)

由计算出的梯度和Hessian值，可以得到叶子节点的最优权重ω：

$$ \omega = - \frac{{\displaystyle\sum^n_{i=1} {{g_i}} }}{{\displaystyle\sum^n_{i=1} {{h_i} + \lambda } }} $$

(5)

式中：λ——正则化参数。

与其他Boosting算法不同，CatBoost 使用一种特殊的编码方法（基于目标的统计数据）直接处理分类特征。对于目标变量Y，分类变量X的每一个级别k的目标编码值计算如下：

$$ Encode(k) = \frac{{\displaystyle\sum_{i:{c_i} = k} {{y_i}} }}{{count（{c_i} = k）}} $$

(6)

式中：c_i——观测值i的分别特征的级别；

count(c_i=k)——级别k的出现次数。

为避免数据泄漏，对于每个观测值，CatBoost 仅使用之前的观测值来计算编码，从而确保编码时不使用当前观测的信息。这是通过累积计数和累积目标总和来实现的，并且通常与时间排序的数据结合使用。具体公式如下：

$$ CatBoostEncode(k,i) = \frac{{\displaystyle\sum_{j < i,{c_j} = k} {{y_i}} }}{{count({c_j} = k,j < i)}} $$

(7)

式中：j<i——只考虑观测值i之前的数据。

这种策略使 CatBoost 在处理高基数分类变量时更加健壮，并提供了额外的泛化能力。因此，本文采用CatBoost模型预测研究区浅层滑坡的易发性值。

2.2 SHAP模型

随着机器学习模型变得越来越复杂，理解模型的内部运作与决策流程成了一项巨大挑战。学术界普遍认为，仅凭模型展现出的高预测准确性还不足以确保其可信度。提高“黑箱”模型的可解释性，能够清晰理解模型的预测依据，成为提升机器学习算法在各应用领域的泛化能力与可信度的关键。2017年，Lundberg等^[21]提出了SHAP模型，这一模型借鉴了博弈论中Shapley值的核心思想，旨在解释各类机器学习模型的预测行为。对于给定的模型f和输入样本x，特征i的SHAP值：

$$ {\phi _i}\left( {f,x} \right) = \sum\limits_{S \subseteq N\backslash \left\{ i \right\}} {\frac{{\left| S \right|!\left( {\left| N \right| - \left| S \right| - 1} \right)!}}{{\left| N \right|!}}}\cdot \left( {{f_x}\left( {S \cup \left\{ i \right\}} \right) - {f_x}\left( S \right)} \right) $$

(8)

式中：N——特征集合；

S——不包含特征i的任何子集；

|S|——集合S的大小；

|N|——所有特征的总数；

f_x(S∪{i})、f_x(S)——包含和不包含特征i的模型预测结果。

SHAP值提供了一种量化的手段，以测定每个特征在机器学习模型预测中的贡献程度。通过上述公式的计算，确保了每个特征的贡献都被公平地考量。基于这些贡献度，能够进行特征级的解释，即分析每个特征是如何影响模型预测结果的，从而进一步增强了模型的可解释性。

2.3 因子分级策略及精度评价

在进行滑坡易发性建模的机器学习研究中，采用分级处理连续型因子被视为一种常规策略。此策略有着不容忽视的优点：能够降低数据的复杂性，加强模型的稳健性与可解释性，为我们呈现更为直观的数据可视化，同时对异常值展现出良好的适应性，从而在一定程度上提高了模型的泛化能力和实际操作决策的直观性。尽管如此，分级过程中可能出现细节信息的遗失，且确定分级边界常常带有主观成分，这可能导致模型性能出现不稳定性。因此，科研人员有必要探讨不同模型中连续型因子的多种分级策略，以追求最优的预测效果。在本次研究中，我们考察了无分级、等间距法以及自然断点法，同时也对其进行了4，6， 8，12，16，20等不同级别的划分。

滑坡易发性预测是一种二元分类，将输入数据分为滑坡和非滑坡两类。滑坡栅格（30 m×30 m）赋值为“1”，非滑坡像素赋值为“0”。研究区有滑坡栅格5066个。在ArcGIS10.6软件中，从非滑坡区域随机生成了5066个非滑坡像素。样本数据集由滑坡数据和非滑坡数据组成，所有数据都提取了相应的环境因子，并且随机分为70%训练数据和30%验证数据。ROC曲线在机器学习和统计学领域得到了广泛应用，主要用于评估分类模型的性能^[28]。AUC（area under the curve）则代表了ROC曲线下的面积，其值越接近1，意味着分类器的性能越出色。AUC值在滑坡易发性评估中具有广泛应用^[29]，因为它能提供一个与分类阈值无关的综合性能评价标准，特别是在处理不平衡数据时，AUC展现出了显著的鲁棒性。

3. 结果

3.1 滑坡易发性模型评价

3.1.1 影响因子共线性及重要性评价

在进行滑坡易发性评价时，首要的一步是检验所选影响因子之间是否存在共线性^[30]。（variance inflation factor，VIF）是一种常用的统计量，用以评估预测模型中可能出现的多重共线性。通常情况下，当VIF值超过5时，即可判断因子间存在较高程度的共线性。如图4所示，所有选定影响因子的VIF值均未超过5，说明模型中未出现明显的多重共线性问题。其中，地形位置指数（TPI）的VIF值相对较高，为2.74，但仍在可接受的范围内，无需进行额外处理或调整。特征的重要性是通过累积CatBoost模型中每个特征在分裂点的改善度来计算的。详细来说，每当模型树的一个节点使用某特征进行分裂时，系统都会计算此次分裂对模型性能（一般以损失函数为准）的改善程度。这些改善度值会被累积，从而得出每个特征的总体重要性。设计工况中各影响因子的平均重要性如图4所示，其中河流距离被证实为最关键的影响因子，其占比高达20.17%。其次是DEM、岩性和道路距离，这些因子也显示出了相对较高的影响力，分别占比11%～12%。同时，坡向和土壤类型也是不可或缺的因子，它们各自占据了9%～10%的影响力范围。

图 4 因子共线性及平均重要性分析

Figure 4. Analysis of factor multicollinearity and average importance of influencing factors

下载: 全尺寸图片幻灯片

图5展示了不同工况下影响因子的重要性。当因子按更多区间进行分级（例如16, 20级）时，DEM、河流距离和道路距离的重要性则会相对升高。这可能归因于这些因子在多个区间的变化更为有效地捕捉到了目标变量的复杂性。等间距法分级更倾向于提高离散型因子（如坡向、土壤类型和岩性）的重要性，同时降低了连续型因子的重要性。相较而言，自然断点法分级所展现出的因子重要性分布更接近于不进行分级的情况，呈现出更全面的因子影响分布。这一发现表明，自然断点法能更准确地揭示因子的自然分布以及它们对目标变量的影响，从而更有助于捕捉模型的多维性和复杂性。

图 5 因子在不同数据集中的重要性，EI-Equal Interval等间距，NB-Natural Breaks自然断点

Figure 5. Importance of influencing factors in different datasets,EI-Equal Interval,NB-Natural Breaks

下载: 全尺寸图片幻灯片

3.1.2 不同分级条件下精度评价

图6展示了在不同数据集下，采用CatBoost模型进行十折交叉验证所计算出的AUC值。从图7（a）中可以明显看出，不对连续型因子进行分级时，能够实现最高的AUC值（0.866）。而将连续因子划分为4或6个等级时，CatBoost模型的性能会有所下降。值得注意的是，随着分级数目的增加，AUC的平均值呈现上升趋势。以等间距法划分数据集为例，AUC平均值从4级的0.824逐渐上升至20级的0.862，见图7（b）（c）；而自然断点法的AUC平均值则从4级的0.836提升到20级的0.861，见图7（d）。尽管自然断点法在较低级别时可能表现出更高的AUC值，但随着级别的增加，两种方法的性能趋于相近，且等间距法在高级别下展现出较为稳定的性能。此外，我们的分级测试工况结果的变化规律与黄发明^[14]和Xing等^[31]的研究结果类似，都显示出在20分级时预测精度达到最高。在实际应用中为实现最佳的效率和精度之间的平衡，可以采用12级或16级分级。CatBoost模型作为一种高度自适应的决策树集成模型，具有对连续型因子进行有效处理的能力。因此，不对连续型因子进行分级处理能够获得最优的预测精度。此外，避免分级处理还能最大化地保留原始数据中的信息，从而降低过拟合和欠拟合的风险。简单的分级策略可能导致信息损失，进而影响模型的预测能力。然而，随着分级数目的增加，模型逐渐能够更精确地逼近原始的连续数据，从而提高预测精度。未来可以尝试进一步探索滑坡和影响因子的联接方法，例如频率比、信息量和熵指数等^[32]。

图 6 不同分级条件下十折交叉验证的AUC值

Figure 6. AUC values for ten-fold cross-validation under various grading conditions

下载: 全尺寸图片幻灯片

图 7 不同数据集ROC曲线

注：fold:为交叉验证的数据集。

Figure 7. ROC curves for different datasets

下载: 全尺寸图片幻灯片

3.1.3 SHAP影响因子解译

为深入了解不同情况下的预测效果，本文对特定的代表性数据集进行了详细分析，包括不分级情况、4级等间距、20级等间距和20级自然断点。经过十折交叉验证后，各数据集通过CatBoost模型进行拟合，测试集的SHAP值被计算出，从而得到每个特征的平均SHAP值。正如图8所展示的，道路距离和河流距离展现为最重要的影响因子，且其数据分布具有一致性。在不分级和20级自然断点法中，DEM的重要性得到了增强，且无论是高还是低的高程，都对滑坡的发生表现出抑制作用。然而，与此相反，在4级和20级等间距分级的情况下，低高程似乎会促使滑坡的发生，这显然与实际情况相悖。此外，4级等间距分级方式下，对坡向的应用表现更佳，弱化了道路距离和河流距离的作用，显然是不符合实际的。最终，对于道路距离这一特征，不分级的数据集展现出了更优的预测能力—即滑坡发生的可能性会随着与道路距离的减小而增加。总之，能够更好地非线性拟合滑坡影像因子的模型，将有可能获得更加精准的预测结果。

图 8 影响因子蜂群图

Figure 8. Bees swarm plot of influencing factors

下载: 全尺寸图片幻灯片

图9深入分析了道路距离、河流距离、DEM和坡向及这几个变量在不分级工况下对模型预测的特征值贡献。图9（a）显示了道路距离对滑坡发生概率的影响：道路的存在及其相关的活动，比如土地开发、排水结构改变、地下水流动的调整以及边坡切割和侵蚀作用，都可能提升滑坡的潜在风险。此外，随着道路的距离缩减，该因子对模型预测的正向贡献显著增强。河流距离的SHAP值随距离的增加而下降，反映了河流距离与滑坡风险间的负相关性，见图9（b）。在DEM方面，200～600 m的高程范围内的数据表现出了积极的贡献，见图9（c）。而在坡向方面，见图9（d），从东向西南的方位角度出现的正面影响揭示了与实际气候事件的相关性，如台风“鲇鱼”带来的暴雨主要从南方袭来，这与观测到的模型响应一致。

图 9 重要影响因子散点图

Figure 9. Scatter plots of key influencing factors

下载: 全尺寸图片幻灯片

3.2 滑坡易发性制图

最终采用不分区工况计算得到的滑坡易发性图，并将易发性值分为4个等级^[19]：极低易发性（0≤P(S)<5%），低易发性（5%≤P(S)<35%），中易发性（35%≤P(S)<75%）以及高易发性（75%≤P(S)≤1）。如图10所示，该易发性图与历史滑坡记录高度吻合，成功预测了研究区内的潜在高风险区域。运用CatBoost进行滑坡易发性建模时，建议采取不对连续因子进行分级的策略，并借助SHAP模型来关注那些对滑坡发生有显著影响的因子及其取值范围。特别是河流距离和道路距离，作为显著影响因素，他们在模型中的贡献值反映了这些地理特征与滑坡发生概率的直接关系。研究区东南部由于受到沿海经济带的影响，以及该地区常遭受来自东南方向的台风侵袭，被识别为滑坡高发区。该地区的地形特征——以高山和陡坡为主——联同表层基岩的性质，如全风化至强风化的砂砾岩、闪长岩和火山碎屑岩，易在强降雨的驱动下发生破坏，这些均为滑坡提供了触发条件。此外，由于地区的经济活动和基础设施建设频繁，沿道路建设和河流调整活动可能进一步增加了该地区的滑坡风险。为减轻未来由台风和暴雨引发的浅层滑坡风险，强烈建议相关部门和管理机构对这些高风险区域进行及时的现场检查，并根据需要实施风险减轻措施。这些措施包括但不限于增强基础设施的防灾能力、实施坡面稳定工程、加强对高风险区域的监测和预警，从而有效保护人类生命财产安全，减少滑坡带来的风险^{[33 − 36]}。

图 10 研究区滑坡易发性图

Figure 10. Landslides susceptibility map of the study area

下载: 全尺寸图片幻灯片

本研究的案例分析主要集中在浙江省东部沿海山区，所以模型和结论的适用性可能主要局限于地理和气候条件相似的区域。模型基于特定地区数据训练而成，在应用于其他地区时需进行调整，确保其适应性和准确性。为提升模型性能和可靠性，提出以下改进方向：增强遥感数据质量和完善滑坡事件记录可提升模型预测准确度；应用更具解释性的模型或方法以深入了解滑坡易发性背后的驱动机制；在新地区应用模型时，进行地区特定分析和调整，确保模型的精确性和适用性；尝试融合不同模型和方法，以增强滑坡易发性评估的准确性和鲁棒性。

4. 结论

为了预测浅层滑坡发生的空间概率，本研究选取了浙江省东部沿海的山区作为研究对象。结合谷歌地图与Sentinel-2A卫星影像，成功地交叉验证了2016年超级台风“鲇鱼”引发的552起浅层滑坡事件。利用基于Boosting算法的CatBoost模型，进行了滑坡易发性的评估。为了进一步探讨连续型因子分级对预测精度的影响，采用了SHAP模型进行因子重要性的详细分析。主要研究成果如下：

（1）遥感数据显示，滑坡主要类型为平面滑动，同时伴有少量崩塌和泥石流，覆盖总面积为1.53 km²，平均滑坡面积2688 m²，最大滑坡面积63862 m²。

（2）研究区受DEM、坡度、坡向、平面曲率、剖面曲率、TWI、TPI、岩性、土壤类型、距离道路的距离、距离河流的距离和土地利用12项因子的影响。VIF测试了因子之间不存在共线性。通过CatBoost模型分析，距离河流的距离是最为关键的影响因子。其次，与地质条件和人类活动相关的因子也显示出较高的影响力。

（3）使用CatBoost模型时，不对连续型因子进行分级得到的AUC值为0.866，是预测效果最好的。简单分级（如4或6级）降低了模型性能。但随着分级数的增加到20级，AUC值有所提高。自然断点法与等间距法在高分级时性能相近。CatBoost对连续型因子处理效果佳，不分级能保留更多信息，减少过拟合风险，而简单分级可能导致信息损失。

（4）SHAP模型分析的典型数据集结果显示接近道路和河流的区域滑坡风险增加。高程在20~600 m区间的数据指示了较高的风险，而特定坡向的分析则与区域性气候事件相符，暴露了特定方位对滑坡易发性的潜在影响。

图 1 研究区概况图

Figure 1. Overview of the study area

下载: 全尺寸图片幻灯片

图 2 影响因子

Figure 2. Influencing factors

下载: 全尺寸图片幻灯片

图 3 不同分级策略的滑坡易发性建模及可解释性流程图

Figure 3. Flowchart of landslide susceptibility modeling and interpretability under different grading strategies

下载: 全尺寸图片幻灯片

图 4 因子共线性及平均重要性分析

Figure 4. Analysis of factor multicollinearity and average importance of influencing factors

下载: 全尺寸图片幻灯片

图 5 因子在不同数据集中的重要性，EI-Equal Interval等间距，NB-Natural Breaks自然断点

Figure 5. Importance of influencing factors in different datasets,EI-Equal Interval,NB-Natural Breaks

下载: 全尺寸图片幻灯片

图 6 不同分级条件下十折交叉验证的AUC值

Figure 6. AUC values for ten-fold cross-validation under various grading conditions

下载: 全尺寸图片幻灯片

图 7 不同数据集ROC曲线

注：fold:为交叉验证的数据集。

Figure 7. ROC curves for different datasets

下载: 全尺寸图片幻灯片

图 8 影响因子蜂群图

Figure 8. Bees swarm plot of influencing factors

下载: 全尺寸图片幻灯片

图 9 重要影响因子散点图

Figure 9. Scatter plots of key influencing factors

下载: 全尺寸图片幻灯片

图 10 研究区滑坡易发性图

Figure 10. Landslides susceptibility map of the study area

下载: 全尺寸图片幻灯片

参考文献(36)

[1]	郭子正,何俊,黄达,等. 降雨诱发浅层滑坡危险性的快速评估模型及应用[J]. 岩石力学与工程学报,2023,42(5):1188 − 1201. [GUO Zizheng,HE Jun,HUANG Da,et al. Fast assessment model for rainfall-induced shallow landslide hazard and application[J]. Chinese Journal of Rock Mechanics and Engineering,2023,42(5):1188 − 1201. (in Chinese with English abstract)] GUO Zizheng, HE Jun, HUANG Da, et al. Fast assessment model for rainfall-induced shallow landslide hazard and application［J］. Chinese Journal of Rock Mechanics and Engineering, 2023, 42（5）: 1188 − 1201. （in Chinese with English abstract）
[2]	刘谢攀,殷坤龙,肖常贵,等. 基于I-D-R阈值模型的滑坡气象预警[J]. 地球科学,2022:1 − 15. [LIU Xiepan,YIN Kunlong,XIAO Changgui,et al. Meteorological early warning of landslide based on I-D-R threshold model[J]. Earth Science,2022:1 − 15. ( in Chinese with English abstract)] LIU Xiepan, YIN Kunlong, XIAO Changgui, et al. Meteorological early warning of landslide based on I-D-R threshold model［J］. Earth Science, 2022: 1 − 15. （ in Chinese with English abstract）
[3]	CUI Yulong,JIN Jiale,HUANG Qiangbing,et al. A data-driven model for spatial shallow landslide probability of occurrence due to a typhoon in Ningguo city,Anhui Province,China[J]. Forests,2022,13(5):732. DOI: 10.3390/f13050732
[4]	黄发明,陈佳武,范宣梅,等. 降雨型滑坡时间概率的逻辑回归拟合及连续概率滑坡危险性建模[J]. 地球科学,2022,47(12):4609 − 4628. [HUANG Faming,CHEN Jiawu,FAN Xuanmei,et al. Logistic regression fitting of rainfall-induced landslide occurrence probability and continuous landslide hazard prediction modelling[J]. Earth Science,2022,47(12):4609 − 4628. (in Chinese with English abstract)] HUANG Faming, CHEN Jiawu, FAN Xuanmei, et al. Logistic regression fitting of rainfall-induced landslide occurrence probability and continuous landslide hazard prediction modelling［J］. Earth Science, 2022, 47（12）: 4609 − 4628. （in Chinese with English abstract）
[5]	郭子正,殷坤龙,黄发明,等. 基于滑坡分类和加权频率比模型的滑坡易发性评价[J]. 岩石力学与工程学报,2019,38(2):287 − 300. [GUO Zizheng,YIN Kunlong,HUANG Faming,et al. Evaluation of landslide susceptibility based on landslide classification and weighted frequency ratio model[J]. Chinese Journal of Rock Mechanics and Engineering,2019,38(2):287 − 300. (in Chinese with English abstract)] GUO Zizheng, YIN Kunlong, HUANG Faming, et al. Evaluation of landslide susceptibility based on landslide classification and weighted frequency ratio model［J］. Chinese Journal of Rock Mechanics and Engineering, 2019, 38（2）: 287 − 300. （in Chinese with English abstract）
[6]	黄发明,李金凤,王俊宇,等. 考虑线状环境因子适宜性和不同机器学习模型的滑坡易发性预测建模规律[J]. 地质科技通报,2022,41(2):44 − 59. [HUANG Faming,LI Jinfeng,WANG Junyu,et al. Modelling rules of landslide susceptibility prediction considering the suitability of linear environmental factors and different machine learning models[J]. Bulletin of Geological Science and Technology,2022,41(2):44 − 59. (in Chinese with English abstract)] HUANG Faming, LI Jinfeng, WANG Junyu, et al. Modelling rules of landslide susceptibility prediction considering the suitability of linear environmental factors and different machine learning models［J］. Bulletin of Geological Science and Technology, 2022, 41（2）: 44 − 59. （in Chinese with English abstract）
[7]	黄发明,陈佳武,唐志鹏,等. 不同空间分辨率和训练测试集比例下的滑坡易发性预测不确定性[J]. 岩石力学与工程学报,2021,40(6):1155 − 1169. [HUANG Faming,CHEN Jiawu,TANG Zhipeng,et al. Uncertainties of landslide susceptibility prediction due to different spatial resolutions and different proportions of training and testing datasets[J]. Chinese Journal of Rock Mechanics and Engineering,2021,40(6):1155 − 1169. (in Chinese with English abstract)] HUANG Faming, CHEN Jiawu, TANG Zhipeng, et al. Uncertainties of landslide susceptibility prediction due to different spatial resolutions and different proportions of training and testing datasets［J］. Chinese Journal of Rock Mechanics and Engineering, 2021, 40（6）: 1155 − 1169. （in Chinese with English abstract）
[8]	曾韬睿,殷坤龙,桂蕾,等. 基于滑坡致灾强度预测的建筑物易损性定量评价[J]. 地球科学,2023,48(5):1807 − 1824. [ZENG Taorui,YIN Kunlong,GUI Lei,et al. Quantitative vulnerability analysis of buildings based on landslide intensity prediction[J]. Earth Science,2023,48(5):1807 − 1824. (in Chinese with English abstract)] ZENG Taorui, YIN Kunlong, GUI Lei, et al. Quantitative vulnerability analysis of buildings based on landslide intensity prediction［J］. Earth Science, 2023, 48（5）: 1807 − 1824. （in Chinese with English abstract）
[9]	杜国梁,杨志华,袁颖,等. 基于逻辑回归–信息量的川藏交通廊道滑坡易发性评价[J]. 水文地质工程地质,2021,48(5):102 − 111. [DU Guoliang,YANG Zhihua,YUAN Ying,et al. Landslide susceptibility mapping in the Sichuan-Tibet traffic corridor using logistic regression-information value method[J]. Hydrogeology & Engineering Geology,2021,48(5):102 − 111. (in Chinese with English abstract)] DU Guoliang, YANG Zhihua, YUAN Ying, et al. Landslide susceptibility mapping in the Sichuan-Tibet traffic corridor using logistic regression-information value method［J］. Hydrogeology & Engineering Geology, 2021, 48（5）: 102 − 111. （in Chinese with English abstract）
[10]	闫举生,谭建民. 基于不同因子分级法的滑坡易发性评价——以湖北远安县为例[J]. 中国地质灾害与防治学报,2019,30(1):52 − 60. [YAN Jusheng,TAN Jianmin. Landslide susceptibility assessment based on different factor classification methods:A case study in Yuan’an County of Hubei Province[J]. The Chinese Journal of Geological Hazard and Control,2019,30(1):52 − 60. (in Chinese with English abstract)] YAN Jusheng, TAN Jianmin. Landslide susceptibility assessment based on different factor classification methods: A case study in Yuan’an County of Hubei Province［J］. The Chinese Journal of Geological Hazard and Control, 2019, 30（1）: 52 − 60. （in Chinese with English abstract）
[11]	黄发明,曹中山,姚池,等. 基于决策树和有效降雨强度的滑坡危险性预警[J]. 浙江大学学报(工学版),2021,55(3):472 − 482. [HUANG Faming,CAO Zhongshan,YAO Chi,et al. Landslides hazard warning based on decision tree and effective rainfall intensity[J]. Journal of Zhejiang University (Engineering Science),2021,55(3):472 − 482. (in Chinese with English abstract)] HUANG Faming, CAO Zhongshan, YAO Chi, et al. Landslides hazard warning based on decision tree and effective rainfall intensity［J］. Journal of Zhejiang University （Engineering Science）, 2021, 55（3）: 472 − 482. （in Chinese with English abstract）
[12]	黄发明,曹昱,范宣梅,等. 不同滑坡边界及其空间形状对滑坡易发性预测不确定性的影响规律[J]. 岩石力学与工程学报,2021,40(增刊2):3227 − − 3240. [HUANG Faming,CAO Yu,FAN Xuanmei,et al. Influence of different landslide boundaries and their spatial shapes on the uncertainty of landslide susceptibility prediction[J]. Chinese Journal of Rock Mechanics and Engineering,2021,40(Sup 2):3227-3240. (in Chinese with English abstract)] HUANG Faming, CAO Yu, FAN Xuanmei, et al. Influence of different landslide boundaries and their spatial shapes on the uncertainty of landslide susceptibility prediction［J］. Chinese Journal of Rock Mechanics and Engineering, 2021, 40（Sup 2）: 3227-3240. （in Chinese with English abstract）
[13]	宋昭富,张勇,佘涛,等. 基于易发性分区的区域滑坡降雨预警阈值确定——以云南龙陵县为例[J]. 中国地质灾害与防治学报,2023,34(4):22 − 29. [SONG Zhaofu,ZHANG Yong,SHE Tao,et al. Determination of regional landslide rainfall warning threshold based on susceptibility zoning:a case study in Longling County of Yunnan Province[J]. The Chinese Journal of Geological Hazard and Control,2023,34(4):22 − 29. (in Chinese with English abstract)] SONG Zhaofu, ZHANG Yong, SHE Tao, et al. Determination of regional landslide rainfall warning threshold based on susceptibility zoning: a case study in Longling County of Yunnan Province［J］. The Chinese Journal of Geological Hazard and Control, 2023, 34（4）: 22 − 29. （in Chinese with English abstract）
[14]	黄发明,叶舟,姚池,等. 滑坡易发性预测不确定性:环境因子不同属性区间划分和不同数据驱动模型的影响[J]. 地球科学,2020,45(12):4535 − 4549. [HUANG Faming,YE Zhou,YAO Chi,et al. Uncertainties of landslide susceptibility prediction:different attribute interval divisions of environmental factors and different data-based models[J]. Earth Science,2020,45(12):4535 − 4549. (in Chinese with English abstract)] HUANG Faming, YE Zhou, YAO Chi, et al. Uncertainties of landslide susceptibility prediction: different attribute interval divisions of environmental factors and different data-based models［J］. Earth Science, 2020, 45（12）: 4535 − 4549. （in Chinese with English abstract）
[15]	仉文岗,何昱苇,王鲁琦,等. 基于水系分区的滑坡易发性机器学习分析方法:以重庆市奉节县为例[J]. 地球科学,2023,48(5):2024 − 2038. [ZHANG Wengang,HE Yuwei,WANG Luqi,et al. Machine learning solution for landslide susceptibility based on hydrographic division:case study of Fengjie County in Chongqing[J]. Earth Science,2023,48(5):2024 − 2038. (in Chinese with English abstract)] ZHANG Wengang, HE Yuwei, WANG Luqi, et al. Machine learning solution for landslide susceptibility based on hydrographic division: case study of Fengjie County in Chongqing［J］. Earth Science, 2023, 48（5）: 2024 − 2038. （in Chinese with English abstract）
[16]	杨得虎, 朱杰勇, 刘帅, 等. 基于信息量、加权信息量与逻辑回归耦合模型的云南罗平县崩滑灾害易发性评价对比分析[J]. 中国地质灾害与防治学报,2023,34(5):43 − 53. [YANG Dehu, ZHU Jieyong, LIU Shuai, et al. Comparative analyses of susceptibility assessment for landslide disasters based on information value, weighted information value and logistic regression coupled model in Luoping County, Yunnan Province[J]. The Chinese Journal of Geological Hazard and Control,2023,34(5):43 − 53. (in Chinese with English abstract)] YANG Dehu, ZHU Jieyong, LIU Shuai, et al. Comparative analyses of susceptibility assessment for landslide disasters based on information value, weighted information value and logistic regression coupled model in Luoping County, Yunnan Province［J］. The Chinese Journal of Geological Hazard and Control, 2023, 34（5）: 43 − 53. （in Chinese with English abstract）
[17]	贾雨霏,魏文豪,陈稳,等. 基于SOM-I-SVM耦合模型的滑坡易发性评价[J]. 水文地质工程地质,2023,50(3):125 − 137. [JIA Yufei,WEI Wenhao,CHEN Wen,et al. Landslide susceptibility assessment based on the SOM-I-SVM model[J]. Hydrogeology & Engineering Geology,2023,50(3):125 − 137. (in Chinese with English abstract)] JIA Yufei, WEI Wenhao, CHEN Wen, et al. Landslide susceptibility assessment based on the SOM-I-SVM model［J］. Hydrogeology & Engineering Geology, 2023, 50（3）: 125 − 137. （in Chinese with English abstract）
[18]	刘海知,徐辉,包红军,等. 基于集成学习的山区中小流域滑坡易发区早期识别优化试验[J]. 工程科学与技术,2022,54(6):12 − 20. [LIU Haizhi,XU Hui,BAO Hongjun,et al. Optimization experiment of early identification of landslides susceptibility areas in medium and small mountainous catchment based on ensemble learning[J]. Advanced Engineering Sciences,2022,54(6):12 − 20. (in Chinese with English abstract)] LIU Haizhi, XU Hui, BAO Hongjun, et al. Optimization experiment of early identification of landslides susceptibility areas in medium and small mountainous catchment based on ensemble learning［J］. Advanced Engineering Sciences, 2022, 54（6）: 12 − 20. （in Chinese with English abstract）
[19]	曾韬睿,邬礼扬,金必晶,等. 基于stacking集成策略和SBAS-InSAR的滑坡动态易发性制图[J]. 岩石力学与工程学报,2023,42(9):2266 − 2282. [ZENG Taorui,WU Liyang,JIN Bijing,et al. Landslide dynamic susceptibility mapping based on stacking ensemble strategy and SBAS-InSAR[J]. Chinese Journal of Rock Mechanics and Engineering,2023,42(9):2266 − 2282. (in Chinese with English abstract)] ZENG Taorui, WU Liyang, JIN Bijing, et al. Landslide dynamic susceptibility mapping based on stacking ensemble strategy and SBAS-InSAR［J］. Chinese Journal of Rock Mechanics and Engineering, 2023, 42（9）: 2266 − 2282. （in Chinese with English abstract）
[20]	黄发明,陈彬,毛达雄,等. 基于自筛选深度学习的滑坡易发性预测建模及其可解释性[J]. 地球科学,2023,48(5):1696 − 1710. [HUANG Faming,CHEN Bin,MAO Daxiong,et al. Landslide susceptibility prediction modeling and interpretability based on self-screening deep learning model[J]. Earth Science,2023,48(5):1696 − 1710. (in Chinese with English abstract)] HUANG Faming, CHEN Bin, MAO Daxiong, et al. Landslide susceptibility prediction modeling and interpretability based on self-screening deep learning model［J］. Earth Science, 2023, 48（5）: 1696 − 1710. （in Chinese with English abstract）
[21]	LUNDBERG S M,LEE S I. A unified approach to interpreting model predictions[C]//Proceedings of the 31st International Conference on Neural Information Processing Systems. December 4 - 9,2017,Long Beach,California,USA. ACM,2017:4768 − 4777.
[22]	陈丹璐,孙德亮,文海家,等. 基于不同因子筛选方法的LightGBM-SHAP滑坡易发性研究[J/OL]. 北京师范大学学报(自然科学版),(2023-08-08)[2023-09-26] https://link.cnki.net/urlid/11.1991.N.20230808.1452.003. [CHEN Danlu,SUN Deliang,WEN Haijia,etal. A study on landslide susceptibility of LightGBMSHAP based on different factor screening methods[J]. Journal of Beijing Normal University (Natural Science),(2023-08-08)[2023-09-26]. (in Chinese with English abstract)] CHEN Danlu, SUN Deliang, WEN Haijia, etal. A study on landslide susceptibility of LightGBMSHAP based on different factor screening methods［J］. Journal of Beijing Normal University （Natural Science）, （2023-08-08）[2023-09-26]. （in Chinese with English abstract）
[23]	DAHAL A,LOMBARDO L. Explainable artificial intelligence in geoscience:a glimpse into the future of landslide susceptibility modeling[J]. Computers & Geosciences,2023,176:105364.
[24]	黄发明,曾诗怡,姚池,等. 滑坡易发性预测建模的不确定性:不同“非滑坡样本”选择方式的影响[J]. 工程科学与技术,2023,56(1):1 − 14. [HUANG Faming, ZENG Shiyi, CHI Yao, et al. Uncertainties of landslide susceptibility prediction modeling:influence of different selection methods of "non-landslide samples"[J]. Advanced Engineering Sciences,2023,56(1):1 − 14. ( in Chinese with English abstract)] HUANG Faming, ZENG Shiyi, CHI Yao, et al. Uncertainties of landslide susceptibility prediction modeling: influence of different selection methods of "non-landslide samples"［J］. Advanced Engineering Sciences, 2023, 56（1）: 1 − 14. （ in Chinese with English abstract）
[25]	罗路广,裴向军,崔圣华,等. 九寨沟地震滑坡易发性评价因子组合选取研究[J]. 岩石力学与工程学报,2021,40(11):2306 − 2319. [LUO Luguang,PEI Xiangjun,CUI Shenghua,et al. Combined selection of susceptibility assessment factors for Jiuzhaigou earthquake-induced landslides[J]. Chinese Journal of Rock Mechanics and Engineering,2021,40(11):2306 − 2319. (in Chinese with English abstract)] LUO Luguang, PEI Xiangjun, CUI Shenghua, et al. Combined selection of susceptibility assessment factors for Jiuzhaigou earthquake-induced landslides［J］. Chinese Journal of Rock Mechanics and Engineering, 2021, 40（11）: 2306 − 2319. （in Chinese with English abstract）
[26]	宋宇飞,曹琰波,范文,等. 基于贝叶斯方法的降雨诱发滑坡概率型预警模型研究[J]. 岩石力学与工程学报,2023,42(3):558 − 574. [SONG Yufei,CAO Yanbo,FAN Wen,et al. Probabilistic early warning model for rainfall-induced landslides based on Bayesian approach[J]. Chinese Journal of Rock Mechanics and Engineering,2023,42(3):558 − 574. (in Chinese with English abstract)] SONG Yufei, CAO Yanbo, FAN Wen, et al. Probabilistic early warning model for rainfall-induced landslides based on Bayesian approach［J］. Chinese Journal of Rock Mechanics and Engineering, 2023, 42（3）: 558 − 574. （in Chinese with English abstract）
[27]	PROKHORENKOVA L,GUSEV G,VOROBEV A,et al. CatBoost:unbiased boosting with categorical features[C]//Proceedings of the 32nd International Conference on Neural Information Processing Systems. December 3 - 8,2018,Montréal,Canada. ACM,2018:6639–6649.
[28]	高秉海,何毅,张立峰,等. 顾及In SAR形变的CNN滑坡易发性动态评估——以刘家峡水库区域为例[J]. 岩石力学与工程学报,2023,42(2):450 − 465. [GAO Binghai,HE Yi,ZHANG Lifeng,et al. Dynamic evaluation of landslide susceptibility by CNN considering InSAR deformation:A case study of Liujiaxia Reservoir[J]. Chinese Journal of Rock Mechanics and Engineering,2023,42(2):450 − 465. (in Chinese with English abstract)] GAO Binghai, HE Yi, ZHANG Lifeng, et al. Dynamic evaluation of landslide susceptibility by CNN considering InSAR deformation: A case study of Liujiaxia Reservoir［J］. Chinese Journal of Rock Mechanics and Engineering, 2023, 42（2）: 450 − 465. （in Chinese with English abstract）
[29]	张俊,殷坤龙,王佳佳,等. 三峡库区万州区滑坡灾害易发性评价研究[J]. 岩石力学与工程学报,2016,35(2):284 − 296. [ZHANG Jun,YIN Kunlong,WANG Jiajia,et al. Evaluation of landslide susceptibility for Wanzhou district of Three Gorges Reservoir[J]. Chinese Journal of Rock Mechanics and Engineering,2016,35(2):284 − 296. (in Chinese with English abstract)] ZHANG Jun, YIN Kunlong, WANG Jiajia, et al. Evaluation of landslide susceptibility for Wanzhou district of Three Gorges Reservoir［J］. Chinese Journal of Rock Mechanics and Engineering, 2016, 35（2）: 284 − 296. （in Chinese with English abstract）
[30]	HUANG Faming,ZHANG Jing,ZHOU Chuangbing,et al. A deep learning algorithm using a fully connected sparse autoencoder neural network for landslide susceptibility prediction[J]. Landslides,2020,17(1):217 − 229. DOI: 10.1007/s10346-019-01274-9
[31]	XING Yin,CHEN Yang,HUANG Saipeng,et al. Research on the uncertainty of landslide susceptibility prediction using various data-driven models and attribute interval division[J]. Remote Sensing,2023,15(8):2149. DOI: 10.3390/rs15082149
[32]	李文彬,范宣梅,黄发明,等. 不同环境因子联接和预测模型的滑坡易发性建模不确定性[J]. 地球科学,2021,46(10):3777 − 3795. [LI Wenbin,FAN Xuanmei,HUANG Faming,et al. Uncertainties of landslide susceptibility modeling under different environmental factor connections and prediction models[J]. Earth Science,2021,46(10):3777 − 3795. (in Chinese with English abstract)] LI Wenbin, FAN Xuanmei, HUANG Faming, et al. Uncertainties of landslide susceptibility modeling under different environmental factor connections and prediction models［J］. Earth Science, 2021, 46（10）: 3777 − 3795. （in Chinese with English abstract）
[33]	方然可, 刘艳辉, 黄志全. 基于机器学习的区域滑坡危险性评价方法综述[J]. 中国地质灾害与防治学报,2021,32(4):1 − 8. [FANG Ranke, LIU Yanhui, HUANG Zhiquan. A review of the methods of regional landslide hazard assessment based on machine learning[J]. The Chinese Journal of Geological Hazard and Control,2021,32(4):1 − 8. (in Chinese with English abstract)] FANG Ranke, LIU Yanhui, HUANG Zhiquan. A review of the methods of regional landslide hazard assessment based on machine learning［J］. The Chinese Journal of Geological Hazard and Control, 2021, 32（4）: 1 − 8. （in Chinese with English abstract）
[34]	陈水满, 赵辉龙, 许震, 等. 基于人工神经网络模型的福建南平市滑坡危险性评价[J]. 中国地质灾害与防治学报,2022,33(2):133 − 140. [CHEN Shuiman, ZHAO Huilong, XU Zhen, et al. Landslide risk assessment in Nanping City based on artificial neural networks model[J]. The Chinese Journal of Geological Hazard and Control,2022,33(2):133 − 140. (in Chinese with English abstract)] CHEN Shuiman, ZHAO Huilong, XU Zhen, et al. Landslide risk assessment in Nanping City based on artificial neural networks model［J］. The Chinese Journal of Geological Hazard and Control, 2022, 33（2）: 133 − 140. （in Chinese with English abstract）
[35]	阳清青, 余秋兵, 张廷斌, 等. 基于GDIV模型的大渡河中游地区滑坡危险性评价与区划[J]. 中国地质灾害与防治学报,2023,34(5):130 − 140. [YANG Qingqing,YU Qiubing,ZHANG Tingbin,et al. Landslide hazard assessment in the middle reach area of the Dadu River based on the GDIV model[J]. The Chinese Journal of Geological Hazard and Control,2023,34(5):130 − 140. (in Chinese with English abstract)] YANG Qingqing, YU Qiubing, ZHANG Tingbin, et al. Landslide hazard assessment in the middle reach area of the Dadu River based on the GDIV model［J］. The Chinese Journal of Geological Hazard and Control, 2023, 34（5）: 130 − 140. （in Chinese with English abstract）
[36]	刘甲美,王涛,杜建军,等. 四川泸定MS6.8级地震诱发崩滑灾害快速评估[J]. 水文地质工程地质,2023,50(2):84 − 94. [LIU Jiamei, WANG Tao, DU Jianjun, et al. Emergency rapid assessment of landslides induced by the Luding MS6.8 earthquake in Sichuan of China[J]. Hydrogeology & Engineering Geology,2023,50(2):84 − 94. (in Chinese with English abstract)] LIU Jiamei, WANG Tao, DU Jianjun, et al. Emergency rapid assessment of landslides induced by the Luding MS6.8 earthquake in Sichuan of China［J］. Hydrogeology & Engineering Geology, 2023, 50（2）: 84 − 94. （in Chinese with English abstract）

施引文献(1)

期刊类型引用(1)

刘星宇，朱立峰，孙建伟，贾煦，刘向东，黄虹霖，程贤达，孙亚柯，胡超进，张晓龙. 沟谷型泥石流特征参数的等代面积递归精细求解. 西北地质. 2024(03): 272-284 .

百度学术

其他类型引用(0)

资源附件(0)

图(10)

计量

文章访问数: 787
HTML全文浏览量: 32
PDF下载量: 164
被引次数: 1

0. 引言
1. 研究区域及数据
1.1 研究区域
1.2 滑坡清单
1.3 影响因子
2. 研究方法
2.1 CatBoost模型
2.2 SHAP模型
2.3 因子分级策略及精度评价
3. 结果
3.1 滑坡易发性模型评价
3.1.1 影响因子共线性及重要性评价
3.1.2 不同分级条件下精度评价
3.1.3 SHAP影响因子解译
3.2 滑坡易发性制图
4. 结论

0. 引言
1. 研究区域及数据
1.1 研究区域
1.2 滑坡清单
1.3 影响因子
2. 研究方法
2.1 CatBoost模型
2.2 SHAP模型
2.3 因子分级策略及精度评价
3. 结果
3.1 滑坡易发性模型评价
3.1.1 影响因子共线性及重要性评价
3.1.2 不同分级条件下精度评价
3.1.3 SHAP影响因子解译
3.2 滑坡易发性制图
4. 结论

参考文献(36)

施引文献(1)

资源附件(0)

基于CatBoost-SHAP模型的滑坡易发性建模及可解释性

作者简介: 曾韬睿（1995—），男，重庆，博士研究生，主要从事滑坡灾害风险评价与管理研究。E-mail：zengtaorui@cug.edu.cn

通讯作者: 王林峰（1983—），男，教授，博士，研究方向为地质灾害减灾理论与技术。E-mail：wanglinfeng@cqjtu.edu.cn

计量

出版历程

Landslide susceptibility modeling and interpretability based on CatBoost-SHAP model

0. 引 言

1. 研究区域及数据

1.1 研究区域

1.2 滑坡清单

1.3 影响因子

2. 研究方法

2.1 CatBoost模型

2.2 SHAP模型

2.3 因子分级策略及精度评价

3. 结果

3.1 滑坡易发性模型评价

3.1.1 影响因子共线性及重要性评价

3.1.2 不同分级条件下精度评价

3.1.3 SHAP影响因子解译

3.2 滑坡易发性制图

4. 结论

期刊类型引用(1)

其他类型引用(0)

计量

出版历程

目录

0. 引 言

1. 研究区域及数据

1.1 研究区域

1.2 滑坡清单

1.3 影响因子

2. 研究方法

2.1 CatBoost模型

2.2 SHAP模型

2.3 因子分级策略及精度评价

3. 结果

3.1 滑坡易发性模型评价

3.1.1 影响因子共线性及重要性评价

3.1.2 不同分级条件下精度评价

3.1.3 SHAP影响因子解译

3.2 滑坡易发性制图

4. 结论

友情链接：

作者简介:
曾韬睿（1995—），男，重庆，博士研究生，主要从事滑坡灾害风险评价与管理研究。E-mail：zengtaorui@cug.edu.cn

通讯作者:
王林峰（1983—），男，教授，博士，研究方向为地质灾害减灾理论与技术。E-mail：wanglinfeng@cqjtu.edu.cn

0. 引言

0. 引言