基于机器学习的Landsat数据地层信息提取——以西南天山柯坪地区为例

鲍宽乐, 许文波, 王庆同. 2023. 基于机器学习的Landsat数据地层信息提取——以西南天山柯坪地区为例. 地质通报, 42(4): 637-645. doi: 10.12097/j.issn.1671-2552.2023.04.012
引用本文: 鲍宽乐, 许文波, 王庆同. 2023. 基于机器学习的Landsat数据地层信息提取——以西南天山柯坪地区为例. 地质通报, 42(4): 637-645. doi: 10.12097/j.issn.1671-2552.2023.04.012
BAO Kuanle, XU Wenbo, WANG Qingtong. 2023. Stratigraphic information extraction from landsat data based on machine learning—a case study of the Keping area of southwest Tianshan Mountains. Geological Bulletin of China, 42(4): 637-645. doi: 10.12097/j.issn.1671-2552.2023.04.012
Citation: BAO Kuanle, XU Wenbo, WANG Qingtong. 2023. Stratigraphic information extraction from landsat data based on machine learning—a case study of the Keping area of southwest Tianshan Mountains. Geological Bulletin of China, 42(4): 637-645. doi: 10.12097/j.issn.1671-2552.2023.04.012

基于机器学习的Landsat数据地层信息提取——以西南天山柯坪地区为例

  • 基金项目:
    中国地质调查局项目《胶东北部海岸带与岛礁综合地质调查》(编号: ZD20220604)、《胶东北部海岸带与岛礁综合地质调查》(编号: DD20220990)、《西南天山柯坪地区六幅地质矿产综合调查》(编号: 12120115041201)
详细信息
    作者简介: 鲍宽乐(1989-),男,高级工程师,从事地质地球物理调查研究工作。E-mail: 1115780278@qq.com
    通讯作者: 王庆同(1981-),男,高级工程师,从事区域地质矿产调查与研究。E-mail: 44305591@qq.com
  • 中图分类号: P539.4;P627

Stratigraphic information extraction from landsat data based on machine learning—a case study of the Keping area of southwest Tianshan Mountains

More Information
  • 当前机器学习方法不断创新发展,为遥感数据的分析利用提供了很好的平台。结合西南天山柯坪地区沉积岩的典型地质特征,针对1:5万区域地质调查数据,利用Landsat 8数据9个波段的遥感信息进行机器学习方法解译。为增强机器学习过程中参与变量数目,在原始9波段数据的基础上分别采用比值法增强方式、主成分分析法增强方式进行数据叠加。为减弱地质体内部纹理信息,同时不影响地质体之间的边界,笔者采用双边滤波的形式对遥感数据进行进一步处理。选用的极限随机树方法、直方梯度增强随机树、随机森林3种机器学习方法整体识别精度均超过93%,尤其是极限随机树方法达到94.18%。本研究方法可用在其他地质信息解译、地质填图中,值得推广。

  • 加载中
  • 图 1  研究区位置(A)及区域地质简图(B)

    Figure 1. 

    图 2  Landsat 9波段数据地层提取结果图(地层代号及岩性同表 1)

    Figure 2. 

    图 3  研究区不同参数双边滤波效果对比图

    Figure 3. 

    图 4  主成分变换增强及主成分变换+双边滤波增强提取结果对比(地层代号和岩性同表 1)

    Figure 4. 

    图 5  波段比叠加变换增强及波段比叠加+双边滤波增强提取结果对比(地层代号和岩性同表 1)

    Figure 5. 

    图 6  机器学习提取结果与区域地质图对比(地层代号和岩性同表 1)

    Figure 6. 

    表 1  训练及验证样本分布

    Table 1.  Distribution of training and verification samples

    类别 训练样本数量 验证样本数量 地层代号 地层名 岩性
    类1 625 456 Qp3pl 上更新统 洪积物
    类2 859 1477 Qp2pl 中更新统 洪积物
    类3 72 102 O1ql1 丘里塔格组 含硅质团块灰岩(深灰色)
    类4 3256 2510 O1ql2 丘里塔格组 含硅质团块灰岩(深灰色)
    类5 4639 5213 O1ql2 丘里塔格组 含硅质团块灰岩(深灰色)
    类6 225 229 O3q(O3k, O2-3se) 其浪组、坎岭组、萨尔干组 钙质泥岩(紫红色)与钙质泥岩(灰绿色)互层
    类7 537 446 O3y 印干组 片理化泥岩(灰黑色)
    类8 775 371 S1k1 柯坪塔格组 细砂岩与粉砂岩互层
    类9 344 266 S1k2 柯坪塔格组 粉砂质泥岩(草黄绿色)
    类10 144 115 S1k3 柯坪塔格组 砂岩(灰绿色)夹细砂岩(暗紫红色)
    类11 451 196 S2-4t 塔塔埃尔塔格组 细砂岩(灰绿色)
    类12 323 170 S2-4t 塔塔埃尔塔格组 粉砂岩(紫红色)
    类13 719 519 D1-2y1 衣木干他乌组 细砂岩(紫红色)
    类14 1237 700 D1-2y2 衣木干他乌组 细砂岩(紫红色)
    类15 1213 558 D3k1 克孜尔塔格组 细砂岩(紫红色)、粉砂质泥岩(灰绿色)
    类16 1256 595 D3k2 克孜尔塔格组 细砂岩(紫红色)
    类17 1054 462 C2P1kk 康克林组 灰岩(深灰色-灰白色)
    类18 430 546 P1b 巴立克里克组 灰岩(深灰色)
    类19 303 594 Qp1x 西域组 砾岩(灰色)
    下载: 导出CSV

    表 2  Landsat 9波段数据地层提取精度分布

    Table 2.  Precision distribution of stratigraphic information extraction

    方法 自适应增强法 袋装法 极限随机树 直方梯度增强随机树 随机森林
    总精度 12.82% 64.73% 88.06% 87.28% 87.28%
    Kappa系数 0.0115 0.5641 0.8557 0.8473 0.8473
    下载: 导出CSV

    表 3  主成分变换数据增强后地层提取精度分布

    Table 3.  Stratigraphic information extraction accuracy distribution after enhanced by principal component transformation

    主成分变换增强 方法 极限随机树 直方梯度增强随机树 随机森林
    总精度 93.71% 94.16% 93.91%
    Kappa系数 0.9249 0.9304 0.9273
    主成分变换+双边滤波增强 方法 极限随机树 直方梯度增强随机树 随机森林
    总精度 95.99% 95.55% 95.07%
    Kappa系数 0.9522 0.947 0.9412
    下载: 导出CSV

    表 4  波段比叠加数据增强后地层提取精度分布

    Table 4.  Stratigraphic information extraction accuracy distribution after enhanced by band ratio stack data

    波段比叠加增强 方法 极限随机树 直方梯度增强随机树 随机森林
    总精度 94.18% 93.89% 93.96%
    Kappa系数 0.9305 0.9269 0.928
    波段比叠加+双边滤波增强 方法 极限随机树 直方梯度增强随机树 随机森林
    总精度 97.40% 95.15% 96.57%
    Kappa系数 0.9691 0.9421 0.9592
    下载: 导出CSV
  • [1]

    Breiman L. Bagging predictors[J]. Machine Learning, 1996, 24(2): 123-140.

    [2]

    Breiman L. Random Forests[J]. Machine Learning, 2001, 45(1): 5-32.

    [3]

    Freund Y. A decision-thoretic generalization of on-line learning and an application to boosting[J]. Journal of Computer and System Sciences, 1997, 55: 119-139. doi: 10.1006/jcss.1997.1504

    [4]

    Friedman J. Greedy Function Approximation: A Gradient Boosting Machine[J]. The Annals of Statistics, 2001, 29(5): 1189-1232 doi: 10.1214/aos/1013203450

    [5]

    Geurts P, Ernst D, Wehenkel L. Extremely randomized trees[J]. Machine Learning, 2006, 63(1): 3-42. doi: 10.1007/s10994-006-6226-1

    [6]

    Lakhlifa B, Amraoui T, Adnane T, et al. Geological mapping and mining prospecting in the Aouli inlier(Eastern Meseta, Morocco)based on remote sensing and geographic information systems(GIS)[J]. China Geology, 2022, 5(4): 614-629.

    [7]

    Tomasi C, Manduchi R. Bilateral filtering for gray and color images[C]// International Conference on Computer Vision. IEEE, 2002.

    [8]

    陈虹, 杨晓, 田世攀, 等. 覆盖区智能地质填图的探索与实践——以森林沼泽区为例[J]. 地质通报, 2022, 41(2/3): 218-241. http://dzhtb.cgs.cn/gbc/ch/reader/view_abstract.aspx?file_no=2022020303&flag=1

    [9]

    陈建平, 肖克炎, 李诗, 等. 基于机器学习的三维矿产定量预测——以四川拉拉铜矿为例[J]. 地质通报, 2019, 38(12): 2010-2021. doi: 10.12097/j.issn.1671-2552.2019.12.009 http://dzhtb.cgs.cn/gbc/ch/reader/view_abstract.aspx?file_no=20191209&flag=1

    [10]

    代友旭, 张新勇, 阎琨, 等. 新疆柯坪地区早二叠世玄武岩年代学、地球化学特征及其地质意义[J]. 地质科技情报, 2017, (1): 1-13. https://www.cnki.com.cn/Article/CJFDTOTAL-DZKQ201701001.htm

    [11]

    戴均豪, 薛林福, 李忠潭, 等. 无人机遥感技术在甘肃北山地区地质填图中的应用[J]. 吉林大学学报(地球科学版), 2021, 51(6): 1908-1920. https://www.cnki.com.cn/Article/CJFDTOTAL-CCDZ202106025.htm

    [12]

    范湘涛, 卢华复, 石火生, 等. 柯坪地区构造弱信息提取及左行走滑断层证据[J]. 高校地质学报, 2000, 6(1): 23-28. doi: 10.3969/j.issn.1006-7493.2000.01.003

    [13]

    韩玲, 杨军录, 陈劲松. 遥感信息提取及地质解译[M]. 北京: 科学出版社, 2017.

    [14]

    何文熹, 王磊, 杨玉龙. 基于Landsat 8影像赤壁-嘉鱼地区岩性划分效果分析[J]. 华南地质与矿产, 2019, 35(2): 261-269. https://www.cnki.com.cn/Article/CJFDTOTAL-HNKC201902013.htm

    [15]

    李俊峰. 双边滤波算法的快速实现及其在图像处理的应用[D]. 南方医科大学硕士学位论文, 2013.

    [16]

    李娜, 甘甫平, 董新丰, 等. 高分五号卫星高光谱数据岩性-构造解译初步应用评价[J]. 上海航天, 2019, A2: 188-192, 199. https://www.cnki.com.cn/Article/CJFDTOTAL-SHHT2019S2028.htm

    [17]

    李欣海. 随机森林模型在分类与回归分析中的应用[J]. 应用昆虫学报(昆虫知识), 2013, 50(4): 1190-1197. https://www.cnki.com.cn/Article/CJFDTOTAL-KCZS201304041.htm

    [18]

    马梓程, 帅爽, 安志宏, 等. 基于RF模型的火成岩提取与分类研究——以吉布提阿里萨比耶地区为例[C]// 国家安全地球物理丛书(十五)——丝路环境与地球物理. 2019.

    [19]

    时丕龙, 付碧宏, 二宫芳树. 基于ASTER VNIR—SWIR多光谱遥感数据识别与提取干旱地区岩性信息——以西南天山柯坪隆起东部为例[J]. 地质科学, 2010, 45(1): 333-347. https://www.cnki.com.cn/Article/CJFDTOTAL-DZKX201001029.htm

    [20]

    王建刚, 叶发旺, 邱骏挺, 等. 遥感岩性识别分类研究[J]. 世界核地质科学, 2020, (1): 10-22. https://www.cnki.com.cn/Article/CJFDTOTAL-GWYD202001002.htm

    [21]

    王明常, 张馨月, 张旭晴, 等. 基于极限学习机的GF-2影像分类[J]. 吉林大学学报(地球科学版), 2018, 48(2): 373-378. https://www.cnki.com.cn/Article/CJFDTOTAL-CCDZ201802005.htm

    [22]

    吴志春, 郭福生, 李华亮, 等. 主成分分析法在相山火山盆地蚀变分带解译中的应用[J]. 大地构造与成矿学, 2020, 44(3): 385-403. https://www.cnki.com.cn/Article/CJFDTOTAL-DGYK202003006.htm

    [23]

    熊越晗, 刘东燕, 刘东升, 等. 基于岩样细观图像深度学习的岩性自动分类方法[J]. 吉林大学学报(地球科学版), 2021, 51(5): 1597-1604. https://www.cnki.com.cn/Article/CJFDTOTAL-CCDZ202105033.htm

    [24]

    阎琨, 赵志刚, 马伟, 等. 塔里木柯坪地区上奥陶统印干组碳酸盐岩微相和古地理[J]. 新疆地质, 2019, 37(3): 363-367. https://www.cnki.com.cn/Article/CJFDTOTAL-XJDI201903017.htm

    [25]

    于长春, 孙杰, 张迪硕, 等. 基于多源遥感与航空物探数据的岩性分类方法[J]. 地质通报, 2022, 41(2/3): 210-217. http://dzhtb.cgs.cn/gbc/ch/reader/view_abstract.aspx?file_no=2022020302&flag=1

    [26]

    张志臣, 韩忠, 刘晓煌, 等. 新疆哈拉奇地区泥盆纪层序地层学特征及沉积环境[J]. 地质通报, 2014, 33(1): 51-59. http://dzhtb.cgs.cn/gbc/ch/reader/view_abstract.aspx?file_no=20140107&flag=1

  • 加载中

(6)

(4)

计量
  • 文章访问数:  1566
  • PDF下载数:  62
  • 施引文献:  0
出版历程
收稿日期:  2020-08-06
修回日期:  2022-02-09
刊出日期:  2023-04-15

目录