• 中国出版政府奖提名奖

    中国百强科技报刊

    湖北出版政府奖

    中国高校百佳科技期刊

    中国最美期刊

    留言板

    尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

    姓名
    邮箱
    手机号码
    标题
    留言内容
    验证码

    张雨昂, 谢忠, 田苗, 吴麒瑞, 吴亮, 邱芹军, 陈建国, 2026. 基于多源持续预训练与集成检索增强生成的矿产勘查大语言模型构建. 地球科学. doi: 10.3799/dqkx.2026.032
    引用本文: 张雨昂, 谢忠, 田苗, 吴麒瑞, 吴亮, 邱芹军, 陈建国, 2026. 基于多源持续预训练与集成检索增强生成的矿产勘查大语言模型构建. 地球科学. doi: 10.3799/dqkx.2026.032
    ZHANG Yuang, XIE Zhong, TIAN Miao, WU Qirui, WU Liang, QIU Qinjun, CHEN Jianguo, 2026. A Large Language Model for Mineral Exploration via Multi-source Continual Pre-training and Integrated Retrieval-Augmented Generation. Earth Science. doi: 10.3799/dqkx.2026.032
    Citation: ZHANG Yuang, XIE Zhong, TIAN Miao, WU Qirui, WU Liang, QIU Qinjun, CHEN Jianguo, 2026. A Large Language Model for Mineral Exploration via Multi-source Continual Pre-training and Integrated Retrieval-Augmented Generation. Earth Science. doi: 10.3799/dqkx.2026.032

    基于多源持续预训练与集成检索增强生成的矿产勘查大语言模型构建

    doi: 10.3799/dqkx.2026.032
    详细信息
      作者简介:

      张雨昂(1997-),男,博士研究生,从事地质知识图谱构建及领域大模型应用研究。E-mail:zhangyuang@cug.edu.cn,ORCID:0009-0000-6213-9081

      通讯作者:

      邱芹军(1988 - ),男,副研究员,博士,从事地质知识图谱构建及推理应用研究。E-mail:qiuqinjun@cug.edu.cn,ORCID:0000-0002-9850-3751

    • 中图分类号: P628

    A Large Language Model for Mineral Exploration via Multi-source Continual Pre-training and Integrated Retrieval-Augmented Generation

    • 摘要: 为解决矿产勘查场景下通用大语言模型领域语料稀缺、领域术语覆盖与语体适配不足、事实性幻觉突出的问题。构建约2500万token规模的领域语料库,在此基础上提出课程式持续预训练策略,按术语、机制、案例三阶段组织训练数据,并配合渐进式Transformer block解冻与学习率调度,对Qwen3-1.7B进行持续预训练以实现分阶段领域适配,得到面向矿产勘查场景的大语言模型Geo-MineLLM;推理阶段集成Hybrid RAG,以混合检索与证据约束生成提升事实一致性。人工评估表明,Geo-MineLLM相较基座模型与同系列更大参数规模的模型显著提升领域问答表现;集成Hybrid RAG后,综合领域问答表现接近GPT-4.1。(该训练、推理一体化方案为矿产勘查领域大模型构建与可靠问答提供轻量化路径。

       

    • 加载中
    计量
    • 文章访问数:  163
    • HTML全文浏览量:  57
    • PDF下载量:  26
    • 被引次数: 0
    出版历程
    • 收稿日期:  2025-12-30
    • 网络出版日期:  2026-02-28

    目录

      /

      返回文章
      返回