地球化学分析广泛应用于地球科学,可服务于基础地质研究、矿产资源勘查、环境调查和监测等。然而,受限于分析测试方法,以及出于不同的研究目的和需求,文献中呈现的多是部分地球化学数据,故地球化学大数据集中常常出现删失值(低于或高于特定方法检出限的数值)或缺失值(没有进行分析的对象),不利于后续数据处理、解译。
为了改善这一现状,中国科学院新疆生态与地理研究所研究人员采用一种机器学习模型(随机森林)来模拟岩石和水系沉积物中的地球化学元素。研究发现,采用合适的模型参数和变量选择,可获得可靠的元素模拟结果,模型的泛化性能良好。
该研究揭示了自然界中各元素之间存在复杂的隐含关系,为解决地球化学数据中存在缺失值的问题提供了方案,可为地质学、环境科学和土壤科学等学科提供很好的借鉴。该方法具有巨大的应用前景。比如,可以基于全国化探扫面项目分析的39种元素含量数据模拟其他数十种元素含量,可显著降低分析测试成本。
以上研究成果以“Uncover implicit associations among geochemical elements using machine learning” 为题发表在《Ore Geology Reviews》。该研究由中国科学院新疆生态与地理研究所作为第一单位,周曙光为第一作者,中国地质科学院地球物理地球化学勘查研究所程志中研究员为共同通讯作者。
文章链接:https://doi.org/10.1016/j.oregeorev.2025.106506