一种基于大数据关联规则算法的卡林型金矿定量找矿方法

未命名 08-22 阅读:114 评论:0


1.本发明涉及一种卡林型金矿找矿方法,特别是一种基于大数据关联规则算法的卡林型金矿定量找矿方法。


背景技术:

2.金是硬通货,随着社会经济迅速发展,对au的需求日益增加,但长期的开采导致浅部金矿床大量消耗,急需新的成矿理论和找矿方法服务深部和盲区找矿。
3.卡林型金矿床是金的重要来源,年产量约占世界金总产量的8%,主要分布于美国西部内华达州和犹他州、中国的滇黔桂和陕甘川两个金三角、东南亚、以及南美洲的秘鲁等地区(cline et al.,2005、2013;frimmel,2008;su et al.,2009a、2009b、2012)。滇黔桂“金三角”是世界第二大卡林型金矿床富集基地,仅次于内华达州(suetal.,2012、2018;muntean and cline,2018;wu et al.,2019;wei et al.,2020)。以往在成矿理论指导下,主要通过化学/物理勘探与卡林型金矿床地质特征相结合开展找矿,形成了土壤地球化学法(谢学锦,1996;陶淡等,2002;王宝林等,2011;吴松洋等,2018),构造地球化学法(韩润生,2013;刘建中等,2017;钱建平等,2015;梁德生等,2017;张善明等,2018;李松涛等,2019、2021),地球物理法(庞绪成等,2005;mark,2007;孟小杰,2014;杨炳南等,2016),综合信息找矿预测(肖克炎等,2013;叶天竺等2017;薛建玲等,2018),以及通过三维地质建模进行找矿预测等方法(张权平等,2020;曹胜桃等,2021;cao et al,2022)。在卡林型金矿床中,au的品位低、不可见,使找矿难度大,找有经济价值的矿床更是不易。
4.关联规则算法是大数据挖掘的基础算法,也是最活跃的研究方法之一,它从大数据中发现有价值的、频繁出现的模式、关联和相关性,通过量化的数字,描述规则一的出现对规则二的出现有多大的影响(刘心怡和周永章,2019)。
5.卡林型金矿床勘探积累了大量化学测试数据,为大数据挖掘提供了很好的条件。本发明以滇黔桂“金三角”内主要的卡林型金矿床为研究对象,在区域矿床内已有微量元素数据的基础上,应用关联规则算法获取强关联规则库,进而分析矿床内元素与au矿化之间的关联程度。最后,结合矿床内元素的迁移富集规律,提取元素异常组合,再次使用关联规则算法建立定量找矿模型,服务于区域上深部和盲区的找矿。


技术实现要素:

6.本发明的目的在于,提供一种基于大数据关联规则算法的卡林型金矿定量找矿方法。本发明具有去碳酸盐化找矿模型判断是否发生去碳酸盐化和矿化,具有较好效果;硫化找矿模型内中高含量项数与高含量项数取并集和交集,均表现出含矿率提高、矿丢失率较低、正确率高、模型稳定,且并集与交集配合使用,具有不漏矿、高效圈矿的特点。
7.本发明的技术方案:一种基于大数据关联规则算法的卡林型金矿定量找矿方法,通过关联规则算法分析元素含量与金矿化的关联性、元素与金矿化的关联性,结合元素的迁移富集规律,判断元素异常组合,再将元素异常组合进行关联规则分析,建立定量找矿模
型。
8.前述的基于大数据关联规则算法的卡林型金矿定量找矿方法中,所述找矿模型是根据元素异常组合,分别选取强正关联显著富集元素as、sb、hg、tl、ag、w、rb,强正关联略富集元素zr、th、ta、nb、hf,强负关联强迁出元素sr,建立找矿模型。
9.前述的基于大数据关联规则算法的卡林型金矿定量找矿方法中,所述强正关联显著富集元素as、sb、hg、tl、ag、w、rb代表的硫化和黏土化作用,为硫化作用;
10.强负关联强迁出元素sr代表去碳酸盐化作用,强正关联略富集元素zr、th、ta、nb、hf是去碳酸盐化作用引起体积减小、导致含量增加,将强负关联强迁出元素和强正关联略富集元素直接反映去碳酸盐化作用。
11.前述的基于大数据关联规则算法的卡林型金矿定量找矿方法中,所述找矿模型包括硫化找矿模型和去碳酸盐化找矿模型。
12.前述的基于大数据关联规则算法的卡林型金矿定量找矿方法中,所述硫化找矿模型是在卡林型金矿床内as、hg、sb、tl、w、ag元素含量差异进行找矿或圈矿;
13.当样品中as、hg、sb、tl、w、ag、rb等元素内中高含量项数≥2、≥3、≥4、≥5时,样品发生矿化,对应的au含量分别为≥47.0
×
10-9
、≥150
×
10-9
、≥500
×
10-9
、≥1000
×
10-9

14.当样品中as、hg、sb、tl、w、ag、rb等元素内高含量项数≥1、≥1、≥2、≥3时,样品发生矿化,对应的au含量分别为≥47.0
×
10-9
、≥150
×
10-9
、≥500
×
10-9
、≥1000
×
10-9

15.前述的基于大数据关联规则算法的卡林型金矿定量找矿方法中,所述as、hg、sb、tl、w、ag、rb等元素的低含量与中高含量界线值分别为668
×
10-6
、2.12
×
10-6
、8.51
×
10-6
、0.636
×
10-6
、2.23
×
10-6
、0.075
×
10-6
、42.7
×
10-6
,低中含量与高含量的界线分别为1939
×
10-6
、5.84
×
10-6
、24.1
×
10-6
、1.36
×
10-6
、4.63
×
10-6
、0.164
×
10-6
、98.8
×
10-6

16.前述的基于大数据关联规则算法的卡林型金矿定量找矿方法中,所述硫化找矿模型根据元素的中高含量项数和高含量项数对卡林型金矿床进行找矿或圈矿时,取并集或/和交集使用;具体的“找矿时,取并集;圈矿时,取交集”或“找矿或圈矿过程中,并集和交集配合使用”。
17.前述的基于大数据关联规则算法的卡林型金矿定量找矿方法中,所述去碳酸盐化找矿模型是通过sr负异常和高场强元素zr、th、ta、nb、hf的正异常判断岩石是否发生去碳酸盐化。
18.前述的基于大数据关联规则算法的卡林型金矿定量找矿方法中,所述去碳酸盐化找矿模型具体是:
19.当zr、th、ta、nb、hf元素含量均为中高含量类、sr元素含量低含量类时,发生去碳酸盐化,矿化的的概率为62.2%;
20.当zr、th、ta、nb、hf元素含量均为低含量类、sr元素含量中高含量类时,不发生去碳酸盐化,不发生矿化的概率为82.2%。
21.前述的基于大数据关联规则算法的卡林型金矿定量找矿方法中,所述sr、zr、th、ta、nb、hf中高含量类与低含量类的界线值分别为739
×
10-6
、198
×
10-6
、4.95
×
10-6
、1.79
×
10-6
、25.7
×
10-6
、5.01
×
10-6

22.与现有技术相比,本发明具有以下有益效果:
23.关联规则算法是大数据挖掘中最活跃的研究方法之一,主要为揭示大数据集中数
据项之间的内在关联性。本研究通过关联规则算法分析卡林型金矿床全岩微量元素,建立了一套定量找矿方法。通过关联规则算法分析元素含量与金矿化的关联性、元素与金矿化的关联性,结合元素的迁移富集规律,判断元素异常组合,再将元素异常组合进行关联规则分析,建立定量找矿模型。
24.(1)经关联规则算法分析,矿床内元素异常组合划分为强正关联显著富集元素(as、sb、hg、tl、ag、w、rb),强正关联略富集元素(zr、th、ta、nb、hf),强负关联强迁出元素(sr),弱关联元素(li、ba、u、sn、bi、v、cu、co、ni、zn、cd、mo、pb),弱关联元素含量存在明显富集(mo)、略富集(cd、ni、zn、co、ni、cu、v、bi、sn)、略迁出(ba)、强迁移(li)等现象。
25.(2)从大数据角度获取的元素异常组合,与前人对矿床成因的认识一致。即au主要在去碳酸盐化和硫化作用下形成,伴随大量粘土化,其中硫化是主要成因机制。并根据元素异常组合和矿床成因建立起了去碳酸盐化找矿模型和硫化找矿模型。
26.(3)去碳酸盐化找矿模型,通过sr负异常和高场强元素zr、th、ta、nb、hf的正异常判断岩石是否发生去碳酸盐化。通过关联规则算法发现,当zr、th、ta、nb、hf元素含量均为中高含量类、sr元素含量低含量类时,发生矿化的概率为62.2%。当zr、th、ta、nb、hf元素含量均为低含量类、sr元素含量中高含量类时,不发生矿化的概率为82.2%。表明去碳酸盐化找矿模型具有不错的效果,尤其是在找矿早期。其中sr、zr、th、ta、nb、hf的异常界限分别为739
×
10-6
、198
×
10-6
、4.95
×
10-6
、1.79
×
10-6
、25.7
×
10-6
、5.01
×
10-6

27.(4)硫化找矿模型通过强正关联显著富集元素as、sb、hg、tl、ag、w、rb元素含量差异进行找矿和圈矿。当样品中这些元素的中高含量项数≥2、≥3、≥4、≥5时,或高含量项数≥1、≥1(置信度比前者低)、≥2、≥3时,样品发生矿化,对应的au含量分别为≥47.0
×
10-9
、≥150
×
10-9
、≥500
×
10-9
、≥1000
×
10-9
。其中as、hg、sb、tl、w、ag、rb等元素的低含量与中高含量界线值分别为668
×
10-6
、2.12
×
10-6
、8.51
×
10-6
、0.636
×
10-6
、2.23
×
10-6
、0.075
×
10-6
、42.7
×
10-6
,低中含量与高含量的界线分别为1939
×
10-6
、5.84
×
10-6
、24.1
×
10-6
、1.36
×
10-6
、4.63
×
10-6
、0.164
×
10-6
、98.8
×
10-6

28.(5)通过本研究中1627件验证硫化找矿模型,发现中高含量项数与高含量项数取并集或交集,整体均明显表现出含矿率提高、矿丢失率较低,正确率高、且率稳定。但取并集和取交集时,相对存在各自的优缺点。取并集时,矿丢失率低、保存量高,但含矿率和正确率略低。取交集时,含矿率和正确率高,但矿丢失率相对取交集时较高,尤其是au含量≥1000
×
10-9
时的模型组合。若仅采用中高含量项数或高含量项数判别时,找矿效果处于并集和交集之间。整体上,模型取并集,确保不漏矿。模型取交集,有效获取圈靶区,节约成本。在实际找矿和圈矿过程中,并集与交集配合使用,确保不漏矿、又高效圈矿。
29.综上所述,本发明具有去碳酸盐化找矿模型判断是否发生去碳酸盐化和矿化,具有较好效果;硫化找矿模型内中高含量项数与高含量项数取并集和交集,均表现出含矿率提高、矿丢失率较低、正确率高、模型稳定,且并集与交集配合使用,具有不漏矿、高效圈矿的有益效果。
附图说明
30.图1是滇黔桂“金三角”区域地质简图(据chen et al.,2015修编);
31.图2本发明au矿化与元素含量关联程度中的关联规则中元素在成矿前后出现的次
数图,其中x1和x2分别代表各元素低含量类和中高含量类在以a1为目标生成强关联中出现的次数,y1和y2分别代表各元素低含量类和中高含量类在以a
2-5
为目标生成强关联中出现的次数;
32.图3本发明元素异常组合中元素与au的关联度及矿化前后元素迁移富集特征图;
33.图4硫化找矿模型分析图,其中a、b、c、d、e、f、g、h分别对应
①‑
(i)、
②‑
(i)、
③‑
(i)、
④‑
(i)、
①‑
(ii)、
②‑
(ii)、
③‑
(ii)、
④‑
(ii)。
具体实施方式
34.下面结合附图和实施例对本发明作进一步的说明,但并不作为对本发明限制的依据。
35.实施例。一种基于大数据关联规则算法的卡林型金矿定量找矿方法,通过关联规则算法分析元素含量与金矿化的关联性、元素与金矿化的关联性,结合元素的迁移富集规律,判断元素异常组合,再将元素异常组合进行关联规则分析,建立定量找矿模型。
36.所述找矿模型是根据元素异常组合,分别选取强正关联显著富集元素as、sb、hg、tl、ag、w、rb,强正关联略富集元素zr、th、ta、nb、hf,强负关联强迁出元素sr,建立找矿模型。
37.所述强正关联显著富集元素as、sb、hg、tl、ag、w、rb代表的硫化和黏土化作用,为硫化作用;
38.强负关联强迁出元素sr代表去碳酸盐化作用,强正关联略富集元素zr、th、ta、nb、hf是去碳酸盐化作用引起体积减小、导致含量增加,将强负关联强迁出元素和强正关联略富集元素直接反映去碳酸盐化作用。
39.所述找矿模型包括硫化找矿模型和去碳酸盐化找矿模型。
40.所述硫化找矿模型是在卡林型金矿床内as、hg、sb、tl、w、ag元素含量差异进行找矿或圈矿;
41.当样品中as、hg、sb、tl、w、ag、rb等元素内中高含量项数≥2、≥3、≥4、≥5时,样品发生矿化,对应的au含量分别为≥47.0
×
10-9
、≥150
×
10-9
、≥500
×
10-9
、≥1000
×
10-9

42.当样品中as、hg、sb、tl、w、ag、rb等元素内高含量项数≥1、≥1、≥2、≥3时,样品发生矿化,对应的au含量分别为≥47.0
×
10-9
、≥150
×
10-9
、≥500
×
10-9
、≥1000
×
10-9

43.所述as、hg、sb、tl、w、ag、rb等元素的低含量与中高含量界线值分别为668
×
10-6
、2.12
×
10-6
、8.51
×
10-6
、0.636
×
10-6
、2.23
×
10-6
、0.075
×
10-6
、42.7
×
10-6
,低中含量与高含量的界线分别为1939
×
10-6
、5.84
×
10-6
、24.1
×
10-6
、1.36
×
10-6
、4.63
×
10-6
、0.164
×
10-6
、98.8
×
10-6

44.所述硫化找矿模型根据元素的中高含量项数和高含量项数对卡林型金矿床进行找矿或圈矿时:取并集或/和交集使用;具体的“找矿时,取并集;圈矿时,取交集”或“找矿或圈矿过程中,并集和交集配合使用”。
45.所述去碳酸盐化找矿模型是通过sr负异常和高场强元素zr、th、ta、nb、hf的正异常判断岩石是否发生去碳酸盐化。
46.所述去碳酸盐化找矿模型具体是:
47.当zr、th、ta、nb、hf元素含量均为中高含量类、sr元素含量低含量类时,发生去碳
酸盐化,矿化的的概率为62.2%;
48.当zr、th、ta、nb、hf元素含量均为低含量类、sr元素含量中高含量类时,不发生去碳酸盐化,不发生矿化的概率为82.2%。
49.所述sr、zr、th、ta、nb、hf中高含量类与低含量类的界线值分别为739
×
10-6
、198
×
10-6
、4.95
×
10-6
、1.79
×
10-6
、25.7
×
10-6
、5.01
×
10-6

50.实验证明:
51.1研究区地质背景
52.滇黔桂“金三角”大地构造位置位于扬子陆块与华夏陆块碰撞拼贴部位,同时处于扬子板块西南缘右江盆地内,是由扬子地台南缘浅水台地相碳酸盐区逐渐演化而成的一个前陆盆地(hu et al.,2002;杜远生等,2009、2013)(图1)。其东以凭祥-邕宁和武宣-永福断裂为界,西以红河-弥勒-盘县断裂为界,北以水城-紫云-南丹-宜州-永福断裂为界,南以国界为界,总面积约18.5
×
104km2(刘增铁等,2015)。
53.右江地区整体经历了早期拉张裂陷、沉积海相地层以及晚期的挤压造山和造山后的伸展拉张(hu et al.,2002;杜远生等,2013;xie et al.,2018)。早泥盆世,右江地区开始强烈拉张裂陷。在裂陷作用下,泥盆系形成了一套以硅质岩、灰岩和黑色泥岩为主的台-盆相深水沉积。随裂陷作用进行,至石炭纪已出现小规模的盆地相区,随后逐渐演化成差异明显的台地相和盆地相,大致以ne向坡坪逆冲推覆构造带为分界(图1)(陈丛林、史晓颖,2006;杜远生等,2009,2013)。坡坪断裂的西北部为台地相,主要形成浅水碳酸盐岩沉积夹少量的陆源碎屑岩沉积,金主要赋存于上二叠统和下三叠统下部地层,如泥堡、水银洞、戈塘、紫木凼等金矿床。坡坪断裂的东南部主要位于右江盆地,区域上主要形成了碳酸盐岩和碎屑岩,而随盆地相演化也形成了一定的硅质岩、泥岩和沉凝灰岩等深水盆地序列,其中中三叠统形成的陆源碎屑浊积岩,为重要的赋金层位,如烂泥沟、丫他、板其等金矿床(王砚耕等,1990;刘建中等,2017、2022、2023)。此外,杜远生等(2013)认为,石炭纪初期右江盆地和越北地块之间存在一个与古特提斯洋相关的分支洋。从晚二叠世开始,随着古特提斯洋的俯冲,右江盆地接受来自华南大陆和火山岛弧物质的碎屑供应,形成中三叠世巨厚的复理石沉积。深部的板块俯冲作用在前部沉积地层中形成了大量的褶皱和断层构造。无论台地相区还是盆地相区,金都主要赋存于灰岩、泥灰岩、钙质粉砂岩、凝灰岩和玄武岩中(刘建中等,2023)。
54.滇黔桂“金三角”内卡林型金矿床主要集中于黔西南地区(图1),主要有水银洞、烂泥沟、泥堡、板其、丫他、戈塘、架底等大型-超大型金矿床,这些矿床的金资源储量占整个滇黔桂“金三角”卡林型金矿金资源储量的大部分,从中收集的岩石微量元素数据能够较好反映整个滇黔桂“金三角”卡林型金矿床的元素特征。因此,本研究主要从以上矿床中收集岩石微量元素数据,共收集样品1756件,样品数据来源于文献数据(刘平等,2006;张敏,2008;夏勇等,2009;黄建国等,2012;韩雪,2012;写熹,2012;陈世委等,2013;毛铁,2014;王大富,2014;王疆丽2014;陈睿等,2015;韦东田等,2016;谭亲平等,2017;杨成富等,2017;赵廷严等,2017;郑禄林,2017;吴松洋,2018;文明,2018;苑顺发,2018;宋威方等,2018、2022;谢贤洋,2018;李松涛,2019;苏成鹏等,2019;张兵强等,2020;李俊海,2021;祁连素等,2021;郑禄璟,2022)和矿山勘查数据(主要为水银洞和烂泥沟超大型金矿床的化探数据)。
55.2研究方法及数据处理过程
56.2.1关联规则算法
57.关联规则(association rules)算法首先由agrawal(1993)等提出,指从事务数据库、关系数据库和其他信息存储中的大量数据的项集之间发现有趣的、频繁出现的模式、关联和相关性。它主要包括两个步骤,一是寻找频繁项集,二是生成强关联规。常用支持度(support)、置信度(confidence)和提升度(lift)来度量、筛选满足条件的关联规则(刘心怡和周永章,2019)。
58.关联规则形如a

b的表达式,其中a与b不相交。支持度也称为相对支持度,表示a与b同时发生或同事出现的概率,即support(a

b)=p(a∩b)。置信度是指a发生的条件下,b发生的概率,即confidence(a

b)=p(b|a)。提升度反映规则是否可用,表示a发生的条件下,b发生的概率,与b总体发生的概率之比,即lift(a

b)=p(b|a)/p(b)。
59.对于关联规则a

b,当a

b支持度大于设定的最小支持度时,则a

b为频繁项集。在满足最小支持度的基础上,若a

b置信度大于最小置信度,则a

b为强关联规则。获取强关联规则后,利用提升度判断强关联规则是否有效。若a

b提升度《1,则说明规则负相关,规则无增益。若a

b提升度》1,则说明规则正相关,规则有增益。
60.本研究采用经典的apriori算法,分析微量元素与金矿化之间的关联性,假设收集的样品数据中有k个元素,则可组成k-项集。主要步骤包括:(1)生成频繁项集,在满足最小支持度的条件下,先生成频繁1项集,由频繁1项集相互组合生成候选2项集,候选2项集满足最小支持度下,生成频繁2项集,频繁2项集相互组合生成候选3项集,由此迭代下去,找出所有的频繁项集。(2)生成强关联规,计算所有频繁项集的置信度,筛选大于最小置信度的规则。(3)获取有效强关联规则,即强关联规则的提升度》1。
61.上述关联规则算法的主要步骤,在spss modeler软件中完成,通过apriori算法实现。
62.2.2数据预处理
63.在利用关联规则算法对元素数据之间的关系进行挖掘之前,需对样品数据进行清洗和转换,使数据能够被计算机识别、提高运算速率、高效获取强关联规则。
64.2.2.1数据清洗
65.本研究共收集卡林型金矿床内全岩样品1756件,样品中包含了au、ag、as、ba、be、bi、cd、co、cr、cs、cu、ga、ge、hf、hg、in、li、mn、mo、nb、ni、pb、rb、sb、sc、sn、sr、ta、th、tl、u、v、w、y、zn、zr等元素。在收集的样品数据中,元素种类缺失较多的样品直接剔除,避免过多缺失值影响关联规则的支持度、置信度和提升度。样品中部分元素含量显示高于或低于检测限,这部分数据用对应的检测限代替。以上元素对应的样品数介于107个~1627个,集中分布于635个~1030个。其中be、bi、cd、cr、cs、ga、ge、in、mn、sc、y等元素对应的样品数目处于107个~522个,且除cr的数量为522个,其余元素数目均低于381个。对于数据量少的这部分元素,暂不对其进行关联分析,将其从数据库中剔除。因此,主要对数据量大的au、ag、as、ba、co、cr、hf、hg、li、mo、nb、ni、pb、rb、sb、sn、sr、ta、th、tl、u、v、w、zn、zr等元素进行关联分析研究。
66.以上步骤,使缺失值锐减,au元素无缺失值,其它元素的缺失值仅占小部分、用空值代替。因此,在以au为目标进行关联规则算法过程中,去掉缺失值,最大限度利用数据。最后,对样品数据进行去重,完成数据清洗,剩余样品1627件(表1)。
67.表1样本清洗后数据
[0068][0069]
au元素单位为ppb,其余元素单位为ppm。
[0070]
2.2.2数据变换
[0071]
数据清洗后,进行数据转换,采取k均值(k-means)聚类算法进行分类。k-means聚类算法是一种迭代求解的聚类分析算法,主要步骤包括(周永章等,2012):(1)预将数据分为k组,则随机选取k个对象作为初始的聚类中心;(2)计算每个对象与各个聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心,得到新的分组;(3)计算各新组的均值,并将平均值作为新的聚类中心,再次将每个对象分配给距离它最近的聚类中心;(4)将以上过程迭代,直至聚类中心不发生变化,从而获得最终的聚类。k-means聚类分
[0072]
析会受异常高值影响,使聚类中心偏大。
[0073]
对清洗后数据统计发现,整体上样品数据量随元素含量升高急剧减少,相对元素含量低的样品数量占大部分。若直接将数据进行k-means聚类分析,会使数值小的类包括大部分样品,而数值大的类包含的样品数量少,导致各类数据量分布不均衡,不利于关联规则分析。若进行关联分析,获取的规则大部分为低含量的元素对应低含量元素。而含高含量元素的规则支持度低,规则所包含的样品数量少,使规则不可用或可信度低。因此,需先将元素含量相对异常高的部分抽出,再将剩余数据采用k-means聚类成3类,对应元素含量低、中和高。之所以聚类成3类,是因为聚类的种类过多,会导致部分类的样品量少,关联规则分析中因低于最小支持度和最小置信度而被忽视。同时,会使生成的规则巨增,不利于找出有用规则,增加了强关联规则与卡林型金矿床实际地质特征结合分析的复杂度。
[0074]
卡林型金矿床au的异常高值界限,直接选用原生矿床的边界品位1000
×
10-9
。该值
是矿体与围岩的界限,高的部分为矿体,低的部分为围岩。au通过k-means聚类,含量被分成了0~150
×
10-9
(低含量)、150
×
10-9
~514
×
10-9
(中含量)、514
×
10-9
~1000
×
10-9
(高含量),对应样品数分别为983件、192件、100件。au低含量类中,有部分样品au含量明显高于上地壳中au的平均含量(约1.81
×
10-9
)(shaw et al.,1967、1976),表明au低含量类中有部分样品发生了矿化。矿化样品中au含量相当于是未发生矿化样品au含量的异常高值,因此通过箱型图分析获取矿化边界。
[0075]
箱型图是利用数据的最大值、最小值、中位数、上四分位数(q

)与下四分位数(q

)来描述数据的一种方法,通常将q

+1.5(q
上-q

)的值定为异高值与正常数据的界限。通过箱型图,au低含量类中得到的矿化边界值为47.0
×
10-9
。综合矿床的边界品位、k-means聚类分析和箱型图异常值判别,将au的含量分为[0,47.0)
×
10-9
、[47.0,150)
×
10-9
、[150,514)
×
10-9
、[514,1000)
×
10-9
、[1000,74900]
×
10-9
,对应样品数为841、142、192、100、352,分别代表母岩未发生矿化、低矿化、中矿化、高矿化、矿体(表2)。au分类结果符合实际地质特征,各类占比平衡,有利于关联规则算法分析。
[0076]
表2地球化学元素数据聚类特征表
[0077][0078]
[0079]
au元素单位为ppb,其余元素单位为ppm。
[0080]
此外,其它元素的异常高值也用箱型图提取,余下部分再进行k-means聚类分析,对应元素含量低、中和高三类,并将高含量和异常高的部分合并,统称为高含量类别(表2)。如as含量分为了[0,668)
×
10-6
、[668,1939)
×
10-6
和[1939,200900]
×
10-6
,分别对应的样品数为1008、292和326件。其它元素与as类似,单类样品数最少是hf和th元素高含量类别的94件和97件,其余元素单类样品数量均大于100件。以上完成元素聚类,将数据按聚类结果进行转换(表3)。
[0081]
表3转换后数据集
[0082][0083]
3.元素与金矿化关联规则分析
[0084]
通过数据清洗和转换,获取了27个元素。将处理后的数据集经apriori算法处理,生成大于最小支持度和最小置信度的规则,筛选出提升度》1的强关联规则,其中apriori算法在spss modeler软件中完成。
[0085]
3.1以au为目标的关联规则
[0086]
以au为目标进行关联规则分析,需先确定最小支持度和最小置信度。au含量47.0
×
10-9
是岩石发生金矿化的临界值,该值将数据分为未矿化(a1)和矿化(包括a2、a3、a4和a5,合并为一类,即a
2-5
)两类,其它元素依然均为3类。
[0087]
以au为目标,其余24个元素作为输入项,进行关联规则分析。关联规则分析主要分析各类之间内在关联性,即单类在其它元素类别内的对应分布情况,而各元素最多分为3类。因此,各元素单类三分之一以上的样品数据量在关联规则中出现,才能整体体现元素之间的关联性。各类在各元素内的占比中,th的高含量类(u3)占比最低为14%,其次是rb和hf
的高含量类(p3和i3)占比为15%,其余各类占比均≥18%。在进行关联规则分析,一个元素的一类要分配到另一元素的三类中,至少包含三分之一以上的数据关联的规则,才能有效代表整体的关联特征。故设置各类在各元素内的占比最低为5%,即最小支持度为5%。此外,au未矿化和矿化对应样品数为841件和786件,矿化出现的样品数占总样品数的比例常被认为发生的概率,所以发生矿化的概率为48%。经过关联规则分析后发生矿化的概率增大,才有增益,所以最小置信度设为48%。
[0088]
因此,预设最小支持度为1.5%,最小置信度为80%,最大前项为5项,最小提升度(增益)设为1。通过apriori算法分析,共获40923条强关联规则,以a1为后项的关联规则有38941条,以a2为后项的关联规则有1892条,部分规则见表4。以规则一和规则五为例,进行分析:
[0089]
规则一,即b1-y1-q1-j1-c1

a1,支持度为29.4%,置信度为93.5%。表示ag、w、sb、hg、as的含量分别处于[0,0.075)
×
10-6
、[0,2.23)
×
10-6
、[0,8.51)
×
10-6
、[0,2.12)
×
10-6
、[0,668)
×
10-6
时,au含量为[0,47.0]
×
10-9
的概率为93.5%。而au含量为[0,47.0]
×
10-6
在矿床中代表不成矿,表明在b1-y1-q1-j1-c1同时出现的情况下,不发生矿化的概率为94.03%。
[0090]
规则五,即j3-v3-b3-q3

a2,支持度为5.10%,置信度为98.8%。表示hg、tl、ag、sb的含量分别处于[5.84,5940]
×
10-6
、[1.36,164]
×
10-6
、[0.164,15.0]
×
10-6
、[24.1,328200]
×
10-6
时,au含量为大于47.0
×
10-9
的概率为98.8%。而au含量大于47.0
×
10-6
在矿床中代表矿化,表明在j3-v3-b3-q3同时出现的情况下,发生矿化的概率为98.8%。
[0091]
表4部分关联规则模型结果
[0092][0093]
3.2au矿化与其它元素关联性
[0094]
(1)au矿化与元素含量关联程度
[0095]
以au为目标,其它26个元素为输入项,通过apriori算法分析(最小支持度为5%,最小置信度为47%,最大前项为26项,最小提升度(增益)设为1,获取了591591条强关联规则,难直观获取元素异常组合。根据关联规则分析原理,与某要素关联性越强的要素,通过关联规则算法后,在生成规则中出现的次数越高。关联规则算法相当于放大镜,随着生成强规则前项数增加,与后项关联程度强的项,出现次数会以数倍、甚至数十倍的梯度增加。反
之,与后项关联程度弱的项,出现次数不变或略微增加。
[0096]
在本研究中,au的a1类代表没有发生矿化的围岩或成矿前的岩石,以a1为目标的规则中,其它元素3类(高、中和低类)出现次数相对高的项,则与围岩或成矿前的岩石关系密切。统计显示(图2),成矿前岩石中,as、sb、hg、w、rb、sn、zr、th、hf、v、nb、ta、ba、u、li、cd、mo等元素内低含量出现的次数明显高,中高含量出现的次数极低。tl、ag、cu、zn、ni、co、pb等元素内低含量出现的次数明显高,中高含量出现的次数仍然较高。bi和sr中高含量出现的次数较高,低含量出现的次数较低。反映了成矿前岩石,与as、sb、hg、w、rb、sn、zr、th、hf、v、nb、ta、ba、u、li、cd、mo等元素低含量类关联程度强、与tl、ag、cu、zn、ni、co、pb等元素低含量类和中高含量关联程度较强,与b、sr中高含量类关联程度强。
[0097]
同样,以a2-5为目标,分析其它元素各类的出现次数,获取成矿后元素之间的关联性。统计显示(图2),矿化后岩石中as、sb、hg、tl、ag、w、cu、zr、th、v、zn、ni、co、pb、cd、bi等元素内中高含量出现的次数明显高于低含量的次数,u、li、mo、sr等元素内低含量出现的次数明显高于中高含量出现的次数,rb、sn、hf、nb、ta、ba等元素内低含量出现的次数和中高含量出现的次数均较小。反映了发生矿化后的岩石:与as、sb、hg、tl、ag、w、cu、zr、th、v、zn、ni、co、pb、cd、bi等元素中高含量类关联程度强,与u、li、mo、sr等元素低含量类关联程度强,与rb、sn、hf、nb、ta、ba等元素低含量类和中高含量类关联程度均较弱。
[0098]
(2)au矿化与元素关联程度
[0099]
以上判别了au与各元素低含量类和中高含量类之间的相对关联强弱,仍需对元素与au之间的相对关联程度研究,通过获取成矿后元素中高含量类出现次数(y2)与低含量类出现次数(y1)的比值(y2/y1)、与成矿前中高含量类出现次数(x2)与低含量类出现次数(x1)的比值(x2/x1)相比判断,令比值为关联系数a,即:
[0100][0101][0102][0103][0104]
其中x1、x2、y1、y2均大于或等于0,当x1、x2、y1、y2任意一个为0时,令其为0.1,细小的变化,不影响整体关联强度判断,故a》0。若元素的x2与x1、或y2与y1值接近或较小,表示矿化前或矿化后岩石内元素低含量类和中高含量类的比例接近,元素与au可能有一定关联,但并不强。在此基础上,通过a的大小判断各元素与au的关联程度。
[0105]
当元素的关联系数a大于1时,元素与au含量呈正关联。表示在发生矿化作用过程
中,a越大,关联程度越强,元素越可能富集。
[0106]
当关系系数a等于或接近1时,元素与au含量无关联。表示在发生矿化作用过程中,元素含量几乎不变或变化不大。
[0107]
当关系系数a小于1时,元素与au含量负关联。表示在发生矿化作用过程中,a越小,关联程度越强,元素越可能流失。
[0108]
统计规则内元素出现的次数发现,sb和as的x2为0,sb、sn和tl的y1为0,均用0.1代替计算a。sn的y2和y1值均较小、hf的y2和y1接近,反映矿化后岩石内低含量和中高含量比例相近,而sn和hf成矿前主要以低含量(x1)为主,表明sn和hf与成矿有强正关联,虽计算关联系数a值,但不参与其它元素的关联系数比较。
[0109]
根据关联系数a的值(表5、图3),将其它元素与成矿(au)关联度划分为四组:(1)强正关联组,元素包括as、sb、w、hg、tl、zr、th、rb、ag,关联系数a为14763~3942450000;(2)强正关联组,元素包括ta、nb、v、sn、hf,关联系数a为4007~7804;(3)弱正关联组:cu、co、ni、ba、zn、bi、mo、cd、li、u、pb,关联系数a为1.13~1820;(4)强负关联组:元素包括sr,关联系数a为0.000162。
[0110]
关联程度越强,与au矿化越密切,而强正关联组元素和强负关联组元素与au矿化关联最强,密切参与了金矿化过程。
[0111]
3.3元素异常组合
[0112]
在矿床中,与au矿化关系密切的元素,往往表现出关联程度强,含量同步增加或降低。以au含量47
×
10-9
为界,将样品划分为矿化前后两类样品,通过矿化后元素平均含量(z2)与矿化前元素平均含量(z1)的比值(z
2/
z1),判断元素的迁移富集规律(表5、图3)。au矿化前的平均含量为8.27
×
10-9
,矿化后的2767
×
10-9
,矿化后au的平均含量是矿化前的335倍,其它元素富集程度见表5,并将元素划分为5类。即显著富集元素as、sb、ag、w、hg、tl、rb、mo,矿化后平均含量是矿化前的1.72~17倍;略富集元素cd、ni、zn、zr、co、cu、th、v、nb、bi、sn、hf、ta,矿化后平均含量是矿化前的1.06~1.27倍;含量几乎不变元素pb、u,矿化后平均含量是矿化前的0.984~1.01倍;略迁出元素ba,矿化后平均含量是矿化前的0.906倍;强迁出元素li、sr,矿化后平均含量是矿化前的0.439~0.543倍。
[0113]
结合元素与au矿化的关联程度和元素的迁移富集规律可以发现,强正关联组元素含量中as、sb、hg、tl、ag、w含量显著增加,且这些在矿床中以硫化物或赋存在硫化物的形式存在,表明硫化是主要成矿机制。强负关联组元素sr在矿化过程中大量迁出,sr与ca具有相似的性质,常以类质同象的形式存在,主要赋存在碳酸岩中,指示在成矿过程中去碳酸盐化作用强烈。此外,rb含量也显著增加,rb离子半径(0.113nm)与k(0.099nm)相近,因此rb主要分散在含k的黏土矿物上,如白云母、黑云母、伊利石。同时,黏土矿物对rb有很强的吸附作用,表明矿化过程中黏土化作用明显。以往研究显示,卡林型金矿床的成矿过程为成矿流体交代蚀变含fe碳酸盐(fe白云石),释放fe
2+
进入流体使au-hs络合物失稳,导致含砷黄铁矿(fe(as,s)2)沉淀并卸载au,从而在有利赋矿空间的岩石中形成金矿体(su et al.,2009a、2012),得出金主要以“不可见金”形式赋存于含砷黄铁矿和毒砂中(hu et al.,2002、2018;su et al.,2012、2018;xie et al.,2018),而硫化作用是主要成矿机制,伴随大量的黏土化(su et al.,2012;韦东田等,2016;谢贤洋,2018;xie et al.,2018;郑禄林等,2019)。因此,从大数据关联规则算法获取的元素关联性和富集规律,与前人对矿床成因研究的结论
是一致的。
[0114]
综上,au主要在去碳酸盐化和硫化作用下形成,伴随大量粘土化,其中硫化是主要成因机制。即赋含as、sb、hg、tl、ag、w、rb的成矿流体与赋铁碳酸盐岩发生去碳酸盐化作用溶解出铁、并与铁发生硫化作用生成硫化物或赋存于其中,同时伴随大量黏土化。此过程中,高场强元素zr、th、ta、nb、hf整体略微富集,与au矿化有强正关联,主要由于高场强元素活动受自身离子结构约束(离子电价较高、半径较小、具有较高离子场强),一般较稳定,不易受变质、蚀变和风化作用等的影响。在矿化前后岩石内高场强元素总量几乎不变,去碳酸盐化作用导致岩石体积减小,因此含量略显增加。其余元素(li、ba、u、sn、bi、v、cu、co、ni、zn、cd、mo、pb)与au矿化有关联,但关联程度整体较低,这些元素可能由于自身元素性质,迁移富集受其它机制控制,或未直接参与去碳酸盐化、硫化和粘土化作用导致。
[0115]
因此将矿床内元素划分为强正关联显著富集元素(as、sb、hg、tl、ag、w、rb),强正关联略富集元素(zr、th、ta、nb、hf),强负关联强迁出元素(sr),弱关联元素(li、ba、u、sn、bi、v、cu、co、ni、zn、cd、mo、pb)。其中弱关联元素内存在明显富集(mo)、略富集(cd、ni、zn、co、ni、cu、v、bi、sn)、略迁出(ba)、强迁移(li)等现象。
[0116]
表5元素关联系数与富集特征
[0117][0118]
z1和z2分别为成矿前后元素在岩石内的平均含量,单位为
×
10-6
。z2/z1指矿化作用后的富集程度,当z2/z1》1,为富集元素,z2/z1=1为稳定元素,z2/z1《1,为迁出元素。
[0119]
4找矿模型
[0120]
根据元素异常组合,分别选取强正关联显著富集元素(as、sb、hg、tl、ag、w、rb),强正关联略富集元素(zr、th、ta、nb、hf),强负关联强迁出元素(sr),建立找矿模型。强正关联显著富集元素(as、sb、hg、tl、ag、w、rb)代表的硫化和黏土化作用,主要是硫化作用。强负关
联强迁出元素(sr)代表去碳酸盐化作用,强正关联略富集元素(zr、th、ta、nb、hf)主要是去碳酸盐化作用引起体积减小、导致含量略增,两类均直接反映去碳酸盐化作用,将其合为一类。
[0121]
4.1硫化找矿模型
[0122]
强正关联显著富集元素as、sb、hg、tl、ag、w、rb主要在硫化作用下富集,但个别元素含量的高低难以判断是否成矿,需通过关联规则分析,获取元素含量组合,进一步判断是否发生矿化,以及矿化程度。为判断矿化程度与其它元素含量之间的关系,将au含量设置4种组合:au含量的四种组合为:

以47
×
10-9
为界,是矿化的界线(a1和a
(2-5)
),分析矿化前后其它元素含量组合特征;

150
×
10-9
为界,是中低含量界线(a
1-2
和a
(3-5)
),分析中高含量au对应的其它元素含量组合特征;

以500
×
10-9
为界,是中高含量界线(a
1-3
和a
(4-5)
),分析高含量au对应的其它元素含量组合特征;

以1000
×
10-9
为界,是矿体界线(a
1-5
和a5),分析矿体对应的其它元素含量组合特征。其它元素含量设置2种组合:(i)以中低含量界限为界,分析元素低含量类与中高含量类与不同程度au矿化之间的特征;(ii)以中高含量界限为界,分析元素中低含量类与高含量类与不同程度au矿化之间的特征。au元素的4种组合与其它元素的2种组合相互匹配,共8种组合(
①‑
(i)、
②‑
(i)、
③‑
(i)、
④‑
(i)、
①‑
(ii)、
②‑
(ii)、
③‑
(ii)、
④‑
(ii),见表6。
[0123]
表6硫化找矿模型相关信息表
[0124]
[0125][0126]
续附表6硫化找矿模型相关信息表
[0127]
[0128][0129]
利用关联规则算法建立找矿模型,需考虑每种规则,因此设置最小支持度为0.01,最小置信度为0.01,最小提升度为0,最大前项数设为7。以au为目标(后项),强正关联显著富集元素as、sb、hg、tl、ag、w、rb为输入项(前项),通过apriori算法分析。au与as、sb、hg、
tl、ag、w、rb为强正关联,通过其它元素中高含量项或高含量项出现项数判断不同矿化程度(a
2-5
、a
3-5
、a
4-5
、a5)发生的概率。as、sb、hg、tl、ag、w、rb元素中高含量项或高含量项相互组合生成关联规则,各有128条,规则内中高含量项或高含量出现项数的范围为0~7、均分别对应规则数为1、7、21、35、35、21、7、1。当规则中高含量项数或高含量项数为0时,支持度最小(《40%)。规则内中高含量项数或高含量项数为1时,支持度最大,再随项数(2~7)增加,支持度逐渐减小。同时,随中高含量项数或高含量项数(0~7)增加,置信度和增益均逐渐增大,但增大和收敛程度差异明显。其中增益具体到本文研究,指有关联规则的条件下发生矿化的概率(置信度)与样品中矿化样品占比的比值,样品中矿化样品占比不变,故增益与置信度有一样的变化趋势。且仅只有中高含量项数和高含量项数为0时,增益小于1。因此,主要分析置信度与矿化程度之间的特征。如下(图4):
[0130]
①‑
(i):中高含量项数为0,置信度低,为33.3%。中高含量项数为1,置信度大幅度提高,为64.3%~91.1%,平均为77.5%。中高含量项数为2,置信度明显增大,为76.9%~95.3%,平均为89.7%,且往后随中高含量项数对应的置信度迅速收敛。表明样品内中高含量项数≥2时,样品发生矿化的概率高,且稳定。根据大概率事件在实际生活中被认为是发生,故样品内元素中高含量项数≥2时,样品发生矿化,含量≥47.0
×
10-9
(图4-a)。
[0131]
②‑
(i):中高含量项数为0,置信度低,为1.49%。中高含量项数为1,置信度为54.1%~80.8%,平均为67.8%。中高含量项数为2,置信度为67.3%~87.6%,平均为80.8%。
[0132]
中高含量数为3时,置信度大,为77.4%~94.4%,平均为86.3%,往后随中高含量项数对应的置信度迅速收敛。表明样品内中高含量项数≥3时,样品发生矿化的概率高,且稳定。故样品内元素中高含量项数≥3时,样品发生矿化,且含量≥150
×
10-9
(图4-b)。
[0133]
③‑
(i):中高含量项数为0,置信度低,为0.75%。中高含量项数为1,置信度为38.8%~63.8%,平均为50.8%。中高含量项数为2,置信度为50.8%~74.5%,平均为63.2%。元素中高含量数为3时,置信度为55.7%~83.1%,有部分规则的置信度小于60%,平均为69.6%。元素中高含量数为4时,置信度为59.9%~86.5%,平均为73.7%,往后随中高含量项数对应的置信度有所提高,但幅度不大。表明样品内中高含量项数≥4时,样品发生矿化的概率较高,且稳定。故认为样品内元素中高含量项数≥4时,样品发生矿化,且含量≥500
×
10-9
(图4-c)。
[0134]
④‑
(i):中高含量项数为0,置信度低,为0.75%。中高含量项数为1,置信度为29.5%~49.3%,平均为39.9%。中高含量项数为2,置信度为38.2%~59.1%,平均为50.0%。元素中高含量数为3时,置信度为42.0%~70.0%,平均为55.5%。元素中高含量数为4时,置信度为45.3%~73.7%,平均为59.2%,往后随中高含量项数对应的平均置信度略增。元素内中高含量数为5时,置信度为48.1%~74.2%,平均为62.4%,此时能够确保规则置信度整体上大于60%。故认为样品内元素中高含量项数≥5时,样品为矿石,且含量≥1000
×
10-9
(图4-d)。
[0135]
①‑
(ii):高含量项数为0,置信度低,为13.2%。高含量项数为1,置信度大幅度提高,为81.9%~95.1%,平均为88.7%,此时置信度高,且稳定。往后随高含量项数增加对应的置信度高、迅速收敛。故样品内元素高含量项数≥1时,样品发生矿化,含量≥47.0
×
10-9
(图4-e)。
[0136]
②‑
(ii):高含量项数为0,置信度低,为7.17%。高含量数为1时,置信度为72.6%~92.1%,平均为80.6%。元素高含量数从0到1,置信度明显提高,且更稳定。往后随高含量项数增加对应的置信度略增、迅速收敛。故样品内元素高含量项数≥1时,样品发生矿化,且含量≥150
×
10-9

②‑
(ii)内高含量数为1时的规则的置信度明显低于
①‑
(ii)内高含量项数为1时的置信度(图4-f)。
[0137]
③‑
(ii):高含量项数为0,置信度低,为3.19%。高含量数为1时,置信度为51.8%~78.3%,平均为64.0%。元素高含量数为2时,置信度为57.7%~91.2%,平均为77.3%。可以发现高含量项数为0~1时,置信度低、不稳定。高含量项数为2时,置信度明显大幅度提高,最低的规则置信度为57.7%,且大部分规则置信度均大于60.0%。往后随高含量项数增加对应的置信度略增、迅速收敛。故样品内元素高含量项数≥2时,样品发生矿化,且含量≥500
×
10-9
(图4-g)。
[0138]
④‑
(ii):高含量项数为0~2,置信度分别为2.39%、41.4%~63.6%、47.3%~84.5%,1~2的平均置信度为53.4%、66.4%。对比发现高含量项数为0和1时,置信度低。高含量项数为2,置信度虽较大,但置信区间跨度大,有一半规则的置信度低于60%,表明规则的稳定性差。高含量项数为3,置信度为57.6%~92.0%,平均为75.4%,置信度明显大幅度提高,稳定性较好。往后随高含量项数增加对应的置信度略增、迅速收敛。故认为样品内元素高含量项数≥3时,样品为矿石,且含量≥1000
×
10-9
(图4-h)。
[0139]
综合以上,在卡林型金矿床内as、hg、sb、tl、w、ag元素含量差异进行找矿和圈矿。当样品中as、hg、sb、tl、w、ag、rb等元素内中高含量项数≥2、≥3、≥4、≥5时,样品发生矿化,对应的au含量分别为≥47.0
×
10-9
、≥150
×
10-9
、≥500
×
10-9
、≥1000
×
10-9
。当样品中as、hg、sb、tl、w、ag、rb等元素内高含量项数≥1、≥1(置信度比前者低)、≥2、≥3时,样品发生矿化,对应的au含量分别为≥47.0
×
10-9
、≥150
×
10-9
、≥500
×
10-9
、≥1000
×
10-9
。因此,可根据这些元素的中高含量项数和高含量项数对卡林型金矿床找矿圈矿。找矿时,取并集,确保不漏。圈矿时,取交集,有效圈靶区,节约成本。其中as、hg、sb、tl、w、ag、rb等元素的低含量与中高含量界线值分别为668
×
10-6
、2.12
×
10-6
、8.51
×
10-6
、0.636
×
10-6
、2.23
×
10-6
、0.075
×
10-6
、42.7
×
10-6
,低中含量与高含量的界线分别为1939
×
10-6
、5.84
×
10-6
、24.1
×
10-6
、1.36
×
10-6
、4.63
×
10-6
、0.164
×
10-6
、98.8
×
10-6

[0140]
4.2去碳酸盐化找矿模型
[0141]
强负关联强迁出元素(sr)代表去碳酸盐化作用,强正关联略富集元素(zr、th、ta、nb、hf)主要是去碳酸盐化作用引起体积减小、导致含量略增,两类元素均直接反映去碳酸盐化用。去碳酸盐化是成矿过程的中间环节,并不能直接指示au矿化,但可作为找矿标志。即发生去碳酸化部位不一定成矿,但成矿部位整体上均发生去碳酸化,去碳酸化远比金矿化范围广。因此,在区域上卡林型金矿的找矿过程中,通过寻找去碳酸盐化作用,更有可能找到金矿,是寻找深部和盲区矿床的重要标志。因此,通过sr负异常和高场强元素zr、th、ta、nb、hf的正异常判断岩石是否发生去碳酸盐化。以未发生矿化样品(au含量《47
×
10-9
)内sr、zr、th、ta、nb、hf的平均值为异常界限,分别为739
×
10-6
、198
×
10-6
、4.95
×
10-6
、1.79
×
10-6
、25.7
×
10-6
、5.01
×
10-6
。未发生矿化样品存在部分样品发生去碳酸盐化作用,因此本研究中未发生矿化样品内sr的平均值低于未发生去碳酸盐化的样品,高于发生矿化样品。同样,未发生矿化样品内zr、th、ta、nb、hf的平均值高于未发生去碳酸盐化的样品,低于发
生矿化样品。未发生去碳酸盐化的样品内sr、zr、th、ta、nb、hf含量有一定分布区间,因此本研究中未发生矿化样品的平均值能够一定程度抵消含量分布不均匀的影响,使之具有更好的判定效果。
[0142]
通过关联规则算法发现,当zr、th、ta、nb、hf元素含量均为中高含量类、sr元素含量低含量类时,发生矿化的概率为62.2%。当zr、th、ta、nb、hf元素含量均为低含量类、sr元素含量中高含量类时,不发生矿化的概率为82.2%。表明通过sr、zr、th、ta、nb、hf元素含量来找矿化异常,具有不错的效果,尤其是在找矿早期。
[0143]
5模型验证
[0144]
表7硫化找矿模型
[0145][0146]
根据元素异常组合,选取强正关联显著富集元素,强正关联略富集元素,强负关联强迁出元素,建立起了硫化找矿模型(as、sb、hg、tl、ag、w、rb)和去碳酸盐化找矿模型。去碳酸盐化找矿模型间接指示金矿化,主要通过sr负异常和高场强元素zr、th、ta、nb、hf的正异
常判断岩石是否发生去碳酸盐化,完成去碳酸盐化填图。在此基础上通过硫化找矿模型,直观判断金矿化及矿化程度。硫化找矿模型是由as、sb、hg、tl、ag、w、rb等元素创建,通过这些元素内中高含量项和高含量项出现次数组合判断。当样品中as、hg、sb、tl、w、ag、rb等元素内中高含量项数≥2、≥3、≥4、≥5时,或高含量项数≥1、≥1(置信度比前者低)、≥2、≥3时,样品发生矿化,对应的au含量分别为≥47.0
×
10-9
、≥150
×
10-9
、≥500
×
10-9
、≥1000
×
10-9
。组合特征见表7。以本研究的1627件样品为例,判断模型找矿效果(表7)。
[0147]
中高含量项数与高含量项数取并集,即au含量≥47
×
10-9
、≥150
×
10-9
、≥500
×
10-9
、≥1000
×
10-9
四个模型。经模型筛选满足条件的样品,结果发现(1)含矿率由原始的48.3%、39.6%、27.8%、21.6%分别提升到70.4%、67.8%、58.8%、52.6%,分别提升了1.46倍、1.71倍、2.12倍、2.43倍,平均1.93倍。(2)样品中含矿样品丢失率分别为5.50%、5.60%、9.70%、18.2%,保留率分别为94.5%、94.4%、90.3%、81.8%,表现出矿丢失率小、矿保留较全的特征。(3)正确剔除无矿样品和保留含矿样品的样品总数分别为1271、1302、1297、1303,正确率分别为78.1%、80.0%、79.7%、80.1%,平均为79.5%,具有稳定、较高的正确率。
[0148]
中高含量项数与高含量项数取交集,即au含量≥47
×
10-9
、≥150
×
10-9
、≥500
×
10-9
、≥1000
×
10-9
四个模型。经模型筛选满足条件的样品,结果发现(1)含矿率由原始的48.3%、39.6%、27.8%、21.6%分别提升到84.7%、78.9%、68.8%、64.1%,分别提升了1.75倍、1.99倍、2.48倍、2.96倍,平均提升了2.30倍。(2)样品中含矿样品丢失率分别为22.0%、19.9%、27.7%、44.3%,矿保留率分别为78.0%、80.1%、72.3%、55.7%,表现出矿丢失率较小、但au含量≥1000
×
10-9
时的模型组合的矿丢失率较大。(3)正确剔除无矿样品或保留含矿样品的样品总数分别为1343、1361、1354、1361,正确率分别为82.5%、83.7%、83.2%、83.7%,平均为83.3%,具有稳定、高正确率的特点。
[0149]
中高含量项数与高含量项数取并集或交集,整体均明显表现出含矿率提高、矿丢失率较低,正确率高、且率稳定。但取并集或取交集时,相对存在各自的优缺点。取并集时,矿丢失率低、保存量高,但含矿率和正确率略低。取交集时,含矿率和正确率高,但矿丢失率相对取交集时较高,尤其是au含量≥1000
×
10-9
时的模型组合。若仅采用中高含量项数或高含量项数判别时,找矿效果处于并集和交集之间。整体上,模型取并集,确保不漏矿。模型取交集,有效获取圈靶区,节约成本。

技术特征:
1.一种基于大数据关联规则算法的卡林型金矿定量找矿方法,其特征在于:通过关联规则算法分析元素含量与金矿化的关联性、元素与金矿化的关联性,结合元素的迁移富集规律,判断元素异常组合,再将元素异常组合进行关联规则分析,建立定量找矿模型。2.根据权利要求1所述的基于大数据关联规则算法的卡林型金矿定量找矿方法,其特征在于:所述定量找矿模型是根据元素异常组合,分别选取强正关联显著富集元素as、sb、hg、tl、ag、w、rb,强正关联略富集元素zr、th、ta、nb、hf,强负关联强迁出元素sr,建立找矿模型。3.根据权利要求2所述的基于大数据关联规则算法的卡林型金矿定量找矿方法,其特征在于:所述强正关联显著富集元素as、sb、hg、tl、ag、w、rb代表的硫化和黏土化作用,为硫化作用;强负关联强迁出元素sr代表去碳酸盐化作用,强正关联略富集元素zr、th、ta、nb、hf是去碳酸盐化作用引起体积减小、导致含量增加,将强负关联强迁出元素和强正关联略富集元素直接反映去碳酸盐化作用。4.根据权利要求3所述的基于大数据关联规则算法的卡林型金矿定量找矿方法,其特征在于:所述定量找矿模型包括硫化找矿模型和去碳酸盐化找矿模型。5.根据权利要求4所述的基于大数据关联规则算法的卡林型金矿定量找矿方法,其特征在于:所述硫化找矿模型是在卡林型金矿床内as、hg、sb、tl、w、ag元素含量差异进行找矿或圈矿;当样品中as、hg、sb、tl、w、ag、rb等元素内中高含量项数≥2、≥3、≥4、≥5时,样品发生矿化,对应的au含量分别为≥47.0
×
10-9
、≥150
×
10-9
、≥500
×
10-9
、≥1000
×
10-9
;当样品中as、hg、sb、tl、w、ag、rb等元素内高含量项数≥1、≥1、≥2、≥3时,样品发生矿化,对应的au含量分别为≥47.0
×
10-9
、≥150
×
10-9
、≥500
×
10-9
、≥1000
×
10-9
。6.根据权利要求5所述的基于大数据关联规则算法的卡林型金矿定量找矿方法,其特征在于:所述as、hg、sb、tl、w、ag、rb等元素的低含量与中高含量界线值分别为668
×
10-6
、2.12
×
10-6
、8.51
×
10-6
、0.636
×
10-6
、2.23
×
10-6
、0.075
×
10-6
、42.7
×
10-6
,低中含量与高含量的界线分别为1939
×
10-6
、5.84
×
10-6
、24.1
×
10-6
、1.36
×
10-6
、4.63
×
10-6
、0.164
×
10-6
、98.8
×
10-6
。7.根据权利要求5所述的基于大数据关联规则算法的卡林型金矿定量找矿方法,其特征在于:所述硫化找矿模型根据元素的中高含量项数和高含量项数对卡林型金矿床进行找矿或圈矿,具体为“找矿时,取并集;圈矿时,取交集”或“找矿或圈矿过程中,并集和交集配合使用”。8.根据权利要求4所述的基于大数据关联规则算法的卡林型金矿定量找矿方法,其特征在于:所述去碳酸盐化找矿模型是通过sr负异常和高场强元素zr、th、ta、nb、hf的正异常判断岩石是否发生去碳酸盐化。9.根据权利要求8所述的基于大数据关联规则算法的卡林型金矿定量找矿方法,其特征在于:所述去碳酸盐化找矿模型具体是:当zr、th、ta、nb、hf元素含量均为中高含量类、sr元素含量低含量类时,发生去碳酸盐化,矿化的的概率为62.2%;当zr、th、ta、nb、hf元素含量均为低含量类、sr元素含量中高含量类时,不发生去碳酸
盐化,不发生矿化的概率为82.2%。10.根据权利要求9所述的基于大数据关联规则算法的卡林型金矿定量找矿方法,其特征在于:所述sr、zr、th、ta、nb、hf中高含量类与低含量类的界线值分别为739
×
10-6
、198
×
10-6
、4.95
×
10-6
、1.79
×
10-6
、25.7
×
10-6
、5.01
×
10-6


技术总结
本发明公开了一种基于大数据关联规则算法的卡林型金矿定量找矿方法。通过关联规则算法分析元素与金矿化的关联性,结合元素的迁移富集规律,判断元素异常组合,再将元素异常组合进行关联规则分析,建立定量找矿模型;所述找矿模型是根据元素异常组合,分别选取强正关联显著富集元素,强正关联略富集元素和强负关联强迁出元素,建立了硫化找矿模型和去碳酸盐化找矿模型。本发明的找矿方法中:去碳酸盐化找矿模型判断是否发生去碳酸盐化和矿化,具有较好效果;硫化找矿模型内中高含量项数与高含量项数取并集和交集,均表现出含矿率提高、矿丢失率较低、正确率高、模型稳定,且并集与交集配合使用,具有不漏矿、高效圈矿等特点。高效圈矿等特点。高效圈矿等特点。


技术研发人员:曹胜桃 胡瑞忠 周永章 刘建中 谭亲平 高伟 郑禄林 郑禄璟 宋威方
受保护的技术使用者:中国科学院地球化学研究所
技术研发日:2023.04.22
技术公布日:2023/8/21
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐