引言
碳酸盐岩成因类型多样、岩石类型复杂。邓哈姆(1962)[1]将灰岩大致分为泥支撑灰岩(泥状灰岩,粒泥灰岩)、颗粒支撑灰岩(泥粒灰岩,粒状灰岩)、粘结岩、结晶灰岩。相比于碎屑岩的测井电性响应,碳酸盐岩的测井电性响应特征不明显,其岩性电性关系一直是测井学研究的难点。数据挖掘(DataMin-ing)是从海量数据中获取正确、新颖、有潜在价值、最终可理解模式的过程,可对样本数据进行分类和回归的数学计算[2]。岩性识别中很多工作都可归结为分类和回归问题,因此可采用数据挖掘方法对岩性识别进行研究。数据挖掘技术已被视为应对石油勘探开发未来挑战的10项关键技术之一[3-4],国外已经成功应用于油藏实时动态监测[5]、石油工程作业“最佳实践”识别[6]、油藏描述[7]等方面。本文引入数据挖掘的方法,以国外某油田碳酸盐岩储层为例,阐述该方法在碳酸盐岩岩性识别中的应用。1常规岩性识别方法在国外某油田碳酸盐岩储层中,取心井5口(共计长528m)、测井资料丰富井128口。研究层段经历了复杂的构造和成岩作用,形成孔隙度、渗透率好、非均质性强储层。但该区沉积相带的发育规律不清,制约了下一步油气预测和勘探。碳酸盐岩岩性识别是沉积相研究的基础,如何利用测井曲线开展岩性识别是研究区勘探开发面临的瓶颈问题。岩性识别的思路是通过岩心刻度测井得出岩性识别模型,对所有未取心井段进行岩性识别后,深入开展沉积相研究。依据研究层段取心井的岩心观察和镜下鉴定结果,主要识别出3种碳酸盐岩岩性类型:泥支撑灰岩(包括泥状灰岩和粒泥灰岩)、颗粒支撑灰岩(泥粒灰岩,粒状灰岩)、白云岩。取心井测井曲线类型齐全,包括自然伽马(GR)、自然电位(SP)、声波时差(AC)、深电阻率(Rd)、浅电阻率(Rs)、密度(RHOB)等,不同岩性的测井值特征不同(见表1),如白云岩的Rs平均值为305.276Ω•m、Rd平均值为1276.991Ω•m,与灰岩类的Rs和Rd值差异较明显,说明岩性对测井值具有影响,但由于测井值受到多种因素的影响,不同岩性的测井值响应整体不明显(如RHOB、GR、AC值等)。目前岩性识别中常用的方法是提取各曲线在岩心取心段相应的特征值作交会图,从交会图中提取岩性识别模型。对5口井528m取心段采用声波时差曲线AC和地层深电阻率曲线Rd取对数后作交会图(见图1)。3类岩性具有一定的分布区间,但多数据点分布散乱,且在AC值160~180μs/m和Rd值200~1000Ω•m范围内,3类岩性难以区分。测井曲线受到多种因素的影响,曲线不完全反映岩性性质,因此交会图只能是起一个定性、半定量的作用,2条曲线或者多条曲线数据并不能很好地反映储层岩性的类别,导致整体识别率偏低。同样,在二维交会图岩性识别模型的基础上采用三维图,引入声波时差曲线AC、地层深电阻率曲线Rd和密度曲线RHOB用以识别岩性,效果依旧难以得到改善(见图2)。究其缘由,该区碳酸盐岩埋藏较深,岩性受到沉积、构造及成岩作用影响很大,
2数据挖掘方法识别岩性
2.1数据挖掘数据挖掘对海量数据的分类和回归计算有很好的效果[2-4]。研究区取心井(共计长528m)识别出的岩性数据点相对有限(234个点)(见表1)。表征某一点岩性特征的测井值有多种(见表2),使得应用测井值识别岩性的数据变得较为庞大,研究应用数据挖掘方法处理庞大测井数据后隐藏的岩性信息,取得了较好的效果。根据石油地质领域及数据挖掘领域研究和应用情况,主要采用决策树[8-10]、神经网络[11]、支持向量机[12]、贝叶斯网络[13-14]这4种方法,研究发现,决策树C5.0算法具有较好的识别准确率和可操作性。(1)决策树。决策树技术是数据挖掘中用于分类和预测的主要技术。决策树算法是以实例为基础的归纳学习算法,主要从1组无规则、无次序事例中推理出决策树表现形式的分类规则。其以树型结构表示分类、决策集合,寻找数据库中具有最大信息量的字段,建立决策树的1个结点,再根据字段的不同取值建立树的分枝,整棵树就对应着1组表达式规则。其方法与判别分析、聚类分析、非参数统计以及非线性估计的功能一样,但其设置形式灵活、应用方便。常用决策树算法有CLS算法、ID3算法、C5.0算法、CART算法、SLIQ算法、SPRINT算法、PUBLIC算法等。(2)人工神经网络。人工神经网络从结构上模拟人脑神经元方法,是一种通过训练来学习的非线性预测模型,可完成分类、聚类、特征挖掘等多种数据挖掘任务。在数据挖掘中主要采用前向神经网络提取分类规则,重点是解决2个问题:知识表达和知识获取,前者是使神经网络中抽象的权值代表一定的知识,后者是给定一个已经训练好的神经网络,从中提取显示的知识。神经网络具有丰富的假设空间,对训练数据中噪声很敏感,因此网络结构、结点数目和训练参数的设置非常重要。(3)支持向量机(SVM)。支持向量机对解决小样本、非线性及高维模式识别问题有优势。它是从线性分类面发展而来,利用核函数把数据转变成高维向量空间,寻找这类空间中的关系,解决了非线性问题。其在数据挖掘领域引入了许多核函数,包括kLinear、kGaussian、超正切函数、多项式函数和形函数,为复杂的分类问题带来高度准确的结果。(4)贝叶斯网络(BN)。贝叶斯网络模型是一个带有概率注释的有向无环图,能表示大量集合的联合概率分布,利用贝叶斯方法的学习和统计推断功能,实现预测、分类、聚类、因果分析等数据挖掘任务。素贝叶斯分类器是最简单的一种贝叶斯网络,它假定属性之间相互独立,可用于处理大量数据分类问题。根据实际数据,选取5条常规测井曲线作为参数:声波时差曲线AC,密度曲线RHOB,地层深、浅电阻率曲线Rd和Rs及自然伽马曲线GR。对以上4种数据挖掘方法进行建模识别结果见表3。从表3中可以看出,以上4种方法中决策树C5.0算法识别正确率最高,达到了79.91%。考虑到决策树生成的规则具有较高的可操作性,最终选择了决策树C5.0算法作为研究区碳酸盐岩岩性的识别方法。决策树C5.0算法采用基于最大信息增益率(IGR,InformationGainRatio)的方法来选择参数。信息增益率等于信息增益[Gain(S,A)]对分割信息量的(SI,SplitInformation)的比值。设样本集S是n个数据样本的集合,按离散属性(参数)A的c个不同取值划分为SB1B,SB2B,…,SBcB共c个子集,c=1,2,…,c,每个类cBiB中含有的样本数目为nBiB。则用A对S进行划分信息增益率为
2.2决策树加构造参数岩性识别在以上4种方法识别正确率中,决策树具有较高的整体识别正确率最高,但不同岩性类别的识别准确率不尽相同,各类之间的识别正确率存在较大差异(见表4)。在白云岩的71个数据点中,可以正确识别出70个点,正确率达到98.59%。但颗粒支撑灰岩的正确识别率只有60%,实用性较低,因此须采用其他方法提高此类岩性的识别正确率。依据各测井曲线对岩性响应的不同,构造了Rd/Rs和Rd/AC这2个参数,放大岩性对测井曲线的影响。其原理为当地层中存在裂缝和溶洞时,钻井泥浆侵入后,浅电阻率会迅速降低,而深电阻率影响很小,此时Rd/Rs的值会比在没有裂缝或者溶洞的地层中变大;Rd/AC亦是如此变化,当碳酸盐岩地层中有裂缝和溶洞的时候,声波值会忽然变大,甚至会出现周波跳跃,而深电阻率值变化很小,此时Rd/AC的值会比在有裂缝和溶洞的地层中变小。应用该方法,颗粒支撑灰岩识别准确率从60%提高到84.71%,而泥支撑灰岩识别正确率也提高达到85.90%,大幅度提高了岩性识别的准确率(见表5)。
2.3岩性解释应用应用该方法对研究区未取心的井进行岩性识别和沉积相研究。对5口取心井的沉积层序分析得出,研究层段可划分出层Ⅰ和层Ⅱ等2套碳酸盐岩开阔台地相地层,分别对应1个三级层序的海侵体系域(TST)和高位体系域(HST),TST内发育2期水体变深的沉积旋回,HST内发育2期水体变浅的沉积旋回(见图3),利用GR、AC、Rd、Rs、RHOB等5类测井曲线,按照决策树加构造参数(Rd/Rs和Rd/AC)方法建立岩性识别模型,对井1至井4进行了岩性和沉积相划分(见图3):识别出以颗粒灰岩为主的滩相沉积和以泥晶灰岩为主的滩间相沉积,层Ⅰ(TST)和层Ⅱ(HST)分别发育2期滩体,对应4期沉积旋回,比较而言,HST内2期滩体的厚度、连续性都较好,反映了相对海平面的下降和水体的变浅,与岩心井观察的沉积层序发育规律相似,这也佐证了决策树加构造参数方法建立碳酸盐岩岩性识别模型的有效性。
3结论
(1)碳酸盐岩岩性复杂,测井参数电性响应不明显,采用常规的交会图方法难以有效识别岩性;数据挖掘方法在碳酸盐岩岩性识别中具有很好的应用效果,通过对比以决策树、人工神经网络、支持向量机和贝叶斯网络为代表的数据挖掘方法,发现决策树具有较高的识别正确率。(2)引入决策树方法能较好地识别岩性,但是在没有对输入参数进行处理前,决策树方法适用性有所欠缺;通过对参数进行优选(构造新参数Rd/AC和Rd/Rs),岩性识别准确率得到有效提高,碳酸盐岩岩性识别更为准确,可为储层沉积相解释提供更准确的地质信息。(3)地质、测井知识和数据挖掘方法的结合应在专业知识为指导的基础上进行数据整合与处理真正做到从数据中挖掘出更有价值的岩性信息。
根据观察,这些资讯都是值得各位作者朋友参考的,所以希望大家多做研究了解,以便在职称的道路快速前行!