装备环境工程 ・第lO卷第5期 70・ EQUIPMENT ENVIRONMENTAL ENGINEERING 2013年10月 Bootstrap方法在小样本随机振动环境测量数据 归纳中的应用研究 张建军,孙建勇,常海娟 (中国航空综合技术研究所,北京1 00028) 摘要:针对传统正态容差上限方法在确定平台振动环境条件时,不适合处理小样本卖测数据统计归纳 的问题,提出了利用Bootstrap法对测量样本重采样,进而统计归纳振动环境条件的计算方法。首先利用 Bootstrap法对来自正态分布的试验数据进行容差上限估计,通过与真值的对比分析,验证各种自助置信区 间估计方法的适用性,而后提出使用纠偏百分位法和Bootstrap—t法对小样本振动测量数据进行归纳。最 后,分别对某型飞机实测数据进行了统计归纳,并与传统容差上限估计方法进行了对比分析。 关键词:Bootstrap方法;小样本;数据归纳 D0I:10.7643/issn.1672-9242.2013.05.015 中图分类号:TBll4 文献标识码:A 文章编号:1672—9242(2013)05—0070—07 Application Research of Bootstrap Method in Small Sample Measured Data Reduction 0f Random Vibration Environment ZHANG Jian--jUrl,SUNJian—yong,CHANG Hai-juan (China Aero-polytechnology Establishment,Beijing 100028,China) Abstract:Traditional norma1 upper tolerance limit method iS not suitable for statistical reduction of measured small sample data in determination of vibration environmental condition of platform.A calculation method to statistically reduce vibration environmental condition by using Bootstrap method resampling on measured specimen.Upper tolerance limit of test data with normal distribution was estimated using Bootstrap method.The applicability of confidence interval estimation methods was veriied fthrough comparison with true values.Bias-corrected bootstrap method and bootstrap—t method were put forward for statistical reduction of measured small sample data.The upper tolerance limits of vibration were estimated and compared by the above method and the traditional computation methods using flight measurements of some aircraft. Key words:bootstrap method;small sample;data reduction 18A附录中规定了有测量数据时确定 随着GJB 150A的颁布实施,需要优先考虑使用 验。GJB 150. 实测数据来确定振动环境条件,并据此进行振动试 极值环境条件的方法,如单边正态容差上限(NTL)收稿目期:2013-06—22 作者简介:赵铁山(1989~),男,浙江绍兴人,硕士研究生,主要研究方向为弹药可靠性与失效分析。 第10卷第5期 张建军等:Bo。tstrap方法在小样本随机振动环境测量数据归纳中的应用研究 。71・ 和正态预测上限(NPL)等参数上限方法,包络上限 …,X ),来自未知的总体分布F,R(x,F)为总体 (ENV)、自由分布容差上限(DFL)和经验容差上限 分布F的某个分布特征,它是x和F的函数。现要 , 。,…, )估计R(X,F)的某 (ETL)等非参数统计方法。国内于2000年实施的 求根据观测样本x=(GJB/Z 126—99中提出的统计容差法是对一定样本量 个参数(如均值、方差或分布密度函数等)。例如, 是观测样 下服从正态分布的振动数据进行统计归纳的方法。 设0=0(F)是总体分布F的某个参数,在工程实际中,某些飞行状态不具备实测条件或历 本x的经验分布函数,0=0(F )是0的估计,记 史飞行资料较少时,环境数据统计归纳样本量较小, 估计误差为: 已有的各种环境测量数据方法得到的振动试验条件 大都偏于严酷,与实际的随机振动环境相差较大,无 法反映产品实际经历的随机振动环境。 综上所述,目前大部分常用振动实测数据统计 归纳方法对统计特征量的概率分布和统计样本量均 有一定要求,而飞行环境实测样本受型号研制周期 和研制经费很难满足以上要求。文中尝试利用 自助抽样算法对概率分布特性未知、样本量较小的 实测数据进行二次抽样,借鉴目前国内常用的正态 容差上限法使用P99/90或P95/50准则确定随机振动 环境条件。 1977年,美国Stanford大学统计学教授Efron在 前人研究成果的基础上提出了一种新的增广样本统 计方法,即Bootstrap方法,为解决小子样数据归纳问 题提供了很好的思路” 。Bootstrap法是用现有的样 本资料去模仿未知的分布,直接利用试验数样本据 确定先验分布。该方法能充分利用子样本身的信 息,对于总体分布不需要做出假定。近年来, Bootstrap法在均值估计、标准差估计、回归分析、区 间估计、假设检验和交叉验证等范围内得到广泛应 用 。文献[8】中W.O.Hughtes等人对大力神一IV号 仪器舱整流罩发射阶段声振数据分析时,分别利用 NTL的P95/50,P99/90原则和Bootstrap法等2种不同 的方法归纳得到相近的声振环境条件。 下面首先介绍Bootstrap方法的基本原理和基于 Bootstrap的5种参数置信区间估计算法;然后,提出 实现Bootstrap统计归纳振动环境数据的算法流程; 最后通过仿真确定适合随机振动测量数据容差上限 估算的最佳区间估计方法,并在某型飞机外场实测 数据统计归纳中进行应用。 1基本原理 Bootstrap方法的数学描述:设随机样本 ( R(X,F)= (F )一 (F)垒 (1) 现要由观测样本 ( ,X2,…,X )估计R(x,F) 的分布特征,显然此时 (x,F)的均值和方差分别为 0(F)估计误差的均值和方差。Bootstrap方法的实 质就是一个再抽样过程,通过对观测数据的重新抽 样产生再生样本来模拟总体分布,计算尺(x,F)分布 特征的基本步骤归纳如下。 1)根据观测样本x:( X ,…,Xn)构造原始样本 经验分布函数 : f? F ( )=2【 ≤ < ≥ 式中:X(纵 )1]≤ ( 2J≤…≤ ㈤,是将原始样本 () 。, X:,…,Xn)按从小到大顺序排列,所得到的样本次序 + 统计量 ㈩, I2J,…,_ ㈨。l: 2)用仿真法从 中随机抽取JV组样本 (f)= ( ,3C2 ,…, :),j=l,2,…,JV,此再生样本称为 l一 Bootstrap样本,自助样本维数为 。 3)计算Boot/ strap样本统计量: 2 R (X ,F )=0( )一0(F )・R (3) 式中: 是Bootstrap样本的经验分布函数;尺 表 示 的Bootstrap统计量。由于通过小样本试验不可 能得出0(F),所以采用0(F )近似代替0(F)。 4)用R 的分布去模拟 的分布。即有0(F) (F )一 ,可以得到Ⅳ个0(F)的样本,即可统计 求出未知参数0的分布及其特征值。 2参数置信区间估计 在总体分布未知的情况下,Bootstrap抽样提供 了经典统计方法难以实现的区间估计方案。利用上 面的分布 ,将 ( )简记为 (), =1,2,…, ・72・ 装备环境_T程 2013年l0月 Ⅳ,下面使用5种方法估计未知参数0的置信区间。 算完成,定义: 2.1正态近似法 正态近似法是利用当0 的分布服从或近似服从 6。= 一 【 1 N舶 (J-))】 式中: (7) 为标准正态分布函数的反函数;,(・) 正态分布的特点,计算出~组自助样本均值 和方 为示性函数,其定义如下:差Var(0 ),设定显著性水平 ,0的(1一 )标准 I(0 ( )):I1,? ( ))<0 (8) Bootstrap置信区间为: [0 ——Z1一 ̄2Var(0 ),0 +ZI_ ̄2Var(0 )] (4) 其中Zj_ 为标准正态分布的(1一号)百分 数。 2.2百分位法 百分位法是利用Bootstrap经验分布的第 /2和 1一 /2分位点分别是在(1一 )置信水平下统计量0 置信区间上、下限的一种估计方法。即将b (. )按 从小到大的顺序依次排列,可以得到顺序统计量 0 ( ),k=l,2,…,J7v,则(1一 )下统计量0的置信 区间的上、下限为: [b ( ), (( 一詈)Ⅳ)】 (5) 2.3 百分位法 一百分位法是在对百分位Bootstrap方法改进的 基础上得到的,分别计算原样本和自助样本标准差 估计 ̄/Var(b ), ̄/Var(b ()),针对每组自助样 本,计算t统计量,即t =(0 ( )一0)/  ̄/Var(b ( )),j=l,2,…,J7v;然后将ti 依大小顺序 排列。获得参数0置信度为(1一 )的Bootstrap区间 估计为: [0一tN .(1训)・JVar( ),0一tN 们・ ̄/Var(b)] (6) 2.4纠偏百分位法 应用上述3种区问估计方法时,如果出现大部 分Bootstrap估计量b ()小于0,这就意味着 Bootstrap模拟“低估”了 ,为了纠正这一偏差,置信 边界必须向大值移动。这个过程通过纠偏量易。的计 tO,0 ( ))>0 考虑纠偏后,可构造纠偏百分位估计的置信区 间[0 (N・P ),0 (N・P )],其中P。= (Z + 2b。);P:= (Zl-a/2+2b。); (・)为标准正态分布函数; z 为标准正态分布分位数。 2.4纠偏加速百分位法 纠偏加速百分位法是在纠偏百分位法基础上使 用加速参数a进行修正。计算步骤如下: 1)利用刀割法剔除第i个观测样本后得到样本 特征估计值0(i),i=1,2,…,n; 2)计算上述 个0(i)的平均值,记为0(・)= '-…2( ); 一 3)根据式(9)计算加速参数a的估计结果: 口:—五一 —: ———— (\ 9) 6【∑(( (・)一 ( )) 4)执行纠偏百分位法,获得偏差修正参数b0; 5)根据如下公式计算修正后的第a/2和1一 /2 分位点系数参数: [60+ 】(10) [60+等 ](11 同百分位法,第a/2和1一a/2分位点分别是 在(1一 )下统计量0的置信区间的上、下限 [0 ( N),0 ( N)]。 3基于Bootstrap法的随机振动环境 测量数据归纳流程 在获得飞行实测数据后,需要经过样本选取、数 第1O卷第5期 张建军等:Bootstrap方法在小样本随机振动环境测量数据归纳中的应用研究 。73・ 据预处理分析和集合检验,方可计算得到飞机平台 计量 =/Xb + O"b ; 某区域的功率谱密度样本。然后利用预先给定的概 5)重复3),4)步Ⅳ次,JV≥1000; 率值和置信度,采用各种区间估计方法进行容差上 限估计,就可确定该平台区域振动环境条件,如公式 (12)所示。 x (Jv, ,13)= +z (12) 6)计算JV组自助统计特征参数 ( ),j=l, 2,…,J7V,给定置信度 ,利用上述置信区间估算方法 计算上限 (Ⅳ,.y, )。 使用如上提出的Bootstrap参数置信区间估计 法,进行某一频率点随机振动环境测量数据的上限 估计,详细步骤如下。 1)输人多次测量功率谱密度 D=( D , PSD ,…,PSD.),计算样本均值 和方差无偏估计 2 7)估算所有频率点容差上限,获得随机振动实 测谱。 4仿真验证分析 为了对比目前常用参数上限估计方法与上述各 or ; 种基于Bootstrap的参数置信区间估计方法在小样本 进行下面的验证 2)根据 :一PSDi-I ̄规范化所有频点谱密度 随机振动测量数据归纳中的优劣,模拟计算。 or 数据,拟合经验分布函数,给定概率值 ,确定等效 P99或P95分位点z口数值; 假定功率谱密度样本服从对数正态分布x=lg PSD~N(一2,0.5 )。从中随机抽出10组容量为10的 3)以原始谱密度为基础进行再抽样,获得 子样,采用3类方法分别计算实测功率谱谱密度的 P99/90置信上限,概率为0.99的母体容差上限真值 1个Bootstrap样本PSDb=(PJSD “,PSD;“,…, PSD, ̄ ),计算Bootstrap子样样本均值 和方差无 偏估计 : 查标准正态分布表为一0.8368。其中自助抽样为 2000组,将各组子样的均值和标准差、估算结果及与 真值偏差见表1,估算偏差比较如图1所示。 表1和图1中NTL表示使用GJB150A中单边容 4)由Bootstrap自助样本PSD ̄,构造Bootstrap估 表1各组正态分布子样数据均值、标准差和上限估算结果 Table 1 Estimation results of mean value,standard deviation,and upper limit ・74・ 装备环鬻敞早} 0 0 0 O 0 样本序哆 图1不同归纳方法上限估算偏差比较 Fig.1 Comparison of upper limit estimation elTor by different reduction method 差上限方法的计算结果,GJB/Z 126表示使用了 标126中针对随机振动测量数据容差上限系数计算 的结果,Bootstrap方法分别使用了5种置信区间估计 方法获得容差上限。从图1中各种估算方法与真值 偏差绝对值可以清晰看出,与容差上限真值一0.8368 相比,百分位法和 一百分位法容差上限估算结果与 真值最相近,其余估算方法与真值相近程度从d,N 大依次为纠偏百分位法、纠偏加速百分位法、正态近 似法、NTL法和GJB/Z 126—99方法。尤其是从NTL 和GJB/Z 126方法估算结果可以看出,二者估算值远 大于母体真值,平均偏差分别高于真值35%和 52%。可见在小样本条件下,常用的参数上限估算 方法确定的P99/90容差上限严重偏离实际情况,已 不适用于随机振动环境数据测量归纳。 从表1中估算值与真值的偏差正负可以看出, 纠偏百分位法、纠偏加速百分位法、正态近似法、 NTL法和GJB/Z 1 26方法均大于真值,而百分位法和 f一百分位法容差上限部分估算值低于母体真值。由 于采用百分位法和t一百分位法中低于母体真值的估 算值确定环境条件,可能无法保证经过该条件考核 的产品能够完全耐受极端振动环境应力,因此文中 优先选用自助纠偏百分位法用于小样本下随机振动 环境测量数据归纳。为了能充分利用最接近母体真 值的f一百分位法归纳测量数据,经过多次抽样模拟 计算,发现将Bootstrap方法估算置信度提高后,f一百 分位法的估算结果不仅逼近母体真值,并且全部分 布于大于母体真值的范同内。 分析图1中数据可以发现,所有容差上限估算 境丁程 2013年10月 方法无一例外地受到了子样信息优劣程度的影响, 即子样统计特征能否较好地反映总体特征的影响。 如第6组样本和第8组样本,样本方差和均值分别严 重偏离了母体方差和均值,相应各种估算方法获得 的容差上限值均偏离真值,尤其是NTL方法和GJB/ Z 126方法对子样信息的优劣程度最为敏感。由此, 受正态分布中小样本抽样的局限性,各个归纳方法 的估算偏差与样本量之问的关系在后续应用实例中 进行研究。 综合以上分析,文中选择自助纠偏百分位法和 卜百分位法用于小样本下随机振动环境测量数据归 纳。 5应用实例 现获取某飞机舱段某飞行状态区问内90条谱 样本数据,依次从中任选5条、l0条、20条、50条和 90条样本分别使用NTL、GJB/Z 126法、自助纠偏百 分位法和Bootstrap—t百分位法估算实测谱上限,其 中假设使用90条谱样本估算的容差上限为实际真 值。为了对比各种估算方法在实测数据归纳中的应 用效果,计算各实测谱的均方根及与真值偏差见表2 和如图2所示 琳 样本个数 冈2 4种归纳方法估算实测谱均方根偏差比较 Fig.2 Comparison of spectrum RMS error of 4 reduction meth— ods with measured value 在Bootstrap方法中确定等效分位点值时,为避 免某一特定频段数据样本太少导致制作的直方图精 度较差问题,将所有频段样本规范化后进行混合,最 终确定选用不同数量谱样本时P99分位点值。 选取谱样本数据量分别为5和90时,各方法归 纳实测谱如图3和图4所示。 对比表2和图2中估算结果可以看出,在样本数 第l0卷第5期 张建军等:Bootstrap方法在小样本随机振动环境测量数据归纳中的应用研究 ‘75・ 表2不同母样本数时各种方法估算的实测谱均方根 Table 2 Measured speetmm RMS with estimation by diferent methods for different sample number 实测 …=0.389 04样本个数=5 l 二、 1 实测谱g…=0.345 63样本个数:5 一 . )/ 悔密 捌器 一 池 誊 景 l l00 l0 频率/Hz b GJB 126法估箅结果 实测谱g~=O.264 77样本个数=5 ? l I ● - 一 ~ \ 、 枢 翘 测瓤 能 是 星 频率/Hz 频率/Hz 白助纠偏玎分化法估算结果 d匀助t—wN-分位法估算结果 图3谱样本数为5各种方法谱密度容差上限估算 Fig.3 Upper limit estimation of spectrum density tolerance by 5 methods when sample number is 5 为5时,NTL法、GJB/Z 126—99法计算谱密度上限远 随着样本数从5增加到90时,各种估算方法均 高于实际值,尤其是NTL法估算得到的实测谱均方 不断逼近真值。当样本数取lO时,自助法基本靠近 根基本比实际值高约40%。自助法估算结果与实际 真值,均方根值比真值仅高3%,而NTL法和GJB/Z 值相近,所估算均方根值仅比实测值低约5%。同 126法分别比真值高23%,15%;当样本个数增加到 时,在该样本量下,还可在自助法中通过提高置信度 50时,GJB/Z 126和自助法估算结果之间基本无差 获取更为准确的估计结果,例如使用P99/93原则。 别;当样本量达到90时,4种方法估算结果之间已无 ・76・ 装备环境工程 二、 lN =、 }N ● ● 一 \ 一 \ 链 船 量 暑 频率/Hz 频率/Hz b GJB 126法估算结果 a NTL法估算结果 =、 I二、 IN N 墨 ● ● 一 一 、 、 魁 枢 艇 魁 口 枢 楔 R 昌 频率/Hz t 频率/Hz d自助t一百分位法估算结粜 白助纠偏 分位法估算结果 图4谱样本数为90各种方法谱密度容差上限估算 Fig.4 Upper limit estimation of spectrum density tolerance by different methods when sample number is 90 差别。说明随着实测样本量的增加,Bootstrap方法 采用了二次抽样技术,增加了样本容量,与传统的参 的优势降低,4种方法估算结果差异逐渐变小,同时 数容差上限法相比,提高了小样本情况下的估计精 由于Bootstrap方法相对NTL法和GJB/Z 126—99法 度,可为平台振动环境条件的确定提供一个新的选 计算量偏大,此时不建议使用。在样本数较小时(如 择。在各种自助方法中,Bootstrap纠偏百分位法和 strap—t百分位法相对更靠近真值,误差更小,一 10),将NTL法和GJB/Z 126法用于随机振动环境数 Boot据归纳,最终确定的振动环境条件将比实际情况偏 定程度上克服了实测样本量小的缺点,具有较强的 严酷,从而会造成对产品的过设计或过试验甚至造 推广应用空间。 成破坏性,而Bootstrap方法估算值更接近工程实际, 因此可作为一种小样本下随机振动环境测量数据归 参考文献: 【1]EFRON B.Bootstrap Meth0ds:Another Look at the Jackni ̄ 纳的参考方法。 fJ】.TheAnnals ofStatistics,1979,7(1):1—26. 6结论 讨论了小样本下振动实测数据容差上限估计的 非参数Bootstrap方法,通过仿真和实例应用分析,可 得到以下结论。 Bootstrap方法无需假设参数的先验分布特性, [2】EFRON B,TIBSHIRANI R.An introduction to the bootstrap 【M】.New York:Chapman&Hall Ltd,1993. 【3】李洪双,吕震宙.小子样场合下估算母体百分位值置信 下限和可靠度置信下限的Bootstrap方法[J】.航空学报, 2006,27(5):789—794. f41万越,吕震宙,范字.小子样疲劳寿命分散系数置信区间 (下转第80页) ・8O・ 装备环境工程 2013年10月 特别指出的是AB中2种缓蚀剂浓度之和必须与A, 避免二者混合使用,至于二者抑制机理还有待进一 B单独作用时的浓度相等。当S>I时,有缓蚀协同作 步研究。 用;当S<1时,有拮抗作用;当S=I,无任何相互作 用。总质量浓度为500 mg/L时,不同浓度比的缓蚀 参考文献: 剂复配后对应的效应系数结果见表4。 表4复配后效应系数 Table 4 Effect coefficient after combination [1】MU Guan-nan,LI Xiang-hong,QU Qing,et a1.Synergistic Efect on Corrosion Inhibition by Cerium(IV)Ion and Sodium Molybdate for Cold Roned Steel in Hydrochloric Acid Solution[J].Acta Chimica Sinica,2004,62(24): 2386--2390. P(葡萄糖酸钠)/(mg・L )P(Na MoO )/(mg・L )rt/% S [2]杨敏.钢在干湿交替下的大气腐蚀[J].装备环境工程, 2010,4(4):6—9. [3]吴荫顺.电化学保护和缓蚀剂应用技术[M】.北京:化学工 业出版社,2006. [4]李乃胜.葡萄糖酸钠与苯甲酸钠体系对铸铁片缓蚀协同 研究『J】.腐蚀科学与防护技术,2012,24(4):314—318. [5】李言涛.羧甲基壳聚糖与其他缓蚀剂的协同缓蚀作用【J】 装备环境工程,2010,7(1):1—5. 【6] MU Ouan-nan,LI Lin.The Corrosion Inhibition Synergism 由表4反映出的数据可以看出, 均小于1,说明 of Rare Earth Cerium(1V)ion and Anion—surfactant 葡萄糖酸钠与钼酸钠之间存在拮抗效应,该2种缓 蚀剂不适宜进行复配。因为复配后不仅缓蚀效率没 Formild Steel[J].Corrosion and Protection.2000。2 1(8): 351—352. 有提高,反而对缓蚀剂作用的发挥产生抑制。 【7】陈旭俊.孔蚀缓蚀剂及其理论研究评述一铁基合金孔蚀 缓蚀剂与缓蚀作用理论『J1.材料保护。1991,24(6):6. 【8】于丽花.环境友好型钼酸盐三元缓蚀剂的复配研究【J】. 水处理技术,2010,36(10):53—55. 【9 房娟娟.钼酸盐缓蚀剂研究进展及发展趋势【9】J】.山东化 工,2008,37(11):17—19. 3结论 1)葡萄糖酸钠是一种阴极型缓蚀剂,其质量浓度 为0~500 mg/L时,在3%NaC1溶液中对10CrSiNiCu 【1 o]李玉明,刘静敏.钼酸盐与磷酸盐、硅酸盐复配缓蚀剂的 低合金钢的缓蚀效率随浓度的增大而增大。 研究『J1.腐蚀与防护,2004,25(6):248—251. 2)钼酸钠是一种阳极型缓蚀剂,其质量浓度为 『l11刘福国,杜敏.复合缓蚀剂在3l%NaC1溶液中的缓蚀性 0 1000 mg/L时,在3%NaC1溶液中对lOCrSiNiCu低 能『J1.腐蚀与防护,2007,28(10):523—524. l21成雷.ce盐与葡萄糖酸钠在3.5%NaC1溶液中对碳钢的 合金钢的缓蚀效率随浓度的增大先增大后减小。当 【浓度为500 mg/L时,缓蚀效率为94.73%。 3)葡萄糖酸钠与钼酸钠复配后有拮抗作用,不 利于二者缓蚀作用的发挥,因此在使用缓蚀剂时,应 缓蚀作用『J]_南京工业大学学报,2010,32(6):16一l9. 【l3]罗立新,江勇,郭云霞.宝浪油田腐蚀因素及防护技术研 究与应用fJ1.河南石油,2003,17(3):40—43. (上接第76页) 法研究【D】.南京:南京理工大学,2006. 7】谢桂华,张家生,刘荣桂.沉降计算系数的Bootstrap法置 随应力的变化规律研究『J1.航空计算技术,2009,39(1): 【信区间估计[J1.中南大学学报,201 1,42(9):2843--2847. 8一l4. 8】WILLIAM O H,THOMAS L P.Application of the Bootstrap 【5】胡正东,夏请,张士峰,等.导弹精度评估的非参数 [Statistical Method in Deriving Vibroacoustic Specifications Bootstrap方法『J1.飞行器测控学报,2007,26(5):73—77. 【6】董满才.多管火箭落点分布和射程与密集度试验评估方 Ⅲ.NASA/TM,2006.