中国测试  2019, Vol. 45 Issue (8): 156-160

文章信息

杨金鹏, 连光耀, 李会杰
YANG Jinpeng, LIAN Guangyao, LI Huijie
温度载荷条件下的新装备故障模式影响及危害性分析
Failure mode effect and critically analysis of new equipmen under thermal loadings
中国测试, 2019, 45(8): 156-160
CHINA MEASUREMENT & TEST, 2019, 45(8): 156-160
http://dx.doi.org/10.11857/j.issn.1674-5124.2018050089

文章历史

收稿日期: 2018-05-29
收到修改稿日期: 2018-08-02
温度载荷条件下的新装备故障模式影响及危害性分析
杨金鹏1,2,3 , 连光耀2 , 李会杰2     
1. 陆军工程大学石家庄校区导弹工程系,河北 石家庄 050003;
2. 中国人民解放军32181部队,河北 石家庄 050003;
3. 中国人民解放军75833部队,广东 广州 510000
摘要:针对由于新装备历史数据缺乏、依赖人工分析导致测试性试验样本存在主观性和盲目性等问题,在现有方法的基础上提出温度载荷下的的故障模式影响及危害性分析方法。首先,分别建立元器件和焊点在温度载荷下的失效模型;然后,提出基于元器件、焊点融合失效模型的典型故障模式的失效概率计算方法;最后,将元器件和焊点加速退化试验数据带入融合失效模型进行计算实现最终分析。试验结果表明:该方法可对现有故障模式影响及危害性分析方法提供有效补充和修正,充分暴露产品测试性设计缺陷并为测试性设计改进工作提供支持。
关键词故障模式影响及危害性分析    性能退化    加速退化试验    热失效    
Failure mode effect and critically analysis of new equipmen under thermal loadings
YANG Jinpeng1,2,3 , LIAN Guangyao2 , LI Huijie2     
1. Shijiazhuang Campus of Army Engineering University Department of Missile Engineering, Shijiazhuang 050003, China;
2. 32181 Force of PLA, Shijiazhuang 050003, China;
3. 75833 Force of PLA, Guangzhou 510000, China
Abstract: Considering the traditional failure mode analysis problem of higher subjectivity, stronger blindness and lacking of electronic equipment historical failure data in traditional failure mode effect and critically analysis (FMECA), based on the traditional method, an improved method of failure mode analysis was proposed. Firstly, the failure models of components and solder joints under the thermal loadings are established according to the existing methods; Then a failure model fused components and solder joints is presented to calculate the failure probability; Finally, the final failure mode effect and critically analysis could be obtained according to the failure data obtained by accelerate degradation test and the failure model.Case study indicates that the optimized method could provide effective complement and correction for traditional failure mode effect and critically analysis.
Key words: failure mode effect and critically analysis     performance degradation     accelerated degradation test(ADT)     thermal failure    
0 引 言

故障模式、影响及危害性分析(failure mode effect and critically analysis,FMECA)是进行测试性试验的一个重要项目,也是测试性分析中的基础性工作。其通过查找产品所有可能出现的故障模式并分析可能产生的影响,为测试性试验样本选择提供依据[1-3]

新一代装备电子系统设计呈现总线式、模块化、复合化、微型化等特点,从而显著提高了装备的战备完好性和维修保障水平。由于新装备自身功能结构以及信息交换方式的改变,故障模式也发生了新的变化;此外,新装备缺乏使用数据积累,失效样本难以获得,加上可供参考的资料有限,FMECA工作只能依赖设计人员自身经验进行,其分析结果存在很强主观性和一定盲目性,难以全面发现新装备设计缺陷并指导改进设计工作进行。研究表明,退化失效是引发电子装备故障的主要诱因。退化失效过程实质是特定工作环境下电子产品损耗的累积,直至无法满足功能需求。美国马里兰大学首先提出了寿命消耗监测法[4-5],该方法在失效模型中融合了装备实际作业环境中的振动、温度、湿度等因素进行累积毁伤计算,并在飞机中成功应用。国内学者在FMECA方面进行了大量研究,文献[6-7]提出了一种在采集电路系统自身仿真数据的基础上进行FMCEA分析的方法,该方法需要进行故障注入试验,过程繁琐,数据量大。文献[8-11]分别以无人机系统、航行器推进系统、风力机组为对象实现了故障模式影响及其危害性分析,但分析方法中过多依赖于设计人员自身经验,客观性不强。文献[12]提出了一种利用加速退化试验技术对元器件进行故障模式分析的方法,且取得了良好试验效果,但忽略了对焊点退化过程的研究,造成对板级电路故障模式的分析不够全面。美国空军航空电子统计分析中心的统计数据表明,温度对电子设备的影响程度可高达55%[13]

基于此,本文考虑环境应力中温度因素对电子装备性能退化的影响,通过分析温度对电子元器件自身以及焊点的影响,并建立元器件、焊点融合失效计算模型,实现对缺乏历史失效数据的新电子装备故障的模式的客观分析。

1 温度载荷条件下故障模式及影响分析方法

FMCEA包括故障模式及影响分析(FMEA)和危害性分析(CA)两部分。故障模式及影响分析通过对产品功能和硬件分析得到故障模式、故障原因以及故障模式可能对自身、下一级或者系统产生的影响,最后以严酷度等级对其影响程度进行定量表达。危害性分析通过评估计算每一种故障模式严重程度和发生概率评价该故障模式的综合影响,是对FMEA的补充和拓展,故障模式的危害性常用定量指标风险优先数(risk priority number,RPN)表示,其计算公式为[2]

$ {\rm{RPN}} = {\rm{DDR}} \times {\rm{ESR}} \times {\rm{OPR}} $ (1)

式中:DDR——故障模式被检测难度;

ESR——故障模式严酷度;

OPR——故障模式发生概率。

除DDR外均为需要依靠装备自身数据计算的定量指标。新装备在列装前缺乏使用数据积累,难以对ESR、OPR实现准确计算,容易导致故障模式获取与故障原因的判别科学性不强,且影响故障模式发生概率的准确计算。此外,故障模式获取不准确也将影响严酷度等级的确定,进而对式(1)中参数计算产生影响。要解决该问题必须获取准确的装备失效数据,基于此,提出一个改进的FMECA方法,其流程如图1所示。

图 1 改进后的FMECA流程图

首先在系统硬件和功能分析基础上,利用加速退化试验数据分别建立温度载荷下元器件及焊点失效模型,得到各自失效概率。然后建立元器件、焊点融合失效计算模型计算综合失效概率并鉴别故障原因,进而求解得到式(1)中的定量指标。

2 温度循环载荷条件下电子设备失效模式分析

装备的电子设备在实际环境中受温度影响会产生两种典型的失效模式:1)电子设备中元器件由于长时间受到温度载荷的作用而引发的功能失效(元器件类失效模式);2)焊点在多次循环温度载荷作用下引起的疲劳断裂失效(焊点疲劳类失效模式)[14]

2.1 温度循环载荷条件下元器件失效分析

假设单温度应力下元器件的退化量为x(t),t时刻退化量的分布函数为F(xt),概率密度函数为f(xt)。研究发现电子系统板级电路性能退化数据服从威布尔分布,假设 $f\left( {x,t} \right) \sim {\rm{Weibull}}\left( {j,L\left( t \right)} \right)$ ,则:

$ f\left( {x,t} \right) = \left\{ {\begin{aligned} &\frac{j}{{L\left( t \right)}} {{\left( \frac{x}{{L\left( t \right)}} \right)} ^{j - 1}}{{\rm{e}}^ {- \left({x / L( t)} \right)^j}} &{x \geqslant 0}\\ &0 & {x<0} \end{aligned}} \right. $ (2)

其中,j为形状参数,只与元器件自身相关;L(t)为尺度函数,是与应力有关的退化量,温度载荷下材料会发生电迁移、腐蚀、绝缘破坏等物理或化学反应,继而引发元器件的退化失效。

对于温度载荷下的性能退化问题,Arrhenius模型可以较精确地描述温度应力下电子设备性能指标退化速率,即:

$ L\left( t \right) = A \cdot {{\rm{e}}^{\frac{{{E_a}}}{{kT}}}} \cdot t $ (3)

式中:A——与产品相关的常数;

Ea——激活能,eV;

k——玻尔兹曼常数,k=1.380 649×10−23 J/K;

T——热力学温度,K。

根据式(2)、式(3)可以得到元器件类失效模式在温度载荷条件下失效概率分布函数,其表达式为

$ F(t) = {\int_{ - \infty }^t {f(t){\rm{d}}t} _{t = l}} = \exp \left[ { - {{\left( {\frac{l}{{A \cdot {{\rm{e}}^{\frac{{{E_a}}}{{kT}}}} \cdot t}}} \right)}^j}} \right] $ (4)
2.2 温度循环载荷条件下焊点疲劳类失效分析

对于装备电子设备而言,在温度载荷作用下由于元器件和电路板所采用材料的热膨胀系数的不同,元器件与电路板之间会发生相对位移,从而引起连接元器件与电路板之间的焊点处产生应力。在持续应力作用下焊点自身材料产生的形变和应力松弛,也会对焊点的疲劳寿命造成影响,最终导致焊点的疲劳失效。研究表明:由于互连焊点的失效导致的电子元器件失效占70%以上[15]

1969年Norris和Landzberg根据焊点材料的本构模型以及焊点材料所受的应力对焊点进行了应变计算,并将最高温度和循环频率融入计算提出了Norris–Landzberg模型[16],焊点疲劳寿命表达式为

${N_f} = \frac{1}{{{f^m}}}\frac{\delta }{{{{(\Delta T)}^n}}}\exp \left(\frac{{{E_a}}}{{k{T_{\max }}}}\right) $ (5)

式中:Nf——焊点的疲劳寿命,h;

$\delta $ ——材料常数;

f——温度循环的频率,Hz;

$\Delta T$ ——温度循环变化范围,K;

Tmax——温度循环的最大温度,K。

温度循环的周期与失效模式的疲劳寿命相乘的结果即为焊点疲劳失效模式的失效时间,即:

$ {L_f} = {t_f}{N_f} = {t_f}\frac{1}{{{f^m}}}\frac{\delta }{{{{(\Delta T)}^n}}}\exp (\frac{{{E_a}}}{{k{T_{\max }}}}) $ (6)

其中tf为温度循环周期(h)。

根据式(5)、式(6),可以将焊点疲劳类失效模式的特征寿命与温度循环参数之间的关系描述为

$ \eta = \exp \left[a{\rm{ + ln}}{t_f} + b\ln f + c \ln(\Delta T) + \frac{d}{{{T_{\max }}}}\right] $ (7)

其中, $a = {\rm{ln}}\delta $ b=−mc=−nd=Ea/k

Weibull分布对于焊点疲劳类失效模式中的失效时间的分布规律同样适用。根据式(2)Weibull分布的失效分布函数,可以得到焊点疲劳失效模式的失效概率分布函数为

$\begin{split} F(t) =& 1 - \exp \left[ - {\left(\frac{t}{\eta }\right)^\beta }\right] = 1 - \exp \bigg[ - {t^\beta }\bigg(\exp\bigg[a{\rm{ + ln}}{t_f} + \\ &\left.{ b\ln f + c \ln(\Delta T) + \frac{d}{{{T_{\max }}}}\bigg]\bigg)^{ - \beta }}\right] \end{split} $ (8)
3 元器件、焊点融合失效计算模型

对于板级电路而言,故障模式的两种主要表现形式分别是元器件自身失效和焊点疲劳失效。一般而言,焊点的失效概率远小于元器件的失效概率。但对于同一电路板的不同区域,受热温度存在差异,高低温循环区间不同,焊点和元器件的失效概率会存在很大差别。现有方法对故障模式发生概率等级(OPR)的计算中仅考虑了焊点和元器件各自的失效概率,当焊点失效概率较大时会将焊点失效作为故障原因分析,当元器件失效概率较焊点失效概率相差较大时忽略了对焊点失效概率的统计,这是不严谨的。定义焊点失效概率值为

${P_{{\rm s}i}} = {P_1} + {P_2} + \cdots + {P_i}_{}$ (9)

其中i为某元器件的引脚数量。

融合焊点失效概率的元器件失效概率值为

${P_{{\rm c}n}} = {P_{\rm c}} + {P_{{\rm s}i}}_{}$ (10)

其中Pc为元器件自身的失效概率值。

为有效区分焊点和元器件故障原因分析的界限,定义融合失效概率比为

$\lambda {\rm{ = }}\frac{{{P_{\rm c}}}}{{{P_{{\rm s}i}}}}$ (11)

参照GJB/Z1391-2006《故障模式、影响及危害性分析指南》中关于OPR的评分准则(故障模式发生概率值相差两个数量级时故障模式发生的可能性相差一个层级),规定:当Psi<10−6 $\lambda $ ≥100时,考虑元器件失效为主要故障原因并将焊点疲劳失效概率进行融合失效计算;当Psi≥10−6时,应单独考虑焊点失效作为故障原因。

4 实例验证

模块A是某型装备核心模块。模块A作为一个控制系统的核心,主要实现与上级计算机的数据传递、与下级计算机之间的信息交换,完成整个控制执行过程的检控,其功能框图如图2所示。

图 2 模块A的功能框图

以模块A中的支持单元同步通信板为例,由生产厂家提供的研制阶段FMECA内容如表1所示。

表 1 同步通信板FMECA
产品 功能 故障模式 故障原因 故障影响 ESR OPR Pm1)/% RPN
同步通信板 实现与主控计算机通信,完成与指控系统数据交换 译码控制芯片EPM7128STI损坏 过流或过压 不能正确实现译码控制功能 3 6 0.897 18
总线驱动芯片CD54HCT425损坏 过流或过压 无法实现对部分地址线和控制线驱动 3 5 0.088 15
通信控制芯片Z16C3010损坏 过流或过压 不能实现同步通信协议 3 5 0.076 15
接口芯片IL422损坏 过流或线间干扰 不能完成接口电平转换 3 7 2.871 21
注:1) Pm为融合焊点失效概率的元器件失效相对概率值。

以模块A中同步通信板为例,连接外围电路工作2 h后用高分辨率红外成像仪确定功能单元所含主要元器件的工作温度。功能单元包含主要元器件及其工作温度如表2所示。

表 2 同步通信板元器件及其工作温度
元器件 瓷介电容 接口芯片IL422 译码控
制芯片
EPM7128STI
总线驱
动芯片
CD54HCT425
通信控
制芯片
Z16C3010
工作温度 333 K 352 K 348 K 357 K 345 K

收集样本,进行加速退化试验,并计算可得AEa值,分别为:A=2.526×10−6Ea=6.333×10−2

试验样品所用焊点为锡铅焊点,将其应用于Norris和Landzberg模型,得到模型参数的估计值如表3所示。查阅文献[17-19]可得c=10, $\beta $ =2,假设装备每次运行时间为2 h,则tf=2 h。

表 3 相关参数估计值
文献来源 参数估计值
m n Ea/k
文献[17] 0.33 1.9 1 414
文献[18] 0.33 1.9 1 414

按照式(9)~式(11)过程计算,可以得到修正后的FMECA结果,如表4所示。

表 4 改进后的FMECA结果
产品 功能 故障模式 故障原因 故障影响 ESR OPR Pm/% RPN
同步通信板 实现与主控计算机通信,完成与指控系统数据交换 译码控制芯片EPM7128STI损坏 过流或过压 不能正确实现译码控制功能 3 7 1.932 21
芯片周围温度过高
总线驱动芯片CD54HCT425损坏 过流或过压 无法实现对部分地址线和控制线驱动 3 6 0.435 18
芯片周围温度过高
通信控制芯片Z16C3010损坏 过流或过压 不能实现同步通信协议 3 6 0.115 18
接口芯片IL422损坏 过流或线间干扰 不能完成接口电平转换 3 7 2.732 21
焊点脱落 3 6 0.031 18
瓷介电容损坏 局部温度过高 输出信号的干扰 2 7 1.294 14

表1中的结果进行对比分析可知,表4中发现了温度载荷作用下存在的新故障模式,比如瓷介电容损坏、接口芯片IL422焊点脱落,并对故障原因实现鉴别。在表2中已有的故障模式分析基础上,发现温度过高时故障模式的发生概率会增大,并以此实现了对原有FMECA结果的修正。由此可见,原有的FMECA分析方法由于缺少试验数据支撑,仅凭设计人员的经验进行的半定性分析可能会发生一些故障模式的遗漏,且在危害度等信息上存在一定偏差。而改进的FMECA方法依靠加速退化数据,可作为依据鉴别和发现典型的故障模式,并确定发生概率、危害度等定量信息。该方法在对温度载荷条件下导致的故障模式及其危害性分析上比现有FMECA结果更加精确、有据可依,可实现对传统分析结果的有效补充和修正。但是,传统的FMECA依然是最为普适且有效的。

5 结束语

文中提出的温度载荷条件下的改进FMECA方法实现了在FMECA分析流程中的应用,该方法有以下3个优点:

1)通过分别建立元器件、焊点失效模型,实现了对元器件、焊点失效概率的相对精确计算。

2)提出了元器件、焊点融合失效计算模型,对故障发生概率实现了修正,相对准确度更高。

3)充分利用加速试验数据得到产品在温度载荷下的失效信息,为因热退化失效导致的典型故障模式提供支撑手段,其分析结果可以作为测试性增长和验证试验样本集构建的依据。

参考文献
[1]
Maintenance management outline for system and devices:MIL-STD-470A[S]. U. S. Government Printing Office,1983.
[2]
COLLI A. Failure mode and effect analysis for photovoltaic systems[J]. Renewable & Sustainable Energy Reviews, 2015, 50: 804-809.
[3]
石君友. 测试性设计分析与验证[M]北京: 国防工业出版社, 2011: 282-284.
[4]
RAMAKRISHNAN A, PECHT M G. A life consumption monitoring methodology for electronic systems[J]. IEEE Transactions on Components & Packaging Technologies, 2003, 26(3): 625-634.
[5]
ROUET V, MINAULT F, DIANCOURT G, et al. Concept of smart integrated life consumption monitoring system for electronics[J]. Microelectronics Reliability, 2007, 47(12): 1921-1927. DOI:10.1016/j.microrel.2007.02.019
[6]
倪灿斌. 基于数据挖掘的FMEA分析方法[D]. 成都: 电子科技大学, 2014.
[7]
何月顺, 丁秋林. 基于数据挖掘思想的故障模式分析[J]. 应用科学学报, 2005, 23(5): 545-547. DOI:10.3969/j.issn.0255-8297.2005.05.022
[8]
窦赛, 陈国顺, 吕艳梅, 等. 无人机系统的模糊FMECA分析方法研究[J]. 现代电子技术, 2011, 34(23): 7-9. DOI:10.3969/j.issn.1004-373X.2011.23.003
[9]
孙华, 唐晓庆, 李瑞. FMECA和FTA综合分析法在动密封系统中的应用[J]. 装备学院学报, 2015, 26(6): 82-88. DOI:10.3783/j.issn.2095-3828.2015.06.019
[10]
周新建, 李志强. 利用FMECA法的兆瓦级风力机故障模式分析[J]. 华东交通大学学报, 2017, 34(1): 107-117.
[11]
王宇晨, 成斌. 基于风电机组常见故障的模糊FMECA评价研究[J]. 电力系统保护与控制, 2018, 46(1): 143-149.
[12]
陈然, 连光耀, 孙江生, 等. 加速退化试验改进的故障模式影响及危害性分析[J]. 西安电子科技大学学报, 2017, 44(3): 164-169. DOI:10.3969/j.issn.1001-2400.2017.03.028
[13]
KANDA R, JAIN K. Thermal management of low volume complex electronic systems[C]//Springer.Proceedings of the International Conference onResearch and Innovations in Mechanical Engin-eering , 2014: 519-533.
[14]
MIRMAN B. Tools for stress analysis of microelectronic structures[J]. Journal of Electronic Pakaging, 2010, 122(3): 280-282.
[15]
景博, 胡家兴, 黄以锋,等. 电子设备无铅焊点的热疲劳评估进展与展望[J]. 空军工程大学学报(自然科学版), 2016, 17(6): 35-40. DOI:10.3969/j.issn.1009-3516.2016.06.007
[16]
NORRIS K, LANDZBERG A. Reliability of controlled collapse interconnections[J]. IBM Journal of Research and Development, 1969, 13(3): 266-271. DOI:10.1147/rd.133.0266
[17]
SALMELA O. Acceleration factors for Lead-Free solder materials[J]. IEEE Trans Components Pack T, 2007, 30(4): 158-165.
[18]
VASUDEVAN V, FAN X. An acceleration model for Pb-free (SAC) solder joint reliability under thermal cycling [C]//Electron Components and Technology Conference, 2008: 139-145.
[19]
于宗乐. 温度循环载荷条件下电子设备多失效模式加速试验技术研究[D].长沙: 国防科学技术大学, 2015.