上海理工大学学报  2020, Vol. 42 Issue (4): 399-403   PDF    
设备故障过程的建模与仿真研究
郑睿     
上海财经大学 公共经济与管理学院,上海 200433
摘要: 由于设备劣化是一个随机过程,维修计划制定主要依据维修工程师的经验或厂家说明书,从而导致维修不足和维修过剩的问题。为了解决这一问题,首先应用故障记录数据和检查数据,建立了缺陷发生为泊松过程,检查完全情况下的时间延迟模型。其次建立设备故障发生过程的计算机模拟仿真系统,仿真结果证实了所建时间延迟模型的正确性。故障建模与仿真系统,不仅能直观显示设备故障过程,揭示故障机理;而且能解决故障记录缺乏下验证故障模型正确性的难题。同时,故障过程模型为维修计划制定提供了科学决策依据。
关键词: 时间延迟     预防维修     仿真     故障过程    
Modeling of failure process of an equipment and its simulation study
ZHENG Rui     
School of Public Economy and Management, Shanghai University of Finance and Economics, Shanghai 200433, China
Abstract: The failure of an equipment is usually a random process, so the preventive maintenance (PM) interval of the equipment is mainly formulated by maintenance engineers according to their experiences, or by the specification of PM interval given by the manufacturing enterprise, which results into two main problems of over maintenance and insufficient maintenance. In order to optimise the preventive maintenance interval, a time delay model, in the condition of Poisson process defects and perfect inspection was established based on the maintenance data of recorded failures and inspection data. Then the failure process in case of perfect inspection was simulated by computer programs. The simulation results prove the validity of the established time delay model. The established time delay model and the simulation system demonstrate intuitively the failure process, reveal clearly the failure mechanism, and solve the difficulty of model validation in case of no failure data record. The failure process model is benefitial to make maintenance decision.
Key words: time delay     preventive maintenance     simulation     failure process    

我国企业对设备管理主要是采用计划预修制,其核心工作之一是确定出合理预防维修(preventive maintenance,PM)计划,以便达到减少设备停机时间的目的[1]。实践中我国企业主要凭维修工程师的经验或根据厂家规定的说明书来制定维修计划,一直存在维修不足和维修过剩两大问题[2]

考虑到我国大中型企业都有比较完整的故障记录数据,包括:每次故障发生时间及其修理时间、每次PM活动所需要的时间及其检查发现的缺陷个数。因此,借鉴时间延迟维修理论[3-5]。在分析和应用这些记录数据的基础上,通过建立故障过程模型,揭示故障机理。同时为了证实故障过程模型的正确性,建立设备故障过程的计算机仿真系统。

目前有关故障过程仿真的研究主要集中于以下几个方面:a. 从材料的物理性能角度,分析各种材料性能失效过程,提示各种材料的失效机理[6-7];b. 基于机器学习的仿真方法,诊断复杂设备系统的故障部位,分析故障形成的原因,从而解决实故障部位难以发现的实际工程问题[8];c. 应用仿真方法,联合决策生产计划和预防维修计划[9],或应用蒙特卡罗仿真方法[10],模拟故障过程并进行维修决策。这些研究从不同角度揭示设备故障,或材料失效的过程。但是从数学建模角度,建立故障过程模型和仿真系统,这方面工作有待深入研究。

故障过程模型与仿真系统的建立,将有效解决我国多年来存在的定期维修计划科学性不足的难题,对于提高设备利用率,降低维修费用具有重要理论意义和实践价值。

1 问题描述

设备劣化是一个随机过程。具体劣化过程又分为两个阶段,首先是缺陷的发生,然后缺陷进一步劣化成为故障。从缺陷发生到故障发生的时间间隔称为时间延迟[3],记为h。缺陷发生是随机的,时间延迟也是随机的,这就是为什么维修决策难的原因。

正如前言指出:计划预修制核心工作之一是如何制定出合理PM计划,或者PM周期。国际上比较好的做法是,利用故障记录数据(每次故障发生时间和停机时间)和PM检查数据(PM活动时检查出的缺陷次数),得到设备的缺陷发生率λ、时间延迟h的分布函数。在参数估计的基础上,计算出维修间隔期T内故障次数期望值,以及PM检查出缺陷次数的期望值。最终应用检查模型计算出最佳PM周期[11-13],如图1所示。图中:Ti为第i次PM活动的时间(i=1,2,···,m);ti−1)j为(Ti−1, Ti)期间第j次故障时间,其中j=1, 2, ···, ki−1


图 1 在(Ti-1,Ti)期间各次故障发生时间及PM活动观察到的缺陷次数 Fig. 1 Observed failures and number of defects over time(Ti-1,Ti

问题在于:a. 建立的故障模型是否正确,如何验证?只有故障模型验证正确之后才能应用来进行维修决策;b. 当缺乏故障记录数据时,如何对故障模型进行参数估计?解决这些问题的对策:建立故障过程仿真系统,仿真系统生产的故障记录数据和检查数据,作为故障模型参数估计的原始数据;应用这些仿真数据估计出模型参数,如果与输入数据一致或在误差范围之内,则证实所建立故障模型的正确性,从而可以应用故障模型制定维修计划。

2 完全检查下设备故障模型的建立 2.1 假定条件及有关符号

通过对设备故障记录数据的分析,本文提出了以下假定条件:

a. 检查是完全的,PM活动能检查出所有存在的缺陷;以及所有检查出的缺陷在较短时间内得到修复;

b. 缺陷的发生率为齐次泊松过程(HPP,homogeneous Poisson process);

c. 各个缺陷的发生是相互独立的,以及缺陷发生和故障发生也是两个独立的事件。

相应地,符号记为:λ为缺陷发生率;vt)为故障发生率;h为时间延迟,其分布函数和概率密度函数分别记为Fh)和fh); $E{N_f}({T_{i - 1,}}{T_i})$ 为(Ti−1,Ti)期间故障次数的均值; $E{N_p}({T_i})$ 为在Ti时检查发现的缺陷个数的均值。

2.2 最大似然函数

在(Ti−1, Ti)期间所有的事件,包括:在Ti时观察到缺陷数ni,各次故障发生时间(见图1),i=1, 2, ···,m。似然函数即是所有这些观察事件概率的乘积,用L表示。

$\begin{split} L= & \prod\limits_{{{i}}={\rm{1}}}^{{{{m}}}} {\left\{ {} \right.} p({\text{在}}{\rm{ }}{T_i}{\text{时检查出}}{n_i}{\text{个缺陷}})\! \times \\ & \left. {\prod\limits_{{{j}}={\rm{1}}}^{{{{k}}_{{{i - 1}}}}} {\left[ {p({\text{在}}{\rm{ }}{t_{(i - 1)j}}{\text{时发生故障}})} \right]}} \times p({\text{在}}({\rm{ }}{T_{i - 1}},{T_i}) \right.\\ &\left.{\text{期间各记录故障之间无故障再发生}}) \right\} \\[-10pt]\end{split}$ (1)

对式(1)两边取对数,得

$ \begin{split} \log\; L &= \sum\limits_{i = 1}^m {\left\{ {} \right.} \log\; p({\text{在}}{T_i}{\text{时检查出}}{n_i}{\text{个缺陷}}) + \\ & \left.{\displaystyle\sum\limits_{j = 1}^{{k_{i - 1}}} {\left[ {\log\; p({\text{在}}{t_{(i - 1)j}}{\text{时发生故障}})} \right] }}\right.+\log \;p({\text{在}}({\rm{ }}{T_{i - 1}},\\&\left.{\rm{ }}{T_i}){\text{期间各记录故障之间无故障再发生}}) \right\} \\[-10pt]\end{split} $ (2)

a. p(在ti−1)j发生故障)的计算。

如果缺陷的发生服从HPP,发生率为λ, 由u时发生缺陷所引发的在t时的故障发生率vt)为

$v(t)=\int_{{T_{i - 1}}}^t \lambda f(t - u){\rm{d}}u=\lambda F(t - {T_{i - 1}})$ (3)

式中,Ti-1<tTiu<t

相应地,在(ti−1)j, ti−1)jt)区间发生一个故障的概率为

$\begin{split}& p({\text{在}}\left( {{t_{\left( {i - 1} \right)j}},{t_{\left( {i - 1} \right)j}} + \Delta t} \right){\text{区间发生一个故障}}) = \\&\quad v\left( {{t_{\left( {i - 1} \right)j}}} \right){\rm{ }}\Delta t \end{split}$ (4)

b. $ p({\text{在}}({\rm{ }}{T_{i - 1}},{\rm{ }}{T_i}){\text{期间各记录故障之间无}}$ 故障再发生)的计算。

由于故障过程为NHPP, 得到:

$\begin{split}& p({{{\text{在}} (}}{t_{(i - 1)(j - 1)}},{t_{(i - 1)j}}){{{\text{期间没有故障发生}}}}) = \\&\quad\mathop {\rm{e}}\nolimits^{ - \int_{{t_{(i - 1)(j - 1)}}}^{{t_{(i - 1)j}}} {v(t){\rm{d}}t} } \\[-6pt] \end{split}$ (5)

在(Ti-1,Ti)期间故障之间无故障再发生概率的对数函数为

$\begin{split} \sum {\log } &p({\text{在}}({T_{i - 1}}{\rm{,}}{T_i}{{){\text{期间故障之间无故障再发生}})}} =\\& \sum\limits_{j = 1}^{{k_{i - 1}}} {\left( { - \int_{{t_{(i - 1)(j - 1)}}}^{{t_{(i - 1)j}}} {v(t){\rm{d}}t} } \right)} - \\ & \int_{{t_{(i - 1){k_{i - 1}}}}}^{{T_i}} {v(t){\rm{d}}t} = - \int_{{T_{i - 1}}}^{{T_i}} {v(t){\rm{d}}t} \\[-10pt]\end{split}$ (6)

c. P(在Ti时检查出ni个缺陷)。

Ti时刻检查出缺陷个数的均值ENpTi)为

$\begin{split}E{N_p}({T_i})=&\int_{{T_{i - 1}}}^{{T_i}} {\lambda R({T_i} - u){\rm{d}}u=} \\ & \int_{{T_{i - 1}}}^{{T_i}} {\lambda [1 - F({T_i} - u){\rm{d}}u} \end{split}$ (7)

缺陷发生率为泊松过程,以及Ti时刻检查出缺陷个数的均值为ENpTi)。因此,Ti时刻PM活动检查发现ni个缺陷的概率为

$\begin{split} p({\text{在}}{T_i}{\text{时检查出}}{n_i}{\text{个缺陷}}) =\\ \frac{{{{(E{N_p}({T_i}))}^{{n_i}}}{{\rm{e}}^{ - E{N_p}({T_i})}}}}{{{n_i}!}} \end{split}$ (8)

式(4)除以Δt,对式(8)取对数,则对数似然函数表示为

$ \begin{split} \log\; L=&\sum\limits_{i=1}^m \Bigg\{ ({n_i}\log\; E{N_p}({T_i}) - E{N_p}({T_i}) - \log \;{n_i}!) +\\&\left. \sum\limits_{j=1}^{{k_{i - 1}}} {\log \;v({t_{(i - 1)j}})} - \int_{{T_{i - 1}}}^{{T_i}} {v(t){\rm{d}}t} \right\} \end{split}$ (9)

根据故障记录数据和PM检查数据,包括各个故障发生时间,以及PM活动时检查出的缺陷个数,求式(9)最大值,即估计出参数λfh)。

3 故障过程的仿真与结果分析

设备缺陷发生以及缺陷劣化成为故障,整个故障过程的仿真流程见图2。图中:RND()表示随机数;Int()表示对ti取整数;Nd(k)表示在KT同期内的缺陷数;Nf(k)表示在KT周期内的故障数。为了简单起见,假定时间延迟分布函数为指数分布,并最初设定λ=1.33,α=0.28,维修间隔期为7 d。具体步骤如下所示。


图 2 完全检查下设备故障过程的计算机模拟仿真流程 Fig. 2 Flowchart of simulation of the failure process of the equipment in case of perfect inspection

Step 1  产生缺陷的过程(服从泊松分布)。

其算法如下所示:

若计数过程{Ntt≥0}是一个具有到达率为λ的齐次泊松过程,则它相应的到达时间间隔A1A2,···是一个具有参数1/λ的独立分布的指数随机变量。

根据这一定理,如果泊松过程的到达时间为u1,u2,···,则到达时间间隔Ai=uiui−1i=1, 2, ···)是一个指数随机变量(参数1/λ)。因此,可循环地产生ui(假定ui−1已经确定,且u0=0)

a. 产生U~U(0,1);

b. 置ui=ui−1−(1/λ)ln U

Step 2  计算每一个缺陷的时间延迟函数。

由于Fx)=1−exp(α, x),记每一个缺陷的时间延迟为h1h2,···(i=1, 2, ···)。因此,可循环地产生hi

a. 产生U~U(0,1);

b. 置hi=−(1/α)ln U

Step 3  统计每一周期中缺陷的个数和故障的次数。

计算ti)=ui)+hi)。a. 如果ti)<kT,则在k周期内的故障增加一个,即Nfk)=Nfk)+1;b. 如果ti)>kT,则在k周期内的缺陷数增加一个,即Ndk)=Ndk)+1。

按照上述步骤,仿真10次,共产生样本数91个,各个维修间隔期内发生的故障次数及PM活动时检查出的缺陷个数见表1


表 1 各个周期内发生的故障次数及PM检查时发现的缺陷个数 Table 1 Number of failures in different cycles and defects identified in PMs

将上述模拟仿真产生数据(故障发生时间、PM检查发现的缺陷个数)代入式(9)中,进行参数估计,得 $\hat \lambda $ =1.3000, $\hat \alpha $ =0.2798。仿真结果表明所建立的故障模型是正确的。

一旦证实故障模型正确后,即可应用检查模型制定出PM计划,具体应用案例可参见文献[1, 5]。

4 结 论

研究表明:a. 所建立的故障过程模型和故障过程仿真系统,直观显示从缺陷发生到故障形成的过程,特别是故障过程仿真系统的建立,解决了故障记录数据缺乏下验证故障模型正确性的难题;b. 输入故障记录数据,如每次故障发生时间,以及每次PM活动检查发现的缺陷个数,应用所建立的故障过程模型,即可估计出缺陷发生率和时间延迟分布函数等参数。一旦得出这些参数,即可应用检查模型制定出科学的PM计划,从而有望有效解决多年存在的维修不足和维修过剩两大问题。

参考文献
[1]
吕文元. 先进制造设备可用度维修理论及其智能决策支持系统[D]. 哈尔滨: 哈尔滨工业大学, 2001: 3–4.
[2]
WANG W. Subjective estimation of the delay time distribution in maintenance modelling[J]. European Journal of Operational Research, 1997, 99(3): 516-529. DOI:10.1016/S0377-2217(96)00318-9
[3]
CHRISTER A H. Developments in delay time analysis for modelling plant maintenance[J]. Journal of the Operational Research Society, 1999, 50(11): 1120-1137. DOI:10.1057/palgrave.jors.2600837
[4]
赵斐, 刘学娟. 考虑不完美维修的定期检测与备件策略联合优化[J]. 系统工程理论与实践, 2017, 37(12): 3201-3214. DOI:10.12011/1000-6788(2017)12-3201-14
[5]
ZHAO F, WANG W B, PENG R. Delay-time-based preventive maintenance modelling for a production plant: a case study in a steel mill[J]. Journal of the Operational Research Society, 2015, 66(12): 2015-2024. DOI:10.1057/jors.2015.20
[6]
LI G, CHENG X F, PU H, et al. Damage smear method for rock failure process analysis[J]. Journal of Rock Mechanics and Geotechnical Engineering, 2019, 11(6): 1151-1165. DOI:10.1016/j.jrmge.2019.06.007
[7]
GONG H C, FAN Q B, ZHOU Y, et al. Simulation of failure processes of as-cast Ti-5Al-5Nb-1Mo-1V-1 Fe titanium alloy subjected to quasi-static uniaxial tensile testing[J]. Materials & Design, 2019, 180: 107962.
[8]
PAPAKONSTANTINOU N, PROPER S, O’HALLORAN B, et al. Simulation based machine learning for fault detection in complex systems using the functional failure identification and propagation framework[C]//ASME 2014 International Design Engineering Technical Conferences and Computers and Information in Engineering Conference. Buffalo, New York, USA: ASME, 2015.
[9]
BENMANSOUR R, ALLAOUI H, ARTIBA A, et al. Simulation-based approach to joint production and preventive maintenance scheduling on a failure-prone machine[J]. Journal of Quality in Maintenance Engineering, 2011, 17(3): 254-267. DOI:10.1108/13552511111157371
[10]
YANG R F, YAN Z W, KANG J S. An inspection maintenance model based on a three-stage failure process with imperfect maintenance via Monte Carlo simulation[J]. International Journal of System Assurance Engineering and Management, 2015, 6(3): 231-237. DOI:10.1007/s13198-014-0292-8
[11]
LI Y, YE Z S, LEE C G, et al. A two-phase preventive maintenance policy considering imperfect repair and postponed replacement[J]. European Journal of Operational Research, 2019, 274(3): 966-977. DOI:10.1016/j.ejor.2018.10.049
[12]
ZAHEDI-HOSSEINI F, SYNTETOS A A, SCARF P A. Optimisation of inspection policy for multi-line production systems[J]. European Journal of Industrial Engineering, 2018, 12(2): 233-251. DOI:10.1504/EJIE.2018.090616
[13]
ZHANG J J. Reliability evaluation and opportunistic maintenance policy based on a novel delay time model[J]. Quality and Reliability Engineering International, 2019, 35(4): 978-994. DOI:10.1002/qre.2440