RCA、RCFA和FMEA在設(shè)備運維和故障診斷工作中是高頻詞匯,已經(jīng)成了很多工程師的口頭語,但是這幾個名詞都分別是什么意思?它們是故障診斷么?
仔細(xì)辨別這些詞的意思并非咬文嚼字,在設(shè)備故障診斷以及設(shè)備全生命周期管理的工作中,這些名詞具有專門的含義,并且也指向?qū)iT的工作?;煜蜑E用會帶來很多誤解。
故障診斷的定義
故障診斷是最常用的詞匯,因此與之相關(guān)的概念十分多,包括“故障”、“失效”等,同時故障診斷與相臨近的工作發(fā)生很多聯(lián)系,有時候故障診斷的內(nèi)容也會和其他工作內(nèi)容相互混淆,比如“維修”、“維護(hù)”、“預(yù)測性維護(hù)”、“狀態(tài)監(jiān)測”等。為了清楚故障診斷的含義,我們首先從故障診斷的定義談起,然后介紹故障診斷的任務(wù)工作內(nèi)容。
首先,故障診斷的定義:故障診斷也稱診斷,是對設(shè)備或者系統(tǒng)故障進(jìn)行查找的過程。用來檢查尋找故障的程序稱為診斷程序(請注意,這里的程序指的不一定是計算機程序,也包括流程,思路等),對其他設(shè)備或系統(tǒng)執(zhí)行診斷的系統(tǒng)稱為診斷系統(tǒng)。
故障診斷是一種了解機器在運行過程中的狀態(tài),并判斷其正?;蛘弋惓5倪^程。也有的資料里提出了,故障診斷是在機器運行過程中,不拆解機器并進(jìn)行設(shè)備狀態(tài)是否正常的判斷。
故障診斷的范圍(工作內(nèi)容)
故障診斷的主要工作包含三個方面:故障監(jiān)測與發(fā)現(xiàn)、故障位置確定、故障類型判斷。
為了便于理解,經(jīng)常將故障診斷工作的三個任務(wù)成為定時、定位、定責(zé)。
故障診斷的“定時”任務(wù):當(dāng)設(shè)備運行的時候,如果出現(xiàn)了某種故障,那么故障診斷的任務(wù)首先需要確定故障是什么時候發(fā)生的,這樣的工作就是故障的定時。
故障診斷的“定位”任務(wù):當(dāng)設(shè)備出現(xiàn)故障的時候,故障診斷工作的一個重要任務(wù)就是確定故障發(fā)生的位置。故障定位的作用是為了后續(xù)故障處置工作提供信息支持。在一些設(shè)備的故障處置工作中,第一步往往是故障的隔離,也就是將發(fā)生故障的部位與整個系統(tǒng)進(jìn)行隔離(在工業(yè)設(shè)備中,往往會使用設(shè)備切換的方式,將備用機投入使用),避免故障的擴(kuò)展,此時故障診斷的定位就為故障隔離提供了目標(biāo)。
故障診斷的“定責(zé)”任務(wù):故障診斷的定責(zé)工作就是確定故障的類型。需要注意的是,嚴(yán)格意義的故障診斷定責(zé)工作就是故障類型的確定,不包含故障原因的查找以及故障的恢復(fù)工作。實際工作中,多數(shù)工程師都將故障診斷的定責(zé)與故障原因查找和故障恢復(fù)發(fā)生了混淆。
既然故障診斷的任務(wù)不包括故障原因的查找,那么平常的故障診斷工作中尋找問題原因的工作是如何進(jìn)行的呢?在實際工作中,從設(shè)備出現(xiàn)故障,到工程師發(fā)現(xiàn)故障并非是一個完整的工作循環(huán),其間還少了故障原因查找(分析)、故障處置與排除,設(shè)備故障恢復(fù)的工作,并且這這些工作過程中還需要采取一些措施,以防止故障再次出現(xiàn)。
所有這些從故障發(fā)現(xiàn)和類型確定環(huán)節(jié)到設(shè)備故障恢復(fù)環(huán)節(jié)中的工作,都需要基于針對故障的分析。
故障分析的工作分析什么呢?根據(jù)目的的不同又有哪些差異呢?今天昌暉儀表談?wù)凴CA、RCFA和FMEA。
RCA
RCA是Root Cause Analysis的縮寫,字面上的意思是根本原因分析。事實上根據(jù)ASQ(American Society for Quality)的定義:RCA是一個結(jié)構(gòu)性的調(diào)查過程,旨在確定導(dǎo)致問題的真正原因,并且采取相應(yīng)措施消除這一誘因。
RCA是一個廣泛的定義,它包含對問題誘因的解釋和建模的一套寬范圍的方法、工具和技術(shù)。事實上RCA不僅僅可以用于工業(yè)設(shè)備,它同樣適用于組織機構(gòu)問題、生產(chǎn)問題和管理問題等的分析。
同時,從RCA的定義不難發(fā)現(xiàn),RCA包含了原因查找和采取相應(yīng)措施等工作。因此不難發(fā)現(xiàn),設(shè)備工程師日常所進(jìn)行的所謂故障診斷工作實際上更像RCA的工作。
RCFA
RCFA是Root Cause Failure Analysis 的縮寫,字面意思是失效根本原因分析。RCFA是失效分析的范疇,失效分析的工作指的是對失效的觀察、界定以及描述。在進(jìn)行失效分析的過程中,不一定需要對導(dǎo)致失效的原因進(jìn)行確認(rèn)。
很多用戶都會發(fā)現(xiàn),當(dāng)你把失效的設(shè)備給專門機構(gòu)進(jìn)行失效分析的時候,失效分析報告的結(jié)論僅僅是對失效模式進(jìn)行分類,最多會加入一些國際標(biāo)準(zhǔn)對此類失效可能誘因的描述,并不會對你實際的設(shè)備問題和誘因進(jìn)行分析。嚴(yán)格意義上說,這樣的工作是符合RCFA定義的。
另一方面,RCFA的分析對象是“失效”?!笆А笔且阅撤N物理改變(或者物理失效)為目標(biāo)的,而RCA分析的對象可能是安全事件、質(zhì)量事件等更多領(lǐng)域的“故障”。
FMEA
FMEA是Failure Mode and Effects Analysis 的縮寫,即失效模式及其后果分析。FMEA是在產(chǎn)品合計階段和過程設(shè)計階段對構(gòu)成產(chǎn)品的子系統(tǒng)、零件,對構(gòu)成過程的各個工序逐一進(jìn)行分析,找出潛在失效模式、并分析其可能得后果,從而預(yù)先采取必要措施,提高產(chǎn)品質(zhì)量和可靠性的系統(tǒng)化活動。
從FMEA的定義可以看到,這是一個基于假設(shè)的分析方法。這里的假設(shè)是指對“可能發(fā)生故障”的假設(shè),也就是對于故障潛在發(fā)生的可能,其分析的指標(biāo)包括風(fēng)險和可能性等。
FMEA可以被理解為一種預(yù)先實施的分析工作,其目的是在問題發(fā)生以前減少問題誘因。這和大多數(shù)工程師所討論的設(shè)備出現(xiàn)故障之后的分析和處置顯然不是一回事兒。
故障診斷、RCA、RCFA和FMEA的關(guān)系
設(shè)備運維領(lǐng)域相關(guān)的名詞具有本質(zhì)的差異,并且具有一定的關(guān)系。
在設(shè)備進(jìn)行設(shè)計、安裝、調(diào)試和運行的時候,工程師會使用FMEA的體系去降低設(shè)備出現(xiàn)故障的可能性。
當(dāng)設(shè)備投入運行的時候,故障診斷工作負(fù)責(zé)對故障發(fā)生的時間、位置和類型進(jìn)行確認(rèn)。
當(dāng)設(shè)備故障的定時、定位、定責(zé)信息收集到之后,可以支持RCFA工作。通過RCFA工作進(jìn)一步識別了設(shè)備失效的類型。所有的信息將通過RCA工作得到導(dǎo)致設(shè)備出現(xiàn)故障的原因,并提出改善措施避免故障再一次的發(fā)生。
上述過程才是設(shè)備從設(shè)計、安裝、投入運行到最后故障恢復(fù)的全過程的正確叫法。因此,工程師們,請嚴(yán)格規(guī)范使用名詞。
作者:王勇
共有訪客發(fā)表了評論
網(wǎng)友評論