簡介
在產品設計過程中,為消除產品的潛在缺陷和薄弱環節,防止故障發生,以確保滿足規定的固有可靠性要求所採取的技術活動。可靠性設計是可靠性工程的重要組成部分,是實現產品固有可靠性要求的最關鍵的環節,是在可靠性分析的基礎上通過制定和貫徹可靠性設計準則來實現的。在產品研製過程中,常用的可靠性設計原則和方法有:元器件選擇和控制、熱設計、簡化設計、降額設計、冗餘和容錯設計、環境防護設計、健壯設計和人為因素設計等。除了元器件選擇和控制、熱設計主要用於電子產品的可靠性設計外,其餘的設計原則及方法均適用於電子產品和機械產品的可靠性設計。
系統的可靠性設計是指在遵循系統工程規範的基礎上,在系統設計過程中,採用一些專門技術,將可靠性"設計"到系統中,以滿足系統可靠性的要求。它是根據需要和可能,在事先就考慮產品可靠性諸因素基礎上的一種設計方法。系統可靠性設計技術是指那些適用於系統設計階段,以保證和提高系統可靠性為目的的設計技術和措施。它是提高系統可靠性的行之有效的方法。
重要性
可靠性設計是系統總體工程設計的重要組成部分,是為了保證系統的可靠性而進行的一系列分析與設計技術。它是通過系統的電路設計與結構設計來實現的。“產品的可靠性是設計出來的,生產出來的,管理出來的”,但實踐證明,產品的可靠性首先是設計出來的。可靠性設計的優劣對產品的固有可靠性產生重大的影響。
產品設計一旦完成,並按設計預定的要求製造出來後,其固有可靠性就確定了。生產製造過程最多只能保證設計中形成的產品潛在可靠性得以實現,而在使用和維修過程中只能是儘量維持已獲得的固有可靠性。所以,如果在設計階段沒有認真考慮產品的可靠性問題,造成產品結構設計不合理,電路設計不可行,材料、元器件選擇不當,安全係數太低,檢查維修不便等問題,在以後的各個階段中,無論怎么認真製造,精心使用、加強管理也難以保證產品可靠性的要求。因此,我們說產品的可靠性首先是設計出來的,可靠性設計決定產品的“優生”,可靠性設計是可靠性工程的最重要的階段。這是因為:
(1)設計規定了系統的固有可靠性。如果在系統設計階段沒有認真考慮其可靠性問題,如材料、元器件選擇不當,安全係數太低,檢查、調整、維修不便等,那么以後無論怎樣注意製造、嚴格管理、精心使用,也難以保證產品的可靠性要求。
(2)現代科學技術的迅速發展,使同類產品之間的競爭加劇。由於現代科學技術的迅速發展,產品更新換代很快,這就要求企業不斷引進新技術,開發新產品,而且新產品研製周期要短。實踐告訴我們,如果在產品的設計過程中,僅憑經驗辦事,不注意產品的性能要求,或者沒有對產品的設計方案進行嚴格的、科學的論證,產品的可靠性將無法保證。往往等到試製、試用後才發現產品存在質量問題,只得再做改進設計,這就使產品研製周期加長,推遲了產品投入市場的周期,降低了競爭能力。在產品的全壽命周期中,只有在設計階段採取措施,提高產品的可靠性,才會使企業在激烈的市場競爭中取勝,提高企業的經濟效益。
(3)在設計階段採取措施,提高產品的可靠性,耗資最少,效果最佳。美國的諾斯洛普公司估計,在產品的研製、設計階段,為改善可靠性所花費的每一美元,將在以後的使用維修方面節省30美元。
具體內容
1、設計的目的和任務可靠性設計的目的是在綜合考慮產品的性能、可靠性、費用和設計等因素的基礎上,通過採用相應的可靠性設計技術,使產品的壽命周期內符合所規定的可靠性要求。
系統可靠性設計的主要任務是:通過設計,基本實現系統的固有可靠性。說“基本實現”是因為在以後的生產製造過程中還會影響產品固有可靠性。該固有可靠性是系統所能達到的可靠性上限。所有的其他因素(如維修性)只能保證系統的實際可靠性儘可能地接近固有可靠性。可靠性設計的任務就是實現產品可靠性設計的目的,預測和預防產品所有可能發生的故障。也就是挖掘和確保產品潛在的隱患和薄弱環節,通過設計預防和設計改進,有效地消除隱患和薄弱環節,從而使產品符合規定的可靠性要求。也可以說可靠性設計一般有兩種情況:一種是按照給定的目標要求進行設計,通常用於新產品的研製和開發;另一種是對現有定型產品的薄弱環節,套用可靠性的設計方法加以改進、提高,達到可靠性增長的目的。
2、設計的基本原則
在可靠性設計過程中應遵循以下原則:
(1)可靠性設計應有明確的可靠性指標和可靠性評估方案;
(2)可靠性設計必須貫穿於功能設計的各個環節,在滿足基本功能的同時,要全面考慮影響可靠性的各種因素;
(3)應針對故障模式(即系統、部件、元器件故障或失效的表現形式)進行設計,最大限度地消除或控制產品在壽命周期內可能出現的故障(失效)模式;
(4)在設計時,應在繼承以往成功經驗的基礎上,積極採用先進的設計原理和可靠性設計技術。但在採用新技術、新型元器件、新工藝、新材料之前,必須經過試驗,並嚴格論證其對可靠性的影響;
(5)在進行產品可靠性的設計時,應對產品的性能、可靠性、費用、時間等各方面因素進行權衡,以便做出最佳設計方案。
3.可靠性要求
可靠性要求是進行可靠性設計、分析、製造、試驗、驗收的依據。可靠性要求分為定量要求和定型要求兩種。
(1)可靠性的定量要求可靠性的定量要求是指選擇和確定產品的可靠性參數、指標依據驗證時機和驗證方法,以便在設計、生產、試驗驗證和使用過程中用量化的方法來評估或驗證產品的可靠性水平。可靠性的定量要求是影響產品可靠性的關鍵因素。科學合理的提出可靠性定量要求是保證產品可靠性的必要條件,必須合理明確的確定產品的故障判據,才能使可靠性定量要求得以正確實施。可靠性定量要求作為產品設計指標的重要組成部分,應在產品的研製任務書或技術經濟契約中明確規定。
可靠性定量要求中的參數是描述系統可靠性的度量。一般可分為使用可靠性參數和契約可靠性參數。使用可靠性參數反映了使用方對可靠性、可信性、維修人力費用及故障資源費用方面的要求,一般不宜直接寫進契約。契約可靠性參數是可以由承包商控制的,是用於產品設計的可靠性參數,有使用可靠性參數按一定規律轉換來實現,經使用方和承制方雙方協商納入契約的可靠性參數。
可靠性指標是可靠性參數的量值。對於每一個適用的可靠性參數均應規定使用目標和門限值(Threshold)(使用值)。在契約中,使用目標值應轉換成規定值(固有值),門限值應轉換成最低可接受值(MinimumAcceptablcValue)(固有值)。
使用可靠性指標包括了設計、安裝、質量、環境、使用、維修對產品的影響,而契約可靠性指標僅包括設計、製造的影響。所以,一般情況下同一產品的使用可靠性指標要低於契約可靠性指標。
對於契約中規定的定量要求,必須同時明確相應的驗證要求。驗證可以是試驗驗證、使用驗證或綜合評估。
(2)可靠性的定性要求可靠性的定性要求是指用一種非量化的形式來設計、評價,以保證產品的可靠性。可靠性定性要求可分為設計要求和定性分析要求兩種。
①定性設計要求:所謂定性設計是為滿足產品的可靠性要求而完成的一組可靠性設計。主要的定性要求見表如下:
②定性分析要求;主要的定性分析要求見表:
可靠性指標是定量設計的尺度依據,建模、預計、分配等是可靠性定量設計的工具和手段;可靠性設計準則是定性設計的重要依據,故障模式及影響分析是有效的分析手段。在工程設計工作中,應正確地處理定量設計與定性設計的關係,定量設計應與定性設計有機地結合起來。
4.設計的主要內容
可靠性設計是為了在設計過程中挖掘和確定隱患及薄弱環節,並採取設計預防和設計改進措施,有效地消除隱患及薄弱環節,定量計算和定性分析主要是評價產品現有的可靠性水平和確定薄弱環節,而要提高產品的固有可靠性,只能通過各種具體的可靠性設計來實現。
可靠性設計的主要內容概括起來可以有以下幾個方面:
(1)建立可靠性模型,進行可靠性指標的預計和分配。要進行可靠性預計和分配,首先應建立產品的可靠性模型。而為了選擇方案、預測產品的可靠性水平、找出薄弱環節,以及逐步合理地將可靠性指標分配到產品的各個層面上去,就應在產品的設計階段,反覆多次地進行可靠性指標的預計和分配。隨著技術設計的不斷深入和成熟,建模和可靠性指標分配、預計也應不斷地修改和完善。
(2)進行各種可靠性分析。諸如故障模式影響和危機度分析、故障樹分析、熱分析、容差分析等。以發現和確定薄弱環節,在發現了隱患後通過改進設計,從而消除隱患和薄弱環節。
(3)採取各種有效的可靠性設計方法。如制定和貫徹可靠性設計準則、降額設計、冗餘設計、簡單設計、熱設計、耐環境設計等,並把這些可靠性設計方法和產品的性能設計工作結合起來,減少產品故障的發生,最終實現可靠性的要求。
原則
①按重要程度分配可靠度。②按複雜程度分配可靠度。
③按技術水平、任務情況等的綜合指標分配可靠度。
④按相對故障率分配可靠度。
各部分有了明確的可靠性指標後,根據不同計算準則,進行零件的設計計算。主要的計算方法為:根據載荷和強度的分布計算可靠度或所需尺寸;根據載荷和壽命的分布計算可靠度或安全壽命;求出可靠度與安全係數間的定量關係,沿用常規設計方法計算所需尺寸或驗算安全係數。與可靠性設計有關的載荷、強度、尺寸和壽命等數據都是隨機變數,必須用機率統計方法進行處理。
輔助措施
為了使設計時能充分地預測和預防故障,把更多的失效經驗設計到產品中,因而必須幫助設計人員掌握充分的故障情報資料和設計依據。採取以下措施:(1)可靠性檢查表,從可靠性觀點出發,列出設計中應考慮的重點。設計時逐項檢查。考慮預防的對策。
(2)推行FMEA,FTA方法。FMEA(失效模式影響分析)和FTA(故障樹分析)是可靠性分析中的重要手段。FMEA是從零部故障模式入手分析,評定它對整機或系統發生故障的影響程度,以此確定關鍵的零件和故障模式。FTA則是從整機或系統故障開始,逐步分析到基本零件的失效原因。這兩種方法在國外被看作是設計圖紙一樣重要,作為設計的技術標準資料,它收集總結了該種產品所有可能預料到的故障模式和原因。設計者可以較直觀地看到設計中存在的問題。
(3)故障事例集。把過去技術上的失敗和改進的事例作成手冊,供設計者隨進參考。通常用簡圖表示,將故障和改進作對比。對故障的原因、情況附有簡單說明。這手冊是各公司積累的技術財富,視同設計規範同等重要。
(4)資料庫。廣泛有效地收集設計、製造中的失敗和改進經驗,試驗和實際用的數據形成檢索系統和資料庫,使設計者能超越本單位充分利用別人實踐過的經驗。如電子產品已形成世界性可靠性信息交換網。
(5)設計、試驗規範的不斷充實、改善。從使用實際得來的故障教訓要反饋到設計、試驗方法的改進中,要將這些改進效果作為產品設計規範(包括材料選定,結構形式,許用應力,安全係數值)和試驗標準的改進依據,使它們成為設計技術的一部分。隨著可靠性工作開展。必須加強設計、試驗規範的研究,命名如試驗規範的制定要以實地使用條件分析為基礎,要調查出場的回收品和試驗室加速試驗件作對比,計算強化係數。通過失效分析反推,驗證試驗條件是否合適,從而不斷改進試驗方法和標準。因而這些規範都是公司的財富,對外不輕易泄密。如日本小松10年中試驗標準增加三倍,豐田的試驗標準有1500項之多。也可見各公司對試驗的重視程度。
分析
通過設計實現產品可靠性指標的方法。產品的可靠性是通過設計、生產和管理而實現的,而首先是產品的設計。它決定著產品的固有可靠性。電子產品可靠性設計技術包括許多內容,主要有可靠性分配、可靠性預測、冗餘技術、漂移設計、故障樹分析和故障模式、效應和致命度分析、元件器件的優選和篩選、應力-強度分析、降負荷使用、熱設計、潛在通路分析、電磁兼容和設計評審等。可靠性分配
根據用戶對系統或設備提出的可靠性指標,對分系統、整機等組成部分提出相應的可靠性指標,逐級向下,直到元件、器件、工藝、材料等的可靠性指標。可靠性分配是系統或設備的總體部門的一項可靠性設計任務。
對於有L個組成成分的系統,最簡單的情況是這些組成成分的可靠性是互相獨立的。若第i組成分不可靠,則系統就不可靠,系統可靠性為q=q1q2…qL〔若第i組成分的不可靠性為Pi=1-qi,則系統的不可靠性為P=1-q=1-(1-P1)(1-P2)…(1-PL)≈P1+P2+…+PL〕。這是系統可靠性分配的基本公式。可靠性分配本質上不是數學問題,而是人力、物力的統一調度和運用的工程管理問題。因為不同整機、元件、器件的現實可靠性水平是很不相同的,而把它們的可靠性提高到一定水平所需要的人力、物力和時間往往差別很大,因而不能採取均勻提高的純數學方案。在實際工作中,需進行多個方案的協調、比較後才能決定。
可靠性預測
主要是根據電子元件、器件的故障和產品設計時所用的元件、器件數和使用條件,對產品的可靠性進行估計。最簡單的情況是:產品由k種電子元件、器件組成,第i種元件、器件的壽命為指數分布,故障率為λi,用量為ni。任一元件和器件發生故障都會引起產品故障,故產品的故障率為λ=n1λ1+n2λ2+…+nkλk
這是在設計階段根據元件、器件的故障率對產品故障率提出預測的基本公式。在實際使用時,還要增加一些修正和補充。元件、器件的故障率還會隨環境和其他條件而發生變化。若實驗室條件下的元件、器件的故障率,則在環境A下的故障率為式中為元件、器件在環境A下的環境因子。在惡劣環境下,環境因子值可能很大。例如,飛彈發射環境下的環境因子可能達到20~80。用預測公式測得的λ值還需要乘上一個修正因子(1+α)。對於比較成熟的設計,α可取10%左右;對不太成熟的設計,α可取30%以上。預測的故障率與實際投入使用後的現場故障率有一些差異是正常的。事實上,在設計階段可靠性預測主要是相對可靠性,而不是絕對可靠性。
冗餘技術
當產品設計中發現某個組成部分的可靠性過低,影響產品的總可靠性指標時,便採取所謂冗餘技術來提高這一部分的可靠性。有k個組成部分的產品,各組成部分的可靠性是互相獨立的。若其中一個部分出故障,產品就出故障,則這些組成部分構成一個可靠性串聯繫統。若產品的第i部分的可靠性為qi,則產品的可靠性q=q1q2…qk;若其中的一個部分不出故障,產品就能完成預定任務,則這些組成部分構成一個可靠性並聯繫統。這時,q=1-(1-q1)(1-q2)…(1-qi)。
如果k=2,q1=q2=0.99,則組成可靠性並聯繫統後,q=0.9999。即經可靠性並聯後大大提高了可靠性。所謂“多數表決”冗餘技術,是只要k個組成部分中多數不出故障,產品就能完成預定任務。一般說來,很少使用整機作為冗餘的組成部分,通常是對整機的薄弱環節進行冗餘處理。
漂移設計
元件、器件的性能參數容許有一定的散布。其上限為上公差,下限為下公差。隨著出廠時間的增加,性能參數產生漂移。溫度和其他環境條件的變化也會造成參數漂移。只要元件、器件的漂移不超過公差的上、下限,就是合格的。電路的設計應該是,只要所用的元件、器件性能參數在規定的容許上、下限以內,電路的性能參數就應該是合格的,即使元件、器件的參數值到了規定容許的上、下限的邊緣,也應如此,這稱為電路的漂移設計。在滿足元件、器件規定容許的上、下限前提下,在理論分析上,元件、器件有一些最壞組合,使電路的性能參數產生最大的偏離。如果這些最壞組合產生的電路仍能滿足要求,則電路就滿足漂移設計要求,這也可以通過最壞組合的實際電路加以驗證,稱漂移試驗。但是,最壞組合方法往往偏於過分保守。如果能知道元件、器件性能參數的機率分布,則可以分析出電路性能參數的機率分布,從而作漂移分析和漂移試驗,這稱為機率法。這往往比最壞組合法更符合實際情況。
故障樹分析
1975年在美國Berkeley的加利福尼亞大學召開了一次盛況空前的可靠性學術會議。會議上把故障樹分析技術和可靠性理論並列為兩大進展,認為後者主要是數學家和機率論統計學家推動發展起來的,而前者則是工程師們推動發展起來的,兩者的側重點不同但是實質一樣的。
故障樹分析是美國貝爾實驗室1961年首創的一種系統分析方法。其優點是較易處理複雜系統,容易發現可能導致系統出現故障的情況,有利於消除潛在故障。在設計階段,它有助於發現系統的薄弱環節,是改進和提高設計可靠性的有力工具。故障樹是一種樹狀的邏輯因果關係圖,它利用一系列符號和邏輯門來描述各種事件之間的因果關係,使人們對這些關係一目了然。例如,基本事件的符號為○、結果事件的符號為嘑。邏輯門的輸入事件為因,輸出事件為果。以某房間照明系統為例,其原理和故障樹如圖。故障樹的定量分析是根據基本事件出現的機率,計算出系統不希望發生的故障事件的出現機率,定量地計算出系統薄弱環節的不可靠性,找出對系統可靠性有關鍵作用的元件、部件,通常是從求最小割集著手。一個最小割集包括若干個基本事件。如果這些基本事件都出現,系統就出故障。只要其中有一個不出現,割集中的其他基本事件都出現也不會使系統出故障。尋找所有最小割集的方法很多,但都未徹底解決工作量隨基本事件數的增加而指數增大這一困難。一個系統的故障樹是一本很好的故障維修指南。它能使維修人員迅速發現故障,進而迅速排除故障。
故障模式、效應、致命度分析
這種分析方法是將系統分成若干個組成部分。如果發生故障,分析它屬於哪種故障模式(不必一定查清故障的確切原因);分析各組成部分可能出現的故障模式對系統有什麼影響;對各種故障模式的影響進行半定性半定量的評價,對那些具有致命性影響的故障模式制定適當的解決措施或改進設計方案。這種分析方法是由系統的基本故障事件上推到系統故障,而傅立葉變換則是由系統故障下推到基本故障事件。兩者結合起來,相輔相成,可以在設計階段找出潛在的可靠性問題。
元件、器件的可靠性
可靠性質量保證體系的元件、器件的可靠性部門,通過調查研究制訂出本部門的元件、器件優選目錄,儘量壓縮元件、器件的品種、規格和生產廠點。設計人員不得選用目錄以外的元件、器件。如果設計人員認為必須選用目錄外的元件、器件,則應經過元件、器件可靠性部門調查試驗認為可用後,再正式補入目錄,以備選用。元件、器件可靠性部門與生產廠保持密切的聯繫,監督元件、器件生產質量的一致性和穩定性。必要時,派出專人監督本部門定購批次的生產。不論對元件、器件的生產過程如何嚴格控制,材料、工藝、生產環境等並不能絕對一致。因此,不可避免地有一部分產品會存在一些潛在的缺陷和弱點。這些有缺陷和弱點的電子元件、器件的平均壽命比正常產品的平均壽命短得多,使電子元件、器件的早期故障率較高。如果對電子元件、器件不加處理就裝入整機,便會使整機的早期故障率大大增加。因此,在把電子元件、器件裝入整機前,應採取施加強應力或其他手段,儘可能地剔除這種早期故障的產品。這就是電子元件、器件的可靠性篩選。篩選所加的強應力,可以是電的、熱的、機械的或綜合的。篩選項目須根據元件、器件的主要故障模式和故障機理,結合元件、器件的工藝設計、結構材料以及質量控制的情況而定。篩選不是提高產品的可靠性,它只能排除早期故障產品,使產品恢復其固有可靠性,但不能提高固有可靠性。如果元件、器件的篩選淘汰率較高,則說明設計、工藝或生產管理上存在較多問題,不易篩選徹底。這樣的元件和器件不宜用於高可靠性要求的部位。元件、器件可靠性部門應根據本部門的需要制訂元件、器件篩選條例,並規定出容許的篩選淘汰率。在一般情況下,元件、器件出廠越久,可靠性也就越低。因此,元件、器件可靠性部門應在調查研究和進行必要的試驗後,制定元件、器件保管和保管年限條例。
應力-強度分析
產品所受的應力x是廣義的,它不僅包括張力、扭力矩等,還包括如溫度、真空度等因素。產品的強度Y也是廣義的。若Z=Y-X,當Z<0時,即強度低於應力時,產品就出現故障;而當Z≥0時,產品是可靠的。Z為產品的可靠性余度,P(Z≥0)是產品的可靠度。
若X、Y分別是均值為μX、μY、方差為σ婌、σ婍的互相獨立的常態分配,則Z也是常態分配,均值為μZ=μY-μX,方差為σ婎=σ婌+σ婍。這是最簡單也是實際工作中最常見的情況,可靠度不僅決定於μZ的大小(即μY>μX的程度),而且還決定於σX及σY的大小。提高可靠度有兩種途徑:①使μY比μX大,即讓平均強度遠超過平均應力;②使σX與σY儘可能小,即嚴格控制產品強度的散布(往往須通過嚴格控制原材料和加工精度才能達到)和應力的散布(即進行環境設計)。在19世紀後期,習慣上把μY/μX稱為產品的安全係數。安全係數大,μY大於μX,可靠度可以有所提高。但這不是決定可靠性的唯一因素。如果對σX、σY不加控制,單純提高安全係數不一定能提高可靠性。因此,傳統的安全係數只反映了可靠度的一個方面,而不是全部。
當X或Y不是常態分配的隨機變數時,可靠性的解析式就比較複雜。蒙特卡羅法是分析這些較複雜情況下可靠性的有效方法之一。
電子元件、器件的負荷,就是施加於元件、器件的一種應力。降負荷使用元件、器件就是提高元件、器件的安全係數,從而可以在一定程度上提高元件、器件的可靠性。例如,某些電容器的故障率基本上正比於工作電壓V的5次方,就是電容器故障率的5次冪法則。使用的工作負荷與額定負荷之比稱為降負荷係數。可靠性質量保證系統的元件、器件可靠性部門,應根據本部門特點制訂降負荷係數要求。例如,一個有代表性的要求是,碳膜電阻和金屬膜電阻的使用功率不應達到額定功率的一半。
熱設計
使電子元件、器件在較低溫度下工作有三個好處:①參數漂移較小,電氣性能容易穩定;②故障率較低;③機械應力較小,金屬化接點等的蛻化較慢,壽命較長。因此,需要根據熱量傳播的規律,研究作為熱源的元件、器件的合理布局;採取什麼降溫措施可使設備的局部溫升不會過高,以保證設備的可靠性。這稱為熱設計。在簡單的情況下可利用自然冷卻,但能力有限。當功率密集度較大時,應採取強迫通風冷卻和水冷等措施。
潛在通路分析
潛在通路會在所有元件、器件工作正常的情況下導致出現不需要的功能,或使需要的功能受到抑制。潛在通路分析一般在設計階段後期或設計檔案完成之後進行。
設計評審
在設計的每一階段結束之前,由負責設計的部門組織有關專家對設計檔案從保證可靠性要求的各種角度和各個方面進行評定和審查。實際上,這是一種組織專家協助做好可靠性設計的一種技術評定會。由於可靠性設計牽涉的面太廣,憑設計人員個人的知識進行最佳的可靠性設計已不可能。因此,設計評審是一種有效的提高可靠性的補救辦法。