|
異常診斷 在電子制造業(yè)企業(yè),由于器件尺寸比較小、生產(chǎn)周期比較短等特征,設(shè)備及產(chǎn)品的異常診斷能力變得非常重要,其能力的強(qiáng)弱甚至在某種程度上成為企業(yè)競(jìng)爭(zhēng)力的一部分。如何快速、高效地識(shí)別這些異常,如何利用計(jì)算機(jī)系統(tǒng)輔助人類做好提前預(yù)警和分析,成為企業(yè)提效增質(zhì)、提高良率不可或缺的一項(xiàng)重要競(jìng)爭(zhēng)優(yōu)勢(shì)。
今天我們以高科技電子行業(yè)的一個(gè)案例為例,來(lái)看看如何通過(guò)強(qiáng)大的神經(jīng)網(wǎng)絡(luò)建模 獨(dú)特的可視化分析,幫助數(shù)據(jù)分析人員大幅減少異常芯片的識(shí)別與偵測(cè)時(shí)間,從而從根本上為企業(yè)提效增質(zhì)。 本文作者袞雪,JMP特約專欄作者,數(shù)據(jù)分析愛(ài)好者。如果你也想成為JMP合作專欄作者,或者想投稿,歡迎在微信公眾號(hào)對(duì)話框私信小編,或發(fā)送郵件至 jmpmarketing@sas.com 和小編聊聊哦~ 為什么科學(xué)的分析如此重要? 眾所周知,質(zhì)量對(duì)于公司來(lái)說(shuō)意味著制造成本、出貨周期和品牌價(jià)值。所以幾乎每家企業(yè)都把質(zhì)量看作重中之重。那么如何改善企業(yè)的基準(zhǔn)質(zhì)量水平則是一項(xiàng)艱巨的任務(wù)。
以上是常見(jiàn)的電子類企業(yè)的典型生產(chǎn)步驟,其中: 1 晶圓生長(zhǎng) 晶圓生長(zhǎng)是指半導(dǎo)體集成電路制作所用的硅晶片,由于其形狀為圓形,故稱為晶圓;在硅晶片上可加工制作成各種電路元件結(jié)構(gòu),而成為有特定電性功能的集成電路產(chǎn)品。 2 封裝工藝 封裝工藝是將通過(guò)測(cè)試的晶圓按照產(chǎn)品類型及功能需求加工得到獨(dú)立芯片的過(guò)程。 3 最終測(cè)試 最終測(cè)試是通過(guò)一系列的檢測(cè)項(xiàng)目來(lái)偵測(cè)每顆獨(dú)立芯片的好壞的過(guò)程。 我們重點(diǎn)看下這里的“最終測(cè)試”步驟,也即是檢測(cè)整個(gè)晶圓上所有芯片質(zhì)量的過(guò)程。 在最終測(cè)試階段,傳統(tǒng)方法采用的是人工識(shí)別,即通過(guò)個(gè)人判斷將有問(wèn)題的晶圓圖一一記錄下來(lái),再做后續(xù)處理工作。然而實(shí)際工作中,人工識(shí)別常常會(huì)面臨以下問(wèn)題: 1 漏檢圖形 每個(gè)人在面臨上百?gòu)埦A檢測(cè)圖的時(shí)候,幾乎不可能做到每張圖一一過(guò)目,很可能由于疲勞等因素錯(cuò)過(guò)了一些重要的圖形,而這些圖形往往蘊(yùn)藏著潛在的信息。 2 耗時(shí)過(guò)長(zhǎng) 即使個(gè)人能夠在力所能及的范圍內(nèi),觀察到一些晶圓檢測(cè)圖,但整個(gè)過(guò)程非常耗時(shí),沒(méi)有將人工的時(shí)間用在解決核心問(wèn)題上。 3 標(biāo)準(zhǔn)不統(tǒng)一 對(duì)于沒(méi)有出現(xiàn)過(guò)的圖形,其判斷標(biāo)準(zhǔn)會(huì)隨著個(gè)人的標(biāo)準(zhǔn)不同有所差異,這樣同樣會(huì)造成潛在信息的丟失。 基于以上這些不可避免的因素,計(jì)算機(jī)高科技領(lǐng)域可視化分析技術(shù)就能夠大顯身手了。比如,我們把每顆獨(dú)立芯片的檢測(cè)結(jié)果按照它們?cè)诰A上面的位置一一對(duì)應(yīng),所得的檢測(cè)結(jié)果輸入到JMP軟件,借助于JMP獨(dú)特的可視化神器——圖形生成器,就可以輕松生成以下的晶圓檢測(cè)圖,從而快速地識(shí)別出有問(wèn)題的產(chǎn)品。
其中,不同顏色代表著最終測(cè)試檢測(cè)值的大小。紅色最大,依次遞減,藍(lán)色最小。 從圖上輕松看到,晶圓右下方藍(lán)色部分的檢測(cè)值偏低。這意味著什么呢?意味著在晶圓生長(zhǎng)的時(shí)候這一區(qū)域有異常,需要盡快調(diào)查及解決。這樣工程師就可以馬上著手針對(duì)這類有問(wèn)題的芯片進(jìn)行快速跟進(jìn)了。 那么,具體該如何開展實(shí)施呢?我們以一個(gè)案例來(lái)說(shuō)明。 案例 背景 某電子企業(yè)的工程師在最終測(cè)試階段收集到了1559個(gè)芯片的缺陷數(shù)據(jù),想分析其中某一項(xiàng)缺陷的比率隨著位置的變化是否呈現(xiàn)規(guī)律。
通過(guò)這種缺陷圖形的尋找,最終為前道諸多工序建立另一種質(zhì)量偵測(cè)手段或者指標(biāo),可以作為整體質(zhì)量提升的突破。
在數(shù)據(jù)表中,LocX和LocY列分別是行、列坐標(biāo)值,數(shù)值類型為名義值。最后一列為缺陷率,即在過(guò)去一段時(shí)間內(nèi)某一位置出現(xiàn)缺陷的比率。 為了更好地判斷問(wèn)題,項(xiàng)目團(tuán)隊(duì)最終選擇了神經(jīng)網(wǎng)絡(luò)算法。原因有以下幾點(diǎn): 1 項(xiàng)目需要算法能夠從原始數(shù)據(jù)中自動(dòng)發(fā)現(xiàn)需要檢測(cè)的特征。 2 神經(jīng)網(wǎng)絡(luò)的算法一般都有多個(gè)層次,每一個(gè)層次做一次變換,這樣可以有多次機(jī)會(huì)抓取不同特征。 3 通常來(lái)說(shuō),用來(lái)做訓(xùn)練的數(shù)據(jù)量越多,可以更好地提高其準(zhǔn)確性。 一圖勝千言!接下來(lái)我們看看如何在JMP中一步步實(shí)施分析。 1 首先,將數(shù)據(jù)導(dǎo)入JMP,把收集到的位置缺陷率轉(zhuǎn)換為數(shù)據(jù)值并通過(guò)圖形生成器來(lái)呈現(xiàn)。 打開JMP菜單:分析(Analyze) -> 預(yù)測(cè)建模(Predictive modeling) -> 神經(jīng)(Neural),把需要觀測(cè)的缺陷率放在“Y,Response”,把Loc X和Loc Y放入“X,F(xiàn)actor”:
進(jìn)入模型配置窗口,按照以下參數(shù)輸入。本例從默認(rèn)的神經(jīng)網(wǎng)絡(luò)模型開始,逐步增加更復(fù)雜的模型有兩個(gè)隱藏層和其他的激活函數(shù)。最終選定以下配置(截圖所示)。 在fitting option部分,告訴JMP重復(fù)多少次模型擬合算法。最終JMP會(huì)選擇具有最佳驗(yàn)證統(tǒng)計(jì)量的迭代作為最終模型。本文最終采用10.
點(diǎn)擊Model左邊紅色小箭頭,選擇保存公式(Save Formulas),主要是為了存儲(chǔ)變換之后的數(shù)值以備用。
這樣經(jīng)過(guò)行列轉(zhuǎn)換后,得到以下新的數(shù)據(jù)表:
如果用圖形來(lái)簡(jiǎn)單說(shuō)明轉(zhuǎn)換過(guò)程的話,就如下圖所示:
2 接下來(lái),應(yīng)用JMP 獨(dú)有的“圖形生成器(Graph Builder)”開展分析。 這里我們將LocX放到橫軸,LocY放到縱軸,Transform Value放到右上角的Color中,點(diǎn)擊Graph Builder下面的紅色小箭頭,選擇Local Data Filter:
在Local Data Filter下選擇Label:
然后,再選擇紅色小箭頭——“Animation”,得到以下動(dòng)態(tài)圖形:
這個(gè)動(dòng)圖主要展示了JMP在內(nèi)部運(yùn)算過(guò)程中是如何逐一掃描整個(gè)wafer,最終找到最優(yōu)解的過(guò)程。其中H1_1是指第一個(gè)隱藏層的第一個(gè)節(jié)點(diǎn),以此類推。 這就是在模型構(gòu)建層面我們的思路和策略。那么,具體到實(shí)際項(xiàng)目的應(yīng)用層面,應(yīng)該怎么部署和分析呢?我們來(lái)繼續(xù)探討。
落地應(yīng)用:項(xiàng)目部署及成效
按照上面JMP生成的模型,接下來(lái)我們就可以部署在應(yīng)用層面。 在部署層面,實(shí)際上我們只需要建立一個(gè)ranking model,即排序模型。這個(gè)模型不需要保證每一個(gè)計(jì)算結(jié)果都非常精確,最重要的是能夠在多個(gè)wafer map中抓到最顯著的圖形即可。由于數(shù)據(jù)量較大以及服務(wù)器是Linux系統(tǒng)(相對(duì)穩(wěn)定),故而采用python程序從數(shù)據(jù)庫(kù)中提取數(shù)據(jù),根據(jù)以上神經(jīng)網(wǎng)絡(luò)方法把有問(wèn)題的wafer map按照RSquare排序。
之所以選擇RSquare排序,是想按照模型的顯著性來(lái)代表是否抓到了pattern。即模型越顯著,代表著抓到pattern的可能性越大。關(guān)于Generalized R-Square如何計(jì)算(截圖所示),可參考之前我們推送的文章“我的智造我做主-一個(gè)案例帶你看明白神經(jīng)網(wǎng)絡(luò)如何助力企業(yè)提速增效”。 舉例如下,這里有以下7類次品(從Defect A到Defect G),每一行代表wafer map上X,Y坐標(biāo),以及在相應(yīng)坐標(biāo)位置上不同次品類型分別累計(jì)(某一周)的缺陷率。
按照上一節(jié)介紹的算法以及RSquare排序如下,這時(shí)我們發(fā)現(xiàn)Defect C和Defect A是所有類型的次品中值最高的(如果定義閾值為>0.7的話,當(dāng)然閾值可以根據(jù)案例自己定義)。
那么經(jīng)過(guò)Graph Builder 生成的Defect C和Defect A次品圖形確實(shí)非常值得研究,而值最低的Defect D,經(jīng)過(guò)Graph Builder畫出wafer map后圖形確實(shí)不明顯。 Defect C(RSquare值高)-右側(cè)邊緣圖形:
Defect A(RSsquare值高)-中心右上方圖形:
Defect D(RSsquare值低)-幾乎看不出圖形
以下是系統(tǒng)架構(gòu)示意圖:
需要注意的是,人工根據(jù)樣本數(shù)據(jù),通過(guò)JMP計(jì)算,需要每個(gè)月為模型更新第一層和第二層layer中的節(jié)點(diǎn)數(shù)(比如對(duì)于新出現(xiàn)的pattern,當(dāng)前配置是否可以識(shí)別到,需要考慮調(diào)整節(jié)點(diǎn)數(shù)等),以便使模型的計(jì)算更加有效。 通過(guò)這個(gè)方法,經(jīng)實(shí)踐證明,企業(yè)中每名數(shù)據(jù)分析人員平均每周減少60%的圖形識(shí)別時(shí)間,而且異常圖形平均偵測(cè)時(shí)間累計(jì)較以前縮短70%,為企業(yè)質(zhì)量管控整體水平提升做出了巨大的貢獻(xiàn)。
思考:你的企業(yè)是否遇到同樣問(wèn)題? 通過(guò)上述實(shí)戰(zhàn)案例我們可以看到,產(chǎn)品的良率偵測(cè)僅僅依靠人工不僅耗時(shí)耗力,還容易出現(xiàn)錯(cuò)誤、漏檢等情況,而重要的質(zhì)量風(fēng)險(xiǎn)卻往往隱藏在某些人工無(wú)法識(shí)別的地方。 這就好比一座冰山,人們往往關(guān)注露出水面部分的問(wèn)題,但是水面以下的部分往往由于各種原因沒(méi)有辦法看到。
借助于先進(jìn)的計(jì)算機(jī)系統(tǒng)和技術(shù),可以很好地解決問(wèn)題:
事實(shí)上,不僅僅是在電子類企業(yè),對(duì)于醫(yī)療、環(huán)保、生物保護(hù)等各個(gè)領(lǐng)域,如果能將圖像識(shí)別與可視化技術(shù)廣泛結(jié)合起來(lái)使用,必將為疾病的早期診斷與治療、環(huán)境的異常偵測(cè)與保護(hù)、野生動(dòng)物身份識(shí)別與保護(hù)等提供科學(xué)的技術(shù)支撐和推動(dòng)作用。 推薦閱讀
我的智造我做主,一個(gè)案例帶你看明白神經(jīng)網(wǎng)絡(luò)如何助力企業(yè)提速增效
預(yù)測(cè)建模霧里看花,如何找到你的一些小歡喜?
神技能!如何用神經(jīng)網(wǎng)絡(luò)挑選一個(gè)好西瓜?
最后,微信又雙叒叕地改版了!希望各位看完動(dòng)動(dòng)小手給我們點(diǎn)個(gè)【在看】哦!不然我們推送的內(nèi)容也會(huì)排在后面,不能被第一時(shí)間看到了。 對(duì)了,你還可以將JMP“設(shè)為星標(biāo)”,確保不會(huì)錯(cuò)過(guò)推送~
JMP官方微信公眾號(hào) 敏捷分析 成就無(wú)限
點(diǎn)擊“ |
|
|