集成電路(IC)的單個(gè)元件非常小,其生產(chǎn)要求達(dá)到原子級(jí)的精度。集成電路是通過(guò)在由半導(dǎo)體材料(通常是硅)制成的晶圓上創(chuàng)建電路結(jié)構(gòu)。為了生產(chǎn)高密度集成電路,晶圓表面必須非常干凈,而且在前一個(gè)晶圓上制作的電路層應(yīng)該是對(duì)齊的。如果這些條件沒(méi)有得到滿足,高密度結(jié)構(gòu)可能會(huì)坍塌。
為了防止這種情況的發(fā)生,必須不斷地清洗晶圓以避免污染,并清除以前的工藝步驟的殘留物。然后,自動(dòng)缺陷分類(ADC)被用來(lái)使用掃描電子顯微鏡圖像來(lái)識(shí)別和分類晶圓表面缺陷。然而,目前ADC系統(tǒng)的分類性能很差。如果缺陷可以被正確分類,那么制造問(wèn)題的根源就可以被識(shí)別并最終解決。
機(jī)器學(xué)習(xí)技術(shù)已被廣泛接受,并且很適合此類分類問(wèn)題。基于卷積神經(jīng)網(wǎng)絡(luò)的雙重特征提取方法。提出的模型使用Radon拉冬變換進(jìn)行第一次特征提取,然后將此特征輸入卷積層進(jìn)行第二次特征提取。用真實(shí)的數(shù)據(jù)集進(jìn)行的實(shí)驗(yàn)驗(yàn)證了所提方法取得了較高的缺陷分類性能,缺陷模式識(shí)別準(zhǔn)確率高達(dá)98.5%,我們證實(shí)了所提特征提取技術(shù)的有效性。
對(duì)于集成電路的制造來(lái)說(shuō),Wafer Map上顯示的缺陷圖案包含了工程師尋找缺陷原因的關(guān)鍵信息,以提高良率。因此,分析晶圓圖缺陷的根本原因?qū)τ谔岣吡悸屎妥畲笙薅鹊靥岣吡己?a target="_blank">芯片的產(chǎn)量至關(guān)重要。然而,分析wafer map的傳統(tǒng)方法很耗時(shí),而且準(zhǔn)確度低?;谌斯さ姆椒ǖ臏?zhǔn)確率低于45%。
近年來(lái),許多都對(duì)晶圓缺陷模式識(shí)別問(wèn)題進(jìn)行了研究。應(yīng)用決策樹(shù)和神經(jīng)網(wǎng)絡(luò)對(duì)晶圓級(jí)芯片級(jí)封裝圖像進(jìn)行缺陷分類。對(duì)無(wú)監(jiān)督學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)來(lái)構(gòu)建晶圓圖的聚類。根據(jù)特定的故障模式對(duì)集群進(jìn)行了標(biāo)注,而wafer map則根據(jù)其與集群的接近程度進(jìn)行分類。這種方法的優(yōu)點(diǎn)是可以引入新的故障模式來(lái)識(shí)別表現(xiàn)出未知故障模式的wafer map。
wafer map可以轉(zhuǎn)換為圖像,wafer map故障模式識(shí)別適合于深度學(xué)習(xí),這是一種強(qiáng)大的監(jiān)督學(xué)習(xí)技術(shù),不需要人工設(shè)計(jì)特征。深度學(xué)習(xí)可以達(dá)到很高的分類精度,特別是在主要包括圖像分類的任務(wù)中。一種基于新型人工神經(jīng)網(wǎng)絡(luò)(ANN)架構(gòu)的快速而準(zhǔn)確的解決方案,使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)采用最先進(jìn)的技術(shù)進(jìn)行精確的光刻熱點(diǎn)檢測(cè)。將CNN用于缺陷模式分類和晶圓圖檢索任務(wù),證明了通過(guò)只使用合成數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)訓(xùn)練,真實(shí)的wafer map可以以高精確度進(jìn)行分類使用CNN和極端梯度提升技術(shù)對(duì)ADI(After Deveroper Inspection)缺陷進(jìn)行分類。CNN和極端梯度提升的測(cè)試數(shù)據(jù)集的總體分類精度分別為99.2%和98.1%。證明了這種技術(shù)在識(shí)別半導(dǎo)體晶圓的缺陷模式方面的成功。
方法
建議的方法有三個(gè)貢獻(xiàn)。首先,該方法只需要有和沒(méi)有目標(biāo)故障圖案的晶圓圖來(lái)識(shí)別,而不需要手動(dòng)設(shè)計(jì)故障圖案的特征來(lái)識(shí)別。第二,能夠在雙重特征提取的基礎(chǔ)上實(shí)現(xiàn)高識(shí)別精度。在這個(gè)模型中,使用Radon拉東變換進(jìn)行第一次特征提取,然后將此特征輸入卷積層進(jìn)行第二次特征提取。在這個(gè)過(guò)程中,可以在每一層學(xué)到豐富的特征,這些特征可以作為圖像檢索的良好描述符。最后,我們的方法可以擴(kuò)展到多類分類,以同時(shí)識(shí)別各種類型的故障模式。使用半導(dǎo)體制造的真實(shí)數(shù)據(jù)證實(shí)了框架的有效性。
A. 研究過(guò)程
有六個(gè)步驟(如圖1所示)。首先,探索了缺陷圖像的數(shù)據(jù)。其次,用以下方法對(duì)圖像進(jìn)行預(yù)處理:調(diào)整圖像大小、反轉(zhuǎn)像素強(qiáng)度等。然后,進(jìn)行特征提取。同時(shí)使用兩種方法來(lái)提取特征,Radon拉東變換和CNN。在模型的訓(xùn)練和測(cè)試中,將80%用于訓(xùn)練集,20%用于測(cè)試集。最后,用準(zhǔn)確率、精確度、召回率和F1-Score來(lái)評(píng)估所提出的方法的性能。
圖1. 模型訓(xùn)練和測(cè)試的工作流程
B. 數(shù)據(jù)探索
共有11種缺陷類型,包括殘留、劃痕、球狀、瓶狀、法隆、絲狀、多點(diǎn)、小顆粒、橢圓形和顏色標(biāo)記(如表一所示)。每個(gè)缺陷都有不同的特點(diǎn)和要素。例如,"Flask "的缺陷類型由鋁(Al)和氧(O)組成,"Falon "的缺陷類型由鐵(Fe)和鎳(Ni)組成,而 "Oval "的缺陷類型則由氟(F)組成。不同機(jī)器零件的老化會(huì)導(dǎo)致不同的缺陷。例如,"Flask"的缺陷包含鋁(Al)和氧(O)元素,主要來(lái)自化學(xué)氣相沉積(CVD)工藝腔室的靜電吸盤(ESC)(圖2)。
圖2. 靜電吸盤(ESC)的結(jié)構(gòu)
靜電吸盤是一種在施加于電極的電壓下在電極和物體之間產(chǎn)生吸引力的裝置。在CVD工藝的高溫高壓環(huán)境下,隨著靜電吸盤的老化,顆粒會(huì)落在晶圓表面。當(dāng)檢測(cè)到這種缺陷時(shí),這意味著CVD設(shè)備的腔體需要維護(hù),并以新的部件替換老化的部件。同樣,當(dāng)檢測(cè)到其他類型的缺陷時(shí),他們必須有自己的失控行動(dòng)計(jì)劃(OCAP),以確保半導(dǎo)體制造的質(zhì)量。
圖3. 缺陷 "Flask"的失控行動(dòng)方案
C. CNN的特征提取
卷積神經(jīng)網(wǎng)絡(luò)是受生物啟發(fā)的動(dòng)物視覺(jué)皮層的變體。有兩種類型的細(xì)胞:簡(jiǎn)單細(xì)胞和復(fù)雜細(xì)胞,其中簡(jiǎn)單細(xì)胞提取特征,而復(fù)雜細(xì)胞從空間鄰域結(jié)合幾個(gè)這樣的局部特征。CNN試圖模仿這種結(jié)構(gòu),以類似的方式從輸入空間提取特征,然后進(jìn)行分類。網(wǎng)絡(luò)中的每個(gè)卷積層包含許多特征圖。一個(gè)特征圖中的神經(jīng)元被約束為共享相同的權(quán)重。
參數(shù)共享的理念允許不同的神經(jīng)元共享相同的參數(shù)。為了完成這一任務(wù),隱藏的神經(jīng)元被組織成共享參數(shù)的特征圖。覆蓋圖像不同塊的特征圖中的隱藏單元共享相同的參數(shù),并從不同塊中提取相同類型的特征。一個(gè)圖像的每個(gè)區(qū)塊都與多個(gè)特征圖相關(guān)聯(lián),不同特征圖中的神經(jīng)元從同一區(qū)塊中提取不同的特征。圖4幫助我們清楚地理解了參數(shù)共享的過(guò)程:特征圖中的每個(gè)隱藏單元與圖像的不同塊相連,并提取相同類型的特征。不同特征圖中的隱藏單元從同一塊中提取不同的特征。
圖4. CNN中的參數(shù)共享
在一幅圖像中,區(qū)塊可以重疊。為了獲得每個(gè)隱藏單元的激活值,連接到特征圖的輸入通道的權(quán)重要乘以輸入向量。這種操作被稱為卷積?;旧?,我們專注于離散卷積。離散卷積操作可以定義為:
和是兩個(gè)函數(shù)。離散卷積是移位、乘法和加法運(yùn)算的組合。在這里,卷積操作是通過(guò)將權(quán)重矩陣與圖像的某些塊相加,然后將權(quán)重矩陣移到其他重疊的塊上。
D. Radon拉東變換的特征提取
Radon拉東變換是用于檢測(cè)圖像內(nèi)特征的技術(shù)之一。它基于圖像域直線的參數(shù)化和沿這些直線的圖像積分的評(píng)估。由于Radon拉東變換的固有特性,它是捕捉圖像方向性特征的一個(gè)有用工具。此外,Radon拉東變換是平移和旋轉(zhuǎn)不變的,所以它可以保留像素強(qiáng)度的變化。二維圖像函數(shù)在平面上的Radon拉東變換定義為:
其中是狄拉克函數(shù),是直線與原點(diǎn)的垂直距離,是距離向量形成的角度。
Radon拉東變換已被廣泛用于檢索邊緣檢測(cè)、紋理分類和計(jì)算機(jī)斷層成像中的圖像局部特征。圖5展示了一個(gè)缺陷圖像的Radon拉東變換的例子。在此,提出了一種新的方法,通過(guò)使用Radon拉東變換和卷積神經(jīng)網(wǎng)絡(luò)的組合來(lái)識(shí)別缺陷圖案。。
圖5. 原始圖像和Radon拉東變換在各自角度為0-170°時(shí)的比較
E. 模型架構(gòu)
使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)作為分類器的主要架構(gòu)。CNN是一個(gè)非線性過(guò)濾器的堆棧,它逐漸減少圖像的空間范圍,同時(shí)增加描述每個(gè)位置的圖像的過(guò)濾器輸出數(shù)量。在堆棧的頂部是一個(gè)多叉邏輯回歸分類器,它將表征映射到每個(gè)輸出類別("剩余"、"劃痕"、"球"、"駝峰 "等)的概率值。整個(gè)網(wǎng)絡(luò)通過(guò)反向傳播共同優(yōu)化,這通常是通過(guò)隨機(jī)梯度下降實(shí)現(xiàn)的 。
圖6. CNN模型結(jié)構(gòu)
嘗試將不同的卷積神經(jīng)網(wǎng)絡(luò)與Radon拉東變換相結(jié)合,作為缺陷模式識(shí)別的分類器,包括VGG16、Inception和ResNet。如圖7所示,RadonNet有兩個(gè)主要架構(gòu)。第一個(gè)是原始圖像的CNN。它基于卷積層和ReLU修正線性單元激活提取特征,然后通過(guò)參數(shù)共享將結(jié)果輸出到扁平化層。第二個(gè)是Radon拉東變換后的圖像的CNN。它可以在每個(gè)卷積層學(xué)習(xí)豐富的特征。最后,將這兩個(gè)結(jié)果結(jié)合起來(lái),輸出到具有sigmoid函數(shù)激活的全連接層。模型平均后,加入另一個(gè)具有通道11(缺陷類的數(shù)量)的全連接層。輸出是用于計(jì)算類別概率的softmax層。
圖7. RadonNet的結(jié)構(gòu)
F. 算法設(shè)計(jì)
RadonNet使用小批量隨機(jī)梯度下降法進(jìn)行訓(xùn)練(圖8)。在每次迭代中,隨機(jī)抽取n個(gè)圖像來(lái)計(jì)算梯度,然后更新網(wǎng)絡(luò)參數(shù)(W)。它在數(shù)據(jù)集中經(jīng)過(guò)次后停止。算法中的所有函數(shù)和超參數(shù)都可以在后面介紹的不同神經(jīng)網(wǎng)絡(luò)中實(shí)現(xiàn)。
圖8. CNN模型結(jié)構(gòu)
學(xué)習(xí)率
在訓(xùn)練任何深度學(xué)習(xí)模型時(shí),最難設(shè)置的參數(shù)之一是學(xué)習(xí)率。如果數(shù)值很大,模型的權(quán)重就會(huì)開(kāi)始振蕩,它們會(huì)有很大的變化,使模型無(wú)法適應(yīng)誤差的變化。如果學(xué)習(xí)率太小,會(huì)使模型的學(xué)習(xí)成本增加,很可能卡在局部最小值。在訓(xùn)練深度網(wǎng)絡(luò)時(shí),隨著時(shí)間的推移使學(xué)習(xí)率退火通常是有幫助的。在這里使用用Cosine decay作為學(xué)習(xí)率的函數(shù),它實(shí)證研究了CIFAR-10和CIFAR-100數(shù)據(jù)集的性能,這些數(shù)據(jù)集已經(jīng)被證明是最先進(jìn)的新結(jié)果。計(jì)算步驟如下:
其中可以被看作是一個(gè)基線,以確保學(xué)習(xí)率不會(huì)低于某個(gè)值。
2. 輸出設(shè)計(jì)
輸出層是一個(gè)全連接層,其隱藏大小等于所代表的標(biāo)簽數(shù)量,以輸出預(yù)測(cè)的置信度分?jǐn)?shù)()。如公式7所示,給定一個(gè)圖像,用表示類的預(yù)測(cè)分?jǐn)?shù)。這些分?jǐn)?shù)可以通過(guò)softmax算子進(jìn)行歸一化,得到預(yù)測(cè)的概率。讓表示softmax算子的輸出,類的概率可以通過(guò)以下公式計(jì)算:
其中,并且?,是一個(gè)有效的概率分布。
3. 損失函數(shù)
在訓(xùn)練過(guò)程中,使用負(fù)交叉熵?fù)p失函數(shù)的最小化來(lái)更新模型參數(shù),使這兩個(gè)概率分布彼此相似。如公式8所示,假設(shè)圖像的真實(shí)標(biāo)簽是,的真實(shí)概率分布()可以構(gòu)造為,否則可以構(gòu)造為0。
特別是,通過(guò)的構(gòu)造方式,我們知道?。最佳解決方案是?= 無(wú)限大,同時(shí)保持其他的足夠小。它可以促使輸出的分?jǐn)?shù)大大地與眾不同。
G. 數(shù)據(jù)擴(kuò)增
在深度學(xué)習(xí)中,我們經(jīng)常需要大量的數(shù)據(jù)來(lái)保證訓(xùn)練過(guò)程中不會(huì)出現(xiàn)過(guò)擬合。事實(shí)證明,數(shù)據(jù)擴(kuò)增可以解決數(shù)據(jù)不足的問(wèn)題,提高系統(tǒng)訓(xùn)練的準(zhǔn)確性。它是通過(guò)轉(zhuǎn)換訓(xùn)練數(shù)據(jù)來(lái)生成樣本的過(guò)程,目的是提高分類器的準(zhǔn)確性和魯棒性。我們使用以下方法作為數(shù)據(jù)增強(qiáng):隨機(jī)裁剪(512中的±64),隨機(jī)翻轉(zhuǎn)(±90°x i ,),隨機(jī)亮度(255中的±32),隨機(jī)飽和度(從50%到150%),隨機(jī)色調(diào)(0.5中的±0.2),以及隨機(jī)對(duì)比度(從50%到150%)。做完這些工作后,我們的眼睛也許還能認(rèn)出它是同一張圖片,但對(duì)機(jī)器來(lái)說(shuō),它是一張完全不同的新圖片。
結(jié)果
將這個(gè)方法與最先進(jìn)的深度學(xué)習(xí)方法在先進(jìn)的半導(dǎo)體工藝(5納米芯片)缺陷模式分類上進(jìn)行評(píng)估和比較。
A. 訓(xùn)練程序
首先,我們使用SGD優(yōu)化器訓(xùn)練模型,并將所有實(shí)驗(yàn)的批次大小設(shè)置為32。我們將初始學(xué)習(xí)率設(shè)置為10-4。使用準(zhǔn)確性、精確性、召回率和F1-score作為評(píng)價(jià)指標(biāo)。初始訓(xùn)練結(jié)果見(jiàn)表二。R-VGG16/ResNet50/R-InceptionResNetV2是與Radon拉東變換相結(jié)合的改進(jìn)模型。根據(jù)結(jié)果,RadonNet比原始模型有明顯的改進(jìn)。
B. 消融學(xué)習(xí)
為了證明RadonNet的實(shí)用性,進(jìn)行了嚴(yán)格的消融學(xué)習(xí),并在表三中顯示了定量比較。優(yōu)化器 "的策略顯示了使用SGD(隨機(jī)梯度下降)和Adam(自適應(yīng)矩估計(jì))作為優(yōu)化器的準(zhǔn)確性。Adam結(jié)合了SGD和RMSprop(Root Mean Square Propagation)的功能,保留了動(dòng)量來(lái)調(diào)整過(guò)去梯度方向的梯度速度,同時(shí)也調(diào)整了梯度值平方的學(xué)習(xí)率。這將使參數(shù)更新更加穩(wěn)定,以獲得更好的訓(xùn)練效果。
“學(xué)習(xí)率"的策略通過(guò)Cosine decay來(lái)顯示訓(xùn)練結(jié)果。在使用Cosine decay的情況下,訓(xùn)練結(jié)果比使用固定的學(xué)習(xí)率要好。最后,帶有數(shù)據(jù)增強(qiáng)的R-InceptionResNetV2是最好的模型,準(zhǔn)確率為98.5%。
C. 主要結(jié)果
用三個(gè)評(píng)價(jià)指標(biāo)驗(yàn)證了所提模型的有效性:精度、召回率和F1-score。表四顯示了11種缺陷類型的驗(yàn)證模型的性能。所有缺陷類型的精確度都在95%以上。除了 "Silk "和 "Multi-dots "的缺陷類型,其他兩個(gè)指標(biāo)也都高于95%。這可能是由于其結(jié)構(gòu)不確定,容易與其他缺陷形狀相混淆。
表五是混淆矩陣,它顯示了以百分比表示的每類分類的準(zhǔn)確性。由于保密的原因,只能提供每類的準(zhǔn)確性,而不是晶圓的絕對(duì)數(shù)量。在這個(gè)表格中,標(biāo)簽(基礎(chǔ)事實(shí))顯示在左列,而建議的方法的預(yù)測(cè)結(jié)果在最上面一行。對(duì)角線上的元素代表每種類型的識(shí)別率。大多數(shù)缺陷類型的準(zhǔn)確率都大于97%??傮w準(zhǔn)確率為98.5%。
成功地將雙特征提取技術(shù)用于晶圓缺陷分類。提出了一種新的ADC方法,結(jié)合了Radon拉東變換和卷積神經(jīng)網(wǎng)絡(luò)。Radon拉東變換可以從晶圓表面缺陷圖像中提取有效特征。CNN將圖像轉(zhuǎn)換為深度維度,用于第二次特征提取。然后,神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)這個(gè)豐富的特征來(lái)識(shí)別什么類型的缺陷。使用真實(shí)的缺陷圖像數(shù)據(jù)集進(jìn)行的性能評(píng)估實(shí)驗(yàn)得出的分類準(zhǔn)確率平均為98.5%。證明了新的ADC方法對(duì)晶圓圖故障模式識(shí)別是有效的。
編輯:黃飛
?
評(píng)論