版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、.PAGE :.;建構半導體製造過程產品異常資料挖礦技術之研討梁蕙姿 簡禎富 彭金堂國立清華大學工業(yè)工程與工程管理研討所國立清華大學工業(yè)工程與工程管理研討所元培科學技術學院經營管理研討所摘 要為因應半導體製造過程中產品製程技術的快速變化、複雜產品組合及生產週期時間長的生產環(huán)境,如何在自動化系統(tǒng)輔助的大量生產之下,在製造過程中提供工程人員可確認正確的製程參數,以及發(fā)現產品異常時可立刻針對問題的特徵進行問題真因追蹤與分析,針對獲得的資訊進行合適的決策並將能夠已受影響的產品列表管理,以減少產品的良率損失,已成為重要的產業(yè)應用與學術研討議題。本研討目的係研討資料挖礦技術中關聯規(guī)則的Apriori 演算
2、法,結合半導體領域知識,將製造過程中追蹤已發(fā)生問題的解決方式,進行關聯資料的搜尋並予以方式化,並利用決策樹歸納法進行可疑緣由區(qū)別的建議;本研討並建構此半導體製造過程中的資料挖礦應用系統(tǒng)雛型,而以目前半導體製造中自動化系統(tǒng)所蒐集的資料結合此方法而建構一半導體製造過程中的資料挖礦應用系統(tǒng)為此研討的實作驗證,以完好地檢驗資料挖礦的方法與步驟進行大量資料的篩選、推演與方式建構等過程;結論歸納本研討結果與貢獻,並探討未來研討方向。關鍵字:資料挖礦、決策分析、半導體製造管理、關聯規(guī)則The Study of Data Mining Techniques for Analyzing Semiconducto
3、r Manufacturing Product AbnormalHui-Tzu Liang Chen-Fu Chien Jin-Tang PengDepartment of Industrial Engineering and Engineering Management, NationalDepartment of Industrial Engineering and Engineering Management, NationalGraduate Institute of Yuanpei Institute of Science and TechnologyABSTRACTThe envi
4、ronment within the semiconductor industry is one that is made up of rapidly changing technologies, complicated product groups, extensive production hours. The following points have become crucial issues for industrial application and academic research within the semiconductor industry: methods by wh
5、ich accurate processing parameters may be provided for engineers to confirm to, within an automation system during mass production; methods by which abnormal wafers may be instantly tracked and analyzed, based on the problems/defects of each individual case; methods by which obtained data may be app
6、ropriately processed, by which affected products may be managed through a report chart, and by which yield loss of products may be lessened.This study will focus on the Apriori algorithm used in data mining technologies, and will incorporate working knowledge of the semiconductor industry, to search
7、 for, and to develop the solution used to track existing problems within the fabrication process. The decision tree analysis method will also be used to categorize and differentiate possible problem sources. This study will also configure an initial prototype of a data mining application system to b
8、e used within the semiconductor fabrication process. The data mining application system produced from combining this prototype with the automation system currently used for semiconductor fabs will be set forth as a feasible example in this study, and comprehensive data will be filtered, calculated,
9、and modeling, based upon data mining methods and procedures. Research results of this study will be classified and organized, and a goal for future studies will be examined. Keywords:Data Mining、Decision Analysis、Semiconductor Manufacture Management、Association Rule一、前言我國半導體產業(yè)不論是產值、全球佔有率、或是自給才干近年來皆有
10、顯著的表現。根據統(tǒng)計1987年時臺灣半導體產品產值達全球的0.6%,在企業(yè)與政府的全力協作及衝刺之下,於1995年已上升至2.6%(何宜佳,民92)。在半導體製造技術日趨進步與純熟之下,已進入八吋、十二吋晶圓的年代,這其中大量資金的投入是不可或缺的,特別是十二吋晶圓廠其所投入的金額約需30億美圓。因此,在如此龐大的投資金額與技術快速變化之下,如何規(guī)避經營風險已是臺灣甚至全球半導體業(yè)者共同面對的重要課題。在半導體廠製造環(huán)境中,不乏包含200種以上的製程與設備種類,假設以半導體製程的創(chuàng)新速度與產品多樣性生産特性、或是生産才干及其大批量生産方式發(fā)展而言,對於目前已存在的八吋廠或是十二吋廠來說,不論是
11、製程設備或是自動化系統(tǒng)的規(guī)劃上,皆會影響晶圓廠的本錢與生產效率。因此,為因應製造過程中產品的製程技術變化、以及在自動化系統(tǒng)的輔助大量生產之下,如何在製造過程中提供工程人員可確認正確的製程參數、以及發(fā)現產品異常時,可立刻針對問題的特徵進行問題真因追蹤與分析,並將能夠已受影響的產品列表管理,以減少產品的良率損失與如何針對獲得的資訊進行合適的決策,將是生產人員所必須面對的挑戰(zhàn)。就目前的企業(yè)對於數以百萬筆的歷史資料處理方式而言,當產品發(fā)生異常或為特定任務而必須得到部份資訊的援助時,假設將其一一分類並運用於分析上,其實是件耗時且相當困難的任務;通常在自動化系統(tǒng)中資料庫僅記錄現場正運用的已設定參數值,因此
12、當產品被發(fā)現已產生異常時往往無法及時獲得當時製造過程中的參數設定值,必須依賴製程或設備工程人員的紀錄或是其他備份的資料庫,資料不易獲得且方法繁雜。但由於資料挖礦(Data Mining)技術的發(fā)展,使得從龐大複雜的資料中萃取出隱含有用的資訊,以客觀的統(tǒng)計分析提供快速且正確的訊息變?yōu)槟軌颉YY料挖礦技術是一種統(tǒng)計工具的應用,其結合該產業(yè)領域的專業(yè)與資料庫知識,從資料庫或其他資料儲藏系統(tǒng)中,針對大量的資料進行篩選、推演與方式建構等程序,以發(fā)掘隱含在資料與方式中的訊息進而轉換成為商機,或是提供決策者新的知識以利於決策的進行簡禎富等,民90;簡禎富等,民92。因此,本研討將以目前半導體製造中自動化系統(tǒng)所
13、蒐集的資料結合資料挖礦技術的應用,建立半導體製造過程中所蒐集資料的資料挖礦分析,以提供工程師問題追蹤的另一種方法的選擇。本研討是運用半導體自動化系統(tǒng)的資料庫為資料挖礦的資料來源,並運用資料挖礦中的關聯規(guī)則作為分析問題的方法,藉此協助製程工程人員如何在大量的生產資料中找出能夠隱藏的訊息,以快速的找出與問題相關性的關聯資訊,確保問題能在較短的時間內予以解決,不至於呵斥產品的損失擴大。因此本研討目的有以下三點建構一半導體製造過程中所蒐集資料的資料挖礦分析方法,以發(fā)現資料中隱含的有用資訊,以提供決策者參考。建構製造過程中製程參數與機臺資料的關聯規(guī)則,以提供一可追蹤產品、製程或設備參數設定值的有用資訊,
14、幫助製程或設備工程人員進行問題追蹤。針對問題的特徵進行大量資料的匯整並發(fā)掘其中隱含的資訊,以協助工程人員的問題真因追蹤與分析,並將能夠已受影響的產品列表管理,以減少產品的良率損失。二、文獻探討2-1半導體製程半導體技術變化快速,目前已進入深次微米的時代,產業(yè)的生產趨勢將是集中資源於最具中心競爭力產品的生產方式。過去政府對於半導體產業(yè)的推動與規(guī)劃不遺餘力,自設置科學工業(yè)園區(qū)開始,陸續(xù)引進該產業(yè)的科技工業(yè)及科技人才,並著手培訓國內人才以帶動我國工業(yè)技術的研討與創(chuàng)新,以促進高科技產業(yè)生根發(fā)展,加速我國的經濟建設為目的。目前在半導體產業(yè)的硬體建設上雖可滿足產業(yè)的大量需求,但是隨之而來的將是如何在快速生
15、產與大量產能中,提升良率與及時發(fā)現異常等問題。半導體的製造流程是由矽晶圓開始,經過一連串製程步驟,如圖1半導體製程表示圖中,包括最初的磊晶沉積、沉積、微影處理的光學顯影、快速高溫製程、化學氣相沉積、離子植入、蝕刻、化學研磨與製程監(jiān)控等前段製程,以及封裝、測試等後段製程才可完成一顆可運用的IC。自1947年發(fā)明電晶體後,新的技術亦不斷的被發(fā)現,其技術的創(chuàng)新與快速使得積體電路製造在短短的數十年間迅速發(fā)展至今日的奈米半導體製程。圖 SEQ 圖表 * ARABIC s 1 1 半導體製程表示圖2-2晶圓廠自動化系統(tǒng)半導體產業(yè)的自動化製造系統(tǒng)普通稱之為CIM(Computer Integrated Ma
16、nufacture),CIM是以IT技術應用於製造環(huán)境中,將公司內部各個獨立的部分自動化系統(tǒng)加以整合使生產作業(yè)自動化,以因應大量產品的需求與產品品質的提升,進而發(fā)揮整體的效益。關於晶圓廠自動化系統(tǒng)之資料倉儲,以前段製程FAB生產流程中的Lot Transportation、Lot History、Recipe、Data Collection等四種資料流來了解在自動化系統(tǒng)的製造環(huán)境中,系統(tǒng)是如何紀錄與獲得各產品的生產資料以及所需求的資料是存放於何處。首先是Lot Transportation,系統(tǒng)中將會紀錄每一批產品在製造過程中即時的資料,如進出機臺的時間、運用的參數、製造時間等,並將這些經過設
17、計存放的資料依需求將其存放於固定的空間,以作為資料分析的依據,這也就是所謂的Lot History;系統(tǒng)對與Lot Transportation與Lot History的存放方式是在製造過程中同時進行的。其次是Recipe即製程參數的資料流,當運用者透過自動化系統(tǒng)的介面獲得機臺與Lot ID的關係之後,系統(tǒng)將提供一組適合該Lot在此機臺製造的參數,這就是自動化系統(tǒng)所帶來的便利之一。最後的一項資料流Data Collection,一批Lot在製造的過程中是需求不斷的進行檢測以確保產品的品質,生產機臺也是如此必須在固定時間或生產片數達一定數量後進行檢測與維護,所以在這些過程中系統(tǒng)將會依據所設計的蒐
18、集條件完好的紀錄資料,而這些資料也將會是所需的部分。不論是即時的生產資料或是歷史資料將存放在系統(tǒng)所指定的資料庫中。通常自動化製造系統(tǒng)的資料庫中除了儲存產品製造時所需的機臺、產品、製程參數等根本資料之外,也包含生產過程中各需求點的量測值與量測規(guī)格需求。這些資料經過規(guī)劃之後有規(guī)則的將及時資料與歷史資料個別置於關聯的資料項中,並適當適時的進行儲存與備份的任務。也因此當工程人員欲進行資料追蹤或異常產品緣由清查時,往往必須透過多方單位的資料援助與溝通即費時又浪費人力,容易延誤問題的解決,所以如何解決工程人員快速的獲得資料與正確的分析資料是各企業(yè)所需求的。在本研討中將以資料挖礦的技術建立一適合運用者查詢與
19、分析資料的方法,以協助工程人員的問題追蹤與分析。2-3資料挖礦對於資料挖礦的意義有很多學者提出不同的解釋,也提出很多意義相近卻不同的名稱,例如資料庫知識發(fā)現Knowledge Discovery in Databases; KDD、知識萃取Knowledge extraction、資料考古學Data archeology、資料捕撈Data dredgingHan and Kamber, 2001。而比較常用的名稱是資料挖礦與資料庫知識發(fā)現,Fayyad et al. (1996)定義資料庫知識發(fā)現的過程是,一個包含很多重要搜尋步驟的程序過程,從資料中來發(fā)現有效的、新穎的、潛在有用的、以及最終可
20、了解的樣型,資料挖礦是知識發(fā)現過程中一個最關鍵的步驟;Berry and Linoff (1997)則定義資料挖礦是經由自動或半自動的方式探求和分析資料,從大量資料中能夠擷取出有意義的樣型和規(guī)則。綜合以上,資料庫知識發(fā)現和資料挖礦的目的皆一樣,同樣是從資料庫的大量資料中發(fā)現有用的資訊以提供決策者參考,只是資料庫知識發(fā)現描畫出資料準備階段之過程,也就是資料如何從資料庫轉換成資料挖礦工具可運用的程序皆完好的描畫,然而要達到資料挖礦的目的,資料挖礦的定義已隱含有資料準備的概念,因此,可直接採用資料挖礦此一名詞。也因此,本研討定義資料挖礦為經由自動或半自動的方式探求和分析資料,從大量資料中能夠擷取出有
21、意義的樣型和規(guī)則,發(fā)現事先未知的隱含資訊與知識,以提供決策者相關的參考資訊。資料挖礦中所運用的發(fā)掘技術與類型,通常包含關聯規(guī)則、分類規(guī)則、叢集規(guī)則、預測分析、趨勢分析、偏向分析等類型。為完成以上的各類型,在資料挖礦的技術中將運用資料庫理論、資料倉儲、人工智慧、機器學習、統(tǒng)計學等領域,包含統(tǒng)計分析方法(Statistical Analysis)、決策樹(Decision Tree)、類神經網路(Neural Network)、基因演算法(Genetic Algorithms)、粗糙集(Rough Set)、線上分析處理 (OLAP)的技術等。2-4關聯規(guī)則關聯規(guī)則是資料挖礦方式中最常被應用方式之
22、一Berry and Linoff, 1997; Han and Fu, 1999; Han and Kamber, 2001; Tung et al., 2003; 陳家仁等,民92。關聯規(guī)則主要是從龐大資料中,探求資料間欄位的相關性。過去對於關聯規(guī)則已有相當多的研討,也證明關聯規(guī)則為一有效之方法,其方法的特性主要是,關聯規(guī)則能容易解釋其產生的規(guī)則,且可完好呈現變數之間的影響,但篩選規(guī)則的條件設定很重要,否則條件太鬆能夠呵斥結果多且凌亂,相反地,假設條件太嚴能夠忽略掉一些罕見變數的有趣樣型。關聯規(guī)則方法是Agrawal et al.在1993年提出,T是指一筆買賣記錄Transaction內
23、物品項的集合。而D則是一切買賣記錄T的集合。假假設在集合D中,項目X與項目Y產生關聯規(guī)則,表示當買賣記錄T有項目X時,有很大機會也會同時有項目Y,此規(guī)則可表示為XYIf X, then Y,X為前提項目組Antecedent item set,Y為結果項目組Consequent item set,X和Y皆為一切相異物品項目集合的子集合,且。針對每一項關聯規(guī)則If X, then Y可以用支持度Support、信賴度Confidence以及增益Lift等三個指標來評估其成效和重要性。此三項指標的計算公式與物理意義分別闡述如下:支持度:,即代表前提項目X與結果項目Y一同出現的機率。也就是在規(guī)則中,
24、前提項目X與結果項目Y一同出現的買賣記錄筆數佔全部買賣記錄筆數的百分比。信賴度:,即代表在前提項目X發(fā)生的情況下,前提項目X與結果項目Y又同時發(fā)生的機率。此為關聯規(guī)則的預測強度。此指標之物理意義為當前提項目X發(fā)生時,可推得結論為結果項目Y的信賴度。增益:,比較信賴度與結果項目Y單獨發(fā)生時之機率兩者間的大小。其代表的物理意義為關聯規(guī)則的條件機率比母體中本來發(fā)生的機率大才具有意義。關聯規(guī)則的產生必需滿足決策者所訂定之最小支持度Minimum support threshold和最小信賴度Minimum confidence threshold,當滿足這兩個條件後,再判斷增益能否大於1,當三個指標皆
25、成立,即推導出有意義的關聯規(guī)則。就普通資料庫的探勘關聯規(guī)則上,其過程可為以下步驟(Han and Kamber, 2001):找出一切頻繁項目集合(Frequent Itemset):依據定義,頻繁項目集合所出現的次數必須與運用者預先定義的最小支持度數目一樣。由頻繁項目集合產生強關聯規(guī)則:依據定義,其所產生的規(guī)則必須滿足最小支持度與最小信賴度,如此規(guī)則方可成立。過程中其關聯規(guī)則的總體效能是由步驟(1)所決定,因此有效的找出頻繁項目集合是關聯規(guī)則的重點。Apriori演算法是關聯規(guī)則中最為常用來找尋頻繁項目集合的演算法,Apriori演算法是運用逐層搜尋的方法(Agrawal and Srika
26、nt, 1994),依據上述的探勘關聯規(guī)則步驟,可逐漸敘述Apriori演算法流程如下:定義最小支持度及最小信賴度。Apriori演算法運用了候選項目集合(Candidate Itemset) 的觀念,假設候選項目集合的支持度大於或等於最小支持度,則該候選項目集合為頻繁項目集合。首先由資料庫讀入一切的買賣,得出候選1項目集合 (Candidate 1-Itemset)的支持度,在找出頻繁單項目集合(Frequent 1-Itemset),並利用這些頻繁單項目集合的結合,產生候選2項目集合 (Candidate 2-Itemset) 。在搜尋資料庫,得出候選2項目集合的支持度以後,在找出頻繁2項
27、目集合,並利用這些頻繁2項目集合的結合,產生3項目集合。重覆搜尋資料庫,與最小支持度比較,產生頻繁項目集合,再結合產生下一級候選項目集合,直到不再結合產生出新的候選項目集合為止。關於關聯規(guī)則的研討,主要是研討發(fā)掘關聯規(guī)則的演算法,如何從含有大量資料的資料庫中,快速的找出有意義的關聯規(guī)則Srikant and Agrawal, 1996; Han and Fu, 1999; Berzal et al., 2001; Changchien and Lu, 2001; Tung et al., 2003,在實務應用上,Srikant and Agrawal1997有提及關聯規(guī)則在商業(yè)、保險、醫(yī)學等之
28、應用,其他主要的應用領域包括購物籃分析Fayyad et al., 1996、商品擺架安排Srikant and Agrawal, 1997、欺騙行為偵查Berry and Linoff, 1997、醫(yī)學研討葉忠和吳恆睿,2002,在半導體的應用上,如透過半導體晶圓允收測試資料,建構製程事故診斷資料挖礦架構,以作為工程師及領域專家解決問題的參考,進而提升其製程良率的改善簡禎富等,民90; Han and Kamber, 2000。資料挖礦技術應用於半導體領域的研討很多,本研討將著重於半導體自動化系統(tǒng)生產製造過程中,所蒐集的資料以配合資料挖礦技術的應用,提供工程師一快速的搜尋規(guī)則及方案建議。三、
29、研討方法本節(jié)將探討半導體製造過程中,對於產品量測(Lot QC)資料異常及報廢的產品如何應用資料挖礦技術尋求合適的資訊以提供解決方案的選擇。本研討之研討架構係依據資料挖礦方式及資料挖礦流程建構,包含問題定義、資料處理、資料挖礦應用、以及評估等步驟,研討架構如圖2所示。本研討在資料分類及彙整部分,為了提供資料挖礦方式一正確、乾淨、完好的資料,必須確保來源資料的完好性,使得產生的資訊品質達到有效性及正確性的要求,在資料挖礦部分採用關聯規(guī)則的Apriori演算法進行關聯資料的搜尋,以及決策樹歸納法進行可疑緣由區(qū)別的建議。3-1問題定義本研討將探討在半導體製造過程中,發(fā)生產品報廢問題與Lot QC時產
30、生Data Lost或產生OOS (Out Of Spec.)時,如何從資料庫中快速的追蹤所產生的問題,藉由資料挖礦技術的應用將能夠呵斥的要素從資料庫中篩選出,以提供工程師能掌握有利的資料進行分析。3-2資料處理為了使資料挖礦的資訊能符合實際需求及其正確性與完好性,對於發(fā)掘前的資料處理是重要的關鍵。因此,本研討將對於產品報廢的現象緣由與歷史資料進行分類及彙整,以作為領域資料的一部分。在於Lot QC方面將建置搜尋Data Lost及OOS的規(guī)則,說明如下產品報廢現象緣由分類及彙整半導體的製造程序是環(huán)環(huán)相扣的,如有任一程序發(fā)生異常通常會影響未來的製程甚至導致產品報廢。當報廢發(fā)生時假設能在較短時間
31、內找出緣由,對於有同樣製程的產品即可立刻追蹤並掌握問題,可減少產品的報廢數量。製造過程中產生報廢的緣由錯綜複雜,就以現行工程師的經驗中,再彙整出現象緣由及解決方案於領域資料庫中如表1所示,運用此彙整的表格提供工程師一對應的訊息,以縮短找尋資料及因個人經驗判別的時間,並且將其他同生產條件的產品列出能夠發(fā)生此現象報廢的產品,以盡早提出因應措施。依據表1的現象為區(qū)分的類別,各類別緣由的分類及各緣由的處理方式對應如圖3所示,依各類別緣由及對策的對應關聯,假設有新的現象發(fā)生將可再陸續(xù)參與領域資料庫中。Lot QC data lost及發(fā)生OOS問題時的追蹤通常一批Lot在投片開始至完成前段製程的歷程中,
32、將經歷多次的量測以確保產品在製圖2 半導體製造過程產品異常應用資料挖礦研討架構圖造過程中能確實符合製程上的規(guī)格,因此量測出的數值將影響該批Lot的品質。以目前具有自動化系統(tǒng)的半導體廠而言,量測的方法或資料的蒐集與運算已是非常正確與快速,但是在這之前的量測參數能否正確的被設定於自動化系統(tǒng)中,以及資料能否完好的被系統(tǒng)所蒐集,將有賴於系統(tǒng)的設計及參數的設定。Data lost的發(fā)生有兩種狀況,一為參數設定的不完好,能夠是由資料維護時遺漏或工程師提供不完好;另一為機臺與系統(tǒng)的data傳送出現異常,能夠是機臺端當機或傳送機制停擺或系統(tǒng)端產生異常;至於OOS的產生即是製程條件的異常所致。因此,在以上所提的
33、這些問題將可由自動化系統(tǒng)人員與製程工程師共同建立解決方案,至於如何在Lot QC data lost及OOS依然發(fā)生時快速找到問題,本研討將運用資料挖礦技術提供一快速的搜尋方法,以縮短工程師進入資料庫探求的時間,並減少不符合量測規(guī)格的產品繼續(xù)產出。此階段將以關聯規(guī)則的Apriori演算法與自動化系統(tǒng)工程師的領域知識配合建置一合宜的搜尋方式。表 SEQ 表格 * ARABIC s 1 1 產品報廢分類對應表範例現象分類破片污漬報廢緣由說明Box盒蓋鬆脫呵斥破片 CLEAN及旋乾異常ABNORENG 破片 治工具呵斥破片治工具呵斥破片-晶舟E.P未抓到 人為破片 CLEAN及旋乾異常ABNORN-
34、SCRAP 水痕 因應方式check run card能否異常呵斥Box盒蓋未正常蓋上Check Recipe 設定能否異常.3-3資料挖礦本研討運用關聯規(guī)則的Apriori演算法獲得產品報廢的現況與要素分析,計算其支持度與信賴度以確定分析出來的資訊能否為正確有效的,並以決策樹歸納法配合領域資料的分析,建議其合宜的解決方案。至於Lot QC方面,亦是以關聯規(guī)則的Apriori演算法與自動化系統(tǒng)的領域資料推導出發(fā)生問題的能夠要素,以提供快速的資料搜尋途徑。資料挖礦流程如圖4所示。以下問題產品報廢及Lot QC問題追蹤為例,說明資料挖礦流程逐層分析。當發(fā)生Lot QC的Data lost時,工程師
35、可提供該產品的發(fā)生站點、時間、量測的機臺等訊息,依據所提供的訊息進入CIM資料庫中確認根本資料的設定、系統(tǒng)與機臺端傳送及機臺端的資訊。根本資料的設定將確認其參數值、規(guī)格值、量測機臺與生產機臺的對應及產品與機臺的對應關係等,而機臺端將確認其能否已將資料完好蒐集。假設根本資料的設定問題已發(fā)生則調整設定,假設機臺端已發(fā)現未完好蒐集資料則是機臺端問題,假設根本資料的設定及機臺端皆正確,則建議著重在系統(tǒng)與機臺端傳送問題。當OOS發(fā)生時,工程師可提供該產品的發(fā)生站點、時間、量測的機臺等訊息,依據所提供的訊息進入CIM資料庫中確認根本資料的設定值,假設根本資料的設定問題已發(fā)生則調整設定。在產品報廢現象緣由追
36、蹤上運用Apriori的逐層搜尋疊代方法的特性,方法如下:圖3 Domain Knowledge階層資料表圖例首先必須將該產品發(fā)生的現象及特徵提供給方式如產品型號、發(fā)生的站點、發(fā)生的機臺、報廢的現象、報廢的特徵等。依據該產品發(fā)生的現象及特徵進行第一次的資料庫掃描並定義最小支持度及最小信賴度。得出該現象的候選1項目集合(1-Itemset)的支持度,以及找出頻繁單項目集合(Frequent 1-Itemset),利用這些頻繁單項目集合的結合產生候選2項目集合(2-Itemset)。支持度的計算為:將輸入的屬性與目標屬性以一對一或一對多的方式產生多種項目集合,並計算各項目集合中X與Y同時出現的資料
37、筆數佔一切資料筆數的百分比。再搜尋資料庫,得出該現象的候選2項目集合的支持度,再找出頻繁2項目集合,並利用這些頻繁2項目集合的結合,產生3項目集合。重覆搜尋資料庫,與最小支持度比較,假設產生的頻繁項目集合(Lk)大於或等於運用者所定義的最小支持度,則頻繁項目集合即被找到。當頻繁項目集合出現之後進行信賴度的計算。當頻繁項目集合的信賴度與最小信賴度比較,假設大於或等於運用者所定義的最小信賴度,則候選規(guī)則產生並進行一切頻繁項目集合最小信賴度比較。計算一切候選規(guī)則的增益,假設增益值大於1則選取,小於或等於1則放棄,最後將產生顯著的關聯規(guī)則。最後整理頻繁項目集合,以產出所定義的目標。圖4 資料挖礦流程3
38、-4評估資料挖礦中除了資料庫理論、資料倉儲、人工智慧、機器學習、統(tǒng)計學等領域之外,在專家領域知識上更是不可短少,以本研討而言是針對半導體製造過程的問題追蹤,因此,結合半導體製造、製程、設備以及自動化系統(tǒng)的領域知識等是必要的,在發(fā)掘的結果上不論是分類、規(guī)則、表示方式皆需求符合領域專家的認知與經驗。經過一連串的資料挖礦技術應用,將報廢產品及Lot QC問題追蹤建構出追蹤規(guī)則,使同樣生產條件的產品可提早防範一樣狀況發(fā)生,以減少損失並適時的提出其決策建議。四、實證研討4-1產品報廢追蹤問題定義在普通製造過程中,除非是顯著的現象才會立刻的被斷定產品報廢例如,破片,但是原因假設為製程參數設定異常,或是設備
39、異常則較難被立刻發(fā)現,因此潛藏於在製品中的報廢要素如何被過濾出,並加以防範將是重要的問題。以產品發(fā)生報廢為例,當報廢的產品在工程師初步判斷之後,彙整報廢的特徵為電性偏低,並列出有影響的站點,以作為以下資料處理的線索來源。資料處理將發(fā)生產品報廢的產品批號、型號、目前製程站點、發(fā)生報廢的站點、發(fā)生報廢的機臺、發(fā)生報廢時所運用的製程參數、特徵等,輸入於雛型系統(tǒng)中以利於資料發(fā)掘。資料挖礦由產品報廢的特徵與現象可以歸類出Recipe Fail、Etch不淨、Vt不合等三種能夠報廢類型,如表2產品報廢分類對應表。依據本研討提出的資料挖礦流程處理如下:表2 產品報廢分類對應表現象類別要素對應Recipe F
40、ail1.TSF Down load Fail2.CIM data error3.設備異常4.製程不合而PASS 5.製程污染 6.製程重覆做 7.製程漏做 Etch不淨1.TSF Down load Fail2.CIM data error3.設備異常Vt不合2.CIM data error4.製程不合而PASS 6.製程重覆做Eng判別呵斥此現象的能夠發(fā)生站點List。依據該產品發(fā)生的現象及特徵進行第一次的資料庫掃描並定義最小支持度為1.94及最小信賴度50%。也就是說,在310筆資料中,產生報廢的能夠要素有6類,假設為均勻分配的情況,則每一類平均約為60筆資料,因此其支持度應大於60/3
41、10=1.94%,才代表足夠之顯著程度;而設定信賴度為獲得關聯規(guī)則其顯著程度達一半以上。得出該現象的候選1項目集合的支持度,以及找出頻繁單項目集合,利用這些頻繁單項目集合的結合產生候選2項目集合。結果如表3所示。再搜尋資料庫,得出該現象的候選2項目集合的支持度,再找出頻繁2項目集合,並利用這些頻繁2項目集合的結合,產生3項目集合。結果如表4所示。再搜尋資料庫,得出該現象的候選3項目集合的支持度,再找出頻繁3項目集合,並利用這些頻繁3項目集合的結合,產生4項目集合。結果如表5所示。重覆搜尋資料庫,與最小支持度比較,假設產生的頻繁項目集合(Lk)大於或等於運用者所定義的最小支持度,則頻繁項目集合即
42、被找到。結果如表6所示。當頻繁項目集合出現之後進行信賴度的計算,結果如表6所示。最後工程師可將列出的要素對應存於領域資料庫中的處理方式建議,其處理方式如表7報廢現象分類對應表,並且追蹤同樣生產條件的產品如表8可疑產品追蹤清單。表3 候選1項目集合ItemsetSup.count1.TSF Down load Fail22.CIM data error33.設備異常24.製程不合而PASS 25.製程污染 46.製程重覆做 27.製程漏做 1表4 候選2項目集合ItemsetSup.count1.TSF Down load Fail且2.CIM data error21.TSF Down loa
43、d Fail且3.設備異常31.TSF Down load Fail且2.CIM data error21.TSF Down load Fail且3.設備異常31.TSF Down load Fail且4.製程不合而PASS11.TSF Down load Fail且5.製程污染11.TSF Down load Fail且6.製程重覆做12.CIM data error 且3.設備異常 22.CIM data error 且4.製程不合而PASS22.CIM data error 且5.製程污染12.CIM data error 且6.製程重覆做23.設備異常且4.製程不合而PASS13.設備
44、異常且5.製程污染13.設備異常且6.製程重覆做14.製程不合而PASS 且5.製程污染14.製程不合而PASS且6.製程重覆做25.製程污染且 6.製程重覆做1表5 候選3項目集合ItemsetSup.count1.TSF Down load Fail且2.CIM data error21.TSF Down load Fail且3.設備異常32.CIM data error 且3.設備異常 22.CIM data error 且4.製程不合而PASS22.CIM data error 且6.製程重覆做24.製程不合而PASS且6.製程重覆做2表6 候選4項目集合ItemsetSup.coun
45、tConf.2.CIM data error 且3.設備異常 264.67%2.CIM data error 且4.製程不合而PASS297.00%2.CIM data error 且6.製程重覆做297.00%4.製程不合而PASS且6.製程重覆做297.00%表7 報廢現象分類對應表緣由因應方式2.CIM data error 且3.設備異常確認CIM資料維護歷史資料確認該設備異常紀錄狀況2.CIM data error 且4.製程不合而PASS確認CIM資料維護歷史資料進一步確認 LQC 時的實際量測值2.CIM data error 且6.製程重覆做確認CIM資料維護歷史資料確認該產品
46、的製造過程歷史資料4.製程不合而PASS且6.製程重覆做確認 LQC 時的實際量測值確認該產品的製造過程歷史資料表8 可疑產品追蹤清單Lot IDProduct IDRoute IDCurrent Oper. IDPastTimeData_Lot_08Data_Prod_A1Data_Route_AData_Oper_60102004/2/14 15:00Data_Lot_08Data_Prod_B1Data_Route_BData_Oper_24052004/2/15 09:00Data_Lot_18Data_Prod_B1Data_Route_BData_Oper_25062004/2/1
47、6 02:01Data_Lot_20Data_Prod_B1Data_Route_BData_Oper_26072004/2/16 05Data_Lot_09Data_Prod_B1Data_Route_BData_Oper_26072004/2/17 11Data_Lot_10Data_Prod_B1Data_Route_BData_Oper_26082004/2/17 14-2結果與討論在實際半導體製造過程中,工程師必須透過部門與部門之間的協調,之後經過資料庫管理部門的核可,才可透過資料庫管理人員依工程師的需求,進行資料搜尋,在經過一連串的資料獲得步驟之後,工程師最後才干再進行分析與討論,
48、如此程序完成後問題能夠已擱置數日了。因此,假設工程師在初步的問題確認後,可立刻透過本研討資料挖礦架構的篩選,將可減少以上繁覆的程序與核可步驟,假設進一步結合自動化工程師、製程工程師、或是設備工程師的經驗,將可縮短問題追蹤的時間與產品的損失、或是因人員異動而失去的解決問題的經驗值。關聯規(guī)則之Apriori演算法是運用逐層搜尋的方法,每進行一個層次的搜尋則必須掃描資料庫一次,直到條件完成,即找到符合條件的頻繁項目集合,然而當程式的條件愈為複雜,則相對的其重覆搜尋資料庫次數亦提高;也就是說與最小支持度比較產生頻繁項目集合,再結合產生下一級候選項目集合,直到不再結合產生出新的候選項目集合為止。因此,當
49、資料庫的資料量愈大及程式的條件愈嚴謹,系統(tǒng)必須相對付出的是掃描資料庫資料時的系統(tǒng)負荷,因此在Apriori演算法應用於大量資料與系統(tǒng)負荷方面,將會影響資料挖礦的效能。就程式運作上,Apriori演算法是必須完好的執(zhí)行結束,因為其逐層搜尋的方式必須由第一層開始,逐層比較其支持度再產生頻繁項目集合,假設中途停頓後其所產生的支持度將不具完好性,也無法真實呈現產出的結果。因此,假設有此現象將需求重新執(zhí)行探勘程式,以確保效度檢定的合理性與正確性。五、結論與建議本研討對於半導體製造過程的問題追蹤,藉由資料挖礦的方法與步驟,進行大量資料的篩選、推演與方式建構等過程,協助工程人員處理問題,盡能夠減少在龐大的資
50、料中發(fā)掘的困難度,使其方便的發(fā)掘出隱含的訊息,以及快速的找到與問題相關的關聯資訊。在資料挖礦的過程中,領域資料與相關人員的經驗扮演著重要的角色,假設能將經驗予以有系統(tǒng)的保管,其在資料挖礦的過程上將可給予相當程度的幫助。本研討驗證上所採用的資料量及資料種類,與實際半導體系統(tǒng)的資料量比較相對較少,因此在執(zhí)行程式的速度與獲得的資料方面會與實際值有落差。在研討方法上,以關聯規(guī)則的Apriori演算法雖可達到驗證的目的,但是當實際應用於半導體產業(yè)中時,除了系統(tǒng)軟體與硬體上的提升外,領域資料的再補充以及方法效率亦是探討的重點。在未來的研討上,將資料挖礦觀念導入半導體製造過程中,則對於半導體整體的Wafer
51、 Level Tracking上,即由前端的Wafer Start以致於EDA(Engineer Data Analysis)的資料分析,將是另一種追蹤問題的方式,但是必需先將半導體自動化系統(tǒng)資料庫進行整合,以及建置更完好的領域經驗知識庫,方可進行較為完善的資料挖礦。參考文獻Agrawal, R., Imielinski, T. and Swami, A., (1993), “Mining Association Rules Between Sets of Items in Large Databases, Proceedings of The 1993 ACM SIGMOD International Conference on Management of Data, Washington Agrawal, R. and Srikant, R., (1994), “Fast Algorithms for Mining Association Rule, Proceedings of the 20th International Confere
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度建筑工程合同
- 2024年委托貸款合同樣本
- 2024年建筑施工安全管理合同
- 2024年度版權質押合同詳細描述
- 2024年弱電工程合同范本
- 2024年影視作品拍攝融資合同
- 2024醫(yī)療人員培訓服務合同
- 2024農業(yè)廢棄物處理垃圾桶采購合同
- 電力行業(yè)設備維護管理制度
- 2024中藥材種植及采購合同
- 幼兒園老師說課培訓課件
- 房貸延期代理合同(2篇)
- 海洋研學勞動課程設計
- 林業(yè)基礎知識考試題庫單選題100道及答案解析
- 電氣工程及其自動化職業(yè)規(guī)劃課件
- 2024至2030年中國納米氧化鋅行業(yè)投資前景及策略咨詢研究報告
- 2024年經濟師考試-中級經濟師考試近5年真題附答案
- 2024年個人之間清賬協議書模板
- 浙江省杭州市2023-2024學年五年級上學期英語期中試卷(含答案)2
- 期中 (試題) -2024-2025學年譯林版(三起)英語四年級上冊
- 2024-2025學年小學信息技術(信息科技)六年級上冊南方版(湖南)(2019)教學設計合集
評論
0/150
提交評論