摘要

电子产品(如IC、PCB、LCD 等)的制程资料可大概分为两大类:第一类为制程机台运作记录之制程参数(如显影机压力、速度、曝光时间等),第二类为量测机台测量之半成品的质量量测值(如flip-chip 之厚度、BGA 共平面度等)。这些数据中,包含了判断良率或不良品成因的有用信息,但由于制程数据属性之复杂的交互影响关系,传统的统计学应用方法,如回归分析(Regression analysis)及实验设计(Design of experiment)等,无法有效的分析这些制程工程数据,为了辅助统计分析方法之不足,最近许多学者皆提出了以资料探勘(Data mining)的技术分析制程工程数据,可让电子业获得更有用的信息。本论文即报告过去一年美商威能信息台湾分公司与元智大学工业工程与管理研究所合作,以判定树算法结合多维数据视觉手法,从晶圆制造厂之Lot in-line process control 数据中,找出制程中影响wafer 良率高低之重要因子,并提出如何应用类似技术于于PCB 制程数据分析,辅助PCB 不良品成因探讨。

关键词:数据探勘,判定树,群集分析,数据视觉,PCB 不良品诊断

1. 导论

在大量生产制造的产业里,从制程的参数量测中找出影响良率高低的因子,是当今制程分析中最困难的地方。电子产品中的半导体晶园厂从晶圆投入至完成,需经过许多道完整且精密的序列制程加工,生产者为了有效掌控晶圆制成品的良率及质量控制,每个制程阶段都会纪录其所属的特性的参数以及测试数据数据,IC 从原物料到制成品出间所量测的资料主要有LPC(Lot In-Line Process Control)、WIP(Work In Process) 、WAT(Wafer Acceptance Test)、CP Bin(Circuit Probe)及FT(Final Test)等资料,而制程中的LPC 量测数据分析生产过程中影响良率的最重要信息来源。然而, IC 生产制程中,所测量的LPC 制程参数至少有超过一千个以上的变量,而每个变量间的属性又大不相同,这些变数间的交互作用效果极不容易由资料中获得,传统的统计学方法,如回归分析(Regression analysis)及变异数分析(ANOVA)等方法,无法有效的找出这些真正影响良率高低的变量,许多制程工程师及学者采用多变量分析的手法,至今也无法真正有效地找出影响制程良率高低的因子。

对于多变量且大量数据的探堪技术,国内外学者多有所研究。Fan(2001)的研究报告中指出Fujitsu和Motorola 二大半导体厂都以资料探堪中的判定树(Decision tree) 和自我组织类神经网络(Self-organization neural network)等技术分析晶圆制造过程中所收集的数据中,用以找出影响良率的重要因子。Dabbas(2001)的研究里则论及了如何应用数据探堪的手法,并辅以整合数据库管理于半导体之计算机整合制造系统(CIM),来达到实时监控在线制程数据。Kusiak(2001)的整理了目前常用的数据探堪算法有ID3、AQ15、Naiva-Bayes、OODG、lazy decision trees、C4.5 与CN2 等。而目前较为广泛应用的判定树算法有C4.5、CHAID (Chi-Square Regression)、MARS(Multivariate Adaptive Regression Splines) 、CART (Classification And Regression Trees)。

在众多学术先进的研究中,都对晶圆良率的制程因素分析提出了一些有用的方法,但对于良率的提高之贡献度毕竟有限。本研究的目的在于运用晶圆厂生产制程的资料,提出有效的判定树演算,以寻求影响良率的重要因子,并期能将此算法推广到PCB 制程的数据分析上。