認(rèn)識(shí)試驗(yàn)設(shè)計(jì)基礎(chǔ)知識(shí)
1.1.1 試驗(yàn)設(shè)計(jì)的內(nèi)涵
試驗(yàn)設(shè)計(jì)(design of experiment,DOE)也稱為實(shí)驗(yàn)設(shè)計(jì),是以概率論和數(shù)理統(tǒng)計(jì)為理論基礎(chǔ),經(jīng)濟(jì)地、科學(xué)地安排試驗(yàn)的一項(xiàng)技術(shù)。通過對(duì)數(shù)據(jù)資料進(jìn)行正確的整理、分析,可以揭示事物的本質(zhì)特性及內(nèi)在聯(lián)系,進(jìn)而使人們得以能動(dòng)地認(rèn)識(shí)世界和改造世界。試驗(yàn)設(shè)計(jì)和統(tǒng)計(jì)分析是互為前提和條件的。只有理解、掌握了一定的統(tǒng)計(jì)分析原理和方法,并結(jié)合堅(jiān)實(shí)的專業(yè)知識(shí)和必要的實(shí)踐經(jīng)驗(yàn),才可能正確地進(jìn)行試驗(yàn)設(shè)計(jì)。反過來,只有在試驗(yàn)設(shè)計(jì)正確的基礎(chǔ)上,通過對(duì)試驗(yàn)所獲取的數(shù)據(jù)資料進(jìn)行正確地統(tǒng)計(jì)分析,才可能真正揭示事物的本質(zhì)特性及內(nèi)在聯(lián)系,得出可靠的結(jié)論,進(jìn)而正確地指導(dǎo)實(shí)踐。
1.1.2 試驗(yàn)設(shè)計(jì)與數(shù)據(jù)處理的發(fā)展歷史
試驗(yàn)設(shè)計(jì)自20世紀(jì)20年代問世至今,其發(fā)展大致經(jīng)歷了3個(gè)階段,即早期的單因素和多因素方差分析、傳統(tǒng)的正交試驗(yàn)法和近代的調(diào)優(yōu)設(shè)計(jì)法。到目前為止,本學(xué)科經(jīng)過了90多年的研究和實(shí)踐,已成為廣大技術(shù)人員與科學(xué)工作者必備的基本理論知識(shí)。實(shí)踐表明,該學(xué)科與實(shí)際的結(jié)合,在工農(nóng)業(yè)生產(chǎn)中產(chǎn)生了巨大的社會(huì)效益和經(jīng)濟(jì)效益。
20世紀(jì)20年代,英國生物統(tǒng)計(jì)學(xué)家及數(shù)學(xué)家費(fèi)歇(R.A.Fisher)首先提出了方差分析,并將其應(yīng)用于農(nóng)業(yè)、生物學(xué)、遺傳學(xué)等方面,取得了巨大的成功,在試驗(yàn)設(shè)計(jì)和統(tǒng)計(jì)分析方面作出了一系列先驅(qū)工作,開創(chuàng)了一門新的應(yīng)用技術(shù)學(xué)科,從此試驗(yàn)設(shè)計(jì)成為統(tǒng)計(jì)科學(xué)的一個(gè)分支。20世紀(jì)50年代,日本統(tǒng)計(jì)學(xué)家田口玄一將試驗(yàn)設(shè)計(jì)中應(yīng)用最廣的正交設(shè)計(jì)表格化,在方法解說方面深入淺出,為試驗(yàn)設(shè)計(jì)的更廣泛使用作出了巨大的貢獻(xiàn)。
我國從20世紀(jì)50年代開始研究這門學(xué)科,并在正交試驗(yàn)設(shè)計(jì)的觀點(diǎn)、理論和方法上都有新的創(chuàng)見,編制了一套適用的正交表,簡化了試驗(yàn)程序和試驗(yàn)結(jié)果的分析方法,創(chuàng)立了簡單易學(xué)、行之有效的正交試驗(yàn)設(shè)計(jì)法。同時(shí),著名數(shù)學(xué)家華羅庚教授也在國內(nèi)積極倡導(dǎo)和普及“優(yōu)選法”,從而使試驗(yàn)設(shè)計(jì)的概念得到普及。隨著科學(xué)技術(shù)工作的深入發(fā)展,我國數(shù)學(xué)家王元和方開泰于1978年首先提出了均勻設(shè)計(jì),該設(shè)計(jì)考慮如何將設(shè)計(jì)點(diǎn)均勻地散布在試驗(yàn)范圍內(nèi),使得能用較少的試驗(yàn)點(diǎn)獲得最多的信息。
隨著計(jì)算機(jī)技術(shù)的發(fā)展和進(jìn)步,出現(xiàn)了各種針對(duì)試驗(yàn)設(shè)計(jì)和試驗(yàn)數(shù)據(jù)處理的軟件,如SAS(statistical analysis system),SPSS(statistical package for the social science),Matlab Origin和Excel等,它們使試驗(yàn)數(shù)據(jù)的分析計(jì)算不再繁雜,極大地促進(jìn)了本學(xué)科的快速發(fā)展和普及。
1.1.3 試驗(yàn)設(shè)計(jì)與數(shù)據(jù)處理的意義
在科學(xué)研究和工農(nóng)業(yè)生產(chǎn)中,經(jīng)常需要通過試驗(yàn)來尋找所研究對(duì)象的變化規(guī)律,并通過對(duì)規(guī)律的研究達(dá)到各種實(shí)用的目的,如提高產(chǎn)量、降低消耗、提高產(chǎn)品性能或質(zhì)量等,特別是新產(chǎn)品試驗(yàn),未知的東西很多,要通過大量的試驗(yàn)來摸索工藝條件或配方。
自然科學(xué)和工程技術(shù)中所進(jìn)行的試驗(yàn),是一種有計(jì)劃的實(shí)踐,只有科學(xué)地試驗(yàn)設(shè)計(jì),才能用較少的試驗(yàn)次數(shù),在較短的時(shí)間內(nèi)達(dá)到預(yù)期的試驗(yàn)?zāi)繕?biāo);反之,不合理的試驗(yàn)設(shè)計(jì),往往會(huì)浪費(fèi)大量的人力、物力和財(cái)力,甚至勞而無功。另外,隨著試驗(yàn)進(jìn)行,必然會(huì)得到大量的試驗(yàn)數(shù)據(jù),只有對(duì)試驗(yàn)數(shù)據(jù)進(jìn)行合理地分析和處理,才能獲得研究對(duì)象的變化規(guī)律,達(dá)到指導(dǎo)生產(chǎn)和科研的目的??梢?,最優(yōu)試驗(yàn)方案的獲得,必須兼顧試驗(yàn)設(shè)計(jì)方法和數(shù)據(jù)處理兩方面,兩者是相輔相成、互相依賴、缺一不可的。
在試驗(yàn)設(shè)計(jì)之前,試驗(yàn)者首先應(yīng)對(duì)所研究的問題有一個(gè)深入的認(rèn)識(shí),如試驗(yàn)?zāi)康?、影響試?yàn)結(jié)果的因素、每個(gè)因素的變化范圍等,然后才能選擇合理的試驗(yàn)設(shè)計(jì)方法,達(dá)到科學(xué)安排試驗(yàn)的目的。在科學(xué)試驗(yàn)中,試驗(yàn)設(shè)計(jì)一方面可以減少試驗(yàn)過程的盲目性,使試驗(yàn)過程更有計(jì)劃;另一方面還可以從眾多的試驗(yàn)方案中,按一定規(guī)律挑選出少數(shù)具有代表性的試驗(yàn)。
合理的試驗(yàn)設(shè)計(jì)只是試驗(yàn)成功的充分條件,如果沒有試驗(yàn)數(shù)據(jù)的分析計(jì)算,就不可能對(duì)所研究的問題有一個(gè)明確的認(rèn)識(shí),也不可能從試驗(yàn)數(shù)據(jù)中尋找到規(guī)律性的信息,因此試驗(yàn)設(shè)計(jì)都是與一定的數(shù)據(jù)處理方法相對(duì)應(yīng)的。試驗(yàn)數(shù)據(jù)處理在科學(xué)試驗(yàn)中的作用主要體現(xiàn)在以下5個(gè)方面:
①通過誤差分析,可評(píng)判試驗(yàn)數(shù)據(jù)的可靠性。
②確定影響試驗(yàn)結(jié)果的因素主次,從而可抓住主要矛盾,提高試驗(yàn)效率。
③確定試驗(yàn)因素與試驗(yàn)結(jié)果之間存在的近似函數(shù)關(guān)系,并能對(duì)試驗(yàn)結(jié)果進(jìn)行預(yù)測和優(yōu)化。
④獲得試驗(yàn)因素對(duì)試驗(yàn)結(jié)果的影響規(guī)律,為控制試驗(yàn)提供思路。
⑤最優(yōu)試驗(yàn)方案或配方的確定。
試驗(yàn)設(shè)計(jì)(experiment design)與數(shù)據(jù)處理(data processing)雖然歸于數(shù)理統(tǒng)計(jì)的范疇,但它們也屬于應(yīng)用技術(shù)學(xué)科,具有很強(qiáng)的適用性。一般意義上的數(shù)理統(tǒng)計(jì)的方法主要用于分析已經(jīng)獲得的數(shù)據(jù),對(duì)所關(guān)心的問題作出盡可能精確的判斷,而對(duì)如何安排試驗(yàn)方案的設(shè)計(jì)卻沒有過多的要求。試驗(yàn)設(shè)計(jì)與數(shù)據(jù)處理則是研究如何合理地安排試驗(yàn),有效地獲得試驗(yàn)數(shù)據(jù),然后對(duì)試驗(yàn)數(shù)據(jù)進(jìn)行綜合的科學(xué)分析,以求盡快達(dá)到優(yōu)化實(shí)驗(yàn)的目的。因此,完整意義上的試驗(yàn)設(shè)計(jì)實(shí)質(zhì)上是試驗(yàn)的最優(yōu)化設(shè)計(jì)。
1.1.4 試驗(yàn)設(shè)計(jì)基本術(shù)語
1)總體與樣本
根據(jù)研究目的確定的研究對(duì)象的全體稱為總體(population)。其中的一個(gè)獨(dú)立的研究單位稱為個(gè)體(individual),依據(jù)一定方法由總體抽取的部分個(gè)體組成的集合稱為樣本(sample)。例如,研究某企業(yè)生產(chǎn)的一批罐頭產(chǎn)品的單聽質(zhì)量,該批所有罐頭產(chǎn)品單聽質(zhì)量的全體就構(gòu)成本研究的總體;從該總體抽取100聽罐頭測其單聽質(zhì)量,這100聽罐頭單聽質(zhì)量即為一個(gè)樣本,這個(gè)樣本包含有100個(gè)個(gè)體。含有有限個(gè)個(gè)體的總體稱為有限總體(finite population)。例如,上述一批罐頭總體雖然包含的個(gè)體數(shù)目很多,但仍為有限總體。包含有無限多個(gè)個(gè)體的總體稱為無限總體(infinite population)。例如,在統(tǒng)計(jì)理論研究中服從正態(tài)分布的總體、服從t分布的總體包含一切實(shí)數(shù),屬于無限總體。在實(shí)際研究中還有一類總體稱為假想總體。例如,用幾種工藝加工某種產(chǎn)品的工藝試驗(yàn),實(shí)際上并不存在用這幾種工藝進(jìn)行加工的產(chǎn)品總體,只是假設(shè)有這樣的總體存在,把所得試驗(yàn)結(jié)果看成是假想總體的一個(gè)樣本。樣本中所包含的個(gè)體數(shù)目稱為樣本容量或樣本大小(sample size)。例如,上述一批罐頭單聽質(zhì)量的樣本容量為100。樣本容量常記為n。通常,n≤30的樣本稱為小樣本,n>30的樣本稱為大樣本。統(tǒng)計(jì)分析通常是通過樣本來了解總體。這是因?yàn)橛械目傮w是無限的、假想的,即使是有限的但包含的個(gè)體數(shù)目相當(dāng)多,要獲得全部觀測值須花費(fèi)大量人力、物力和時(shí)間;或者觀測值的獲得帶有破壞性,如蘋果硬度的測定,不允許對(duì)每一個(gè)果實(shí)進(jìn)行測定。研究的目的是要了解總體,然而能觀測到的卻是樣本,通過樣本來推斷總體是統(tǒng)計(jì)分析的基本特點(diǎn)。為了能可靠地從樣本來推斷總體,這就要求樣本具有一定的含量和代表性。只有從總體隨機(jī)抽取的樣本才具有代表性。所謂隨機(jī)抽樣(random sampling),是指總體中的每一個(gè)個(gè)體都有同等的機(jī)會(huì)被抽取組成樣本,然而樣本畢竟只是總體的一部分,盡管樣本具有一定的含量和代表性,但是通過樣本來推斷總體也不可能百分之百的正確。有很大的可靠性,但有一定的錯(cuò)誤率是統(tǒng)計(jì)分析的又一特點(diǎn)。
2)參數(shù)與統(tǒng)計(jì)量
為了表示總體和樣本的數(shù)量特征,需要計(jì)算出幾個(gè)特征數(shù)。由總體計(jì)算的特征數(shù)稱為參數(shù)(parameter);由樣本計(jì)算的特征數(shù)稱為統(tǒng)計(jì)量(statistic)。常用希臘字母表示參數(shù),如用μ表示總體平均數(shù),用σ表示總體標(biāo)準(zhǔn)差;常用拉丁字母表示統(tǒng)計(jì)量,如用x 表示樣本平均數(shù),用S表示樣本標(biāo)準(zhǔn)差。總體參數(shù)由相應(yīng)的統(tǒng)計(jì)量來估計(jì),如用x 估計(jì)μ,用S估計(jì)σ等。
3)準(zhǔn)確性與精確性
準(zhǔn)確性(accuracy)也稱準(zhǔn)確度,指在調(diào)查或試驗(yàn)中某一試驗(yàn)指標(biāo)或性狀的觀測值與其真值接近的程度。設(shè)某一試驗(yàn)指標(biāo)或性狀的真值為μ,觀測值為x,若x與μ相差的絕對(duì)值x-μ 小,則觀測值x準(zhǔn)確性高;反之,則低。精確性(precision)也稱精確度,是指調(diào)查或試驗(yàn)中同一試驗(yàn)指標(biāo)或性狀的重復(fù)觀測值彼此接近的程度。若觀測值彼此接近,即任意兩個(gè)觀測值xi,xj相差的絕對(duì)值xi-xj 小,則觀測值精確性高;反之,則低。準(zhǔn)確性、精確性的意義如圖1.1所示。圖1.1(a)中觀測值密集于真值μ兩側(cè),其準(zhǔn)確性高,精確性也高;圖1.1(b)觀測值密集于遠(yuǎn)離真值μ的一側(cè),其準(zhǔn)確性低,精確性高;圖1.1(c)觀測值稀疏地散布于遠(yuǎn)離真值μ的兩側(cè),其準(zhǔn)確性、精確性都低。
圖1.1 準(zhǔn)確性與精確性的關(guān)系示意圖
調(diào)查或試驗(yàn)的準(zhǔn)確性、精確性合稱為正確性。在調(diào)查或試驗(yàn)中應(yīng)嚴(yán)格按照調(diào)查或試驗(yàn)計(jì)劃進(jìn)行,準(zhǔn)確地進(jìn)行觀測記載,力求避免人為差錯(cuò),特別要注意試驗(yàn)條件的一致性,除所研究的處理外,其他供試條件應(yīng)盡量控制一致,并通過合理地調(diào)查或試驗(yàn)設(shè)計(jì)努力提高試驗(yàn)的準(zhǔn)確性和精確性。由于真值μ常常不知道,因此準(zhǔn)確性不易度量,但利用統(tǒng)計(jì)方法可度量精確性。
4)隨機(jī)誤差與系統(tǒng)誤差
在試驗(yàn)中,試驗(yàn)指標(biāo)除受試驗(yàn)因素影響外,還受到許多其他非試驗(yàn)因素的干擾,從而產(chǎn)生誤差。試驗(yàn)中出現(xiàn)的誤差分為兩類:隨機(jī)誤差(random error)與系統(tǒng)誤差(systematic error)。隨機(jī)誤差也稱抽樣誤差(sampling error),這是由于許多無法控制的內(nèi)在和外在的偶然因素所造成,如原料作物的生長條件、生長勢的差異,以及食品加工過程中機(jī)械設(shè)備運(yùn)轉(zhuǎn)狀態(tài)的偶然變化等。這些因素盡管在試驗(yàn)中力求一致但不可能絕對(duì)一致。隨機(jī)誤差帶有偶然性質(zhì),在試驗(yàn)中即使十分小心也難以消除,但可通過試驗(yàn)控制盡量降低,并經(jīng)對(duì)試驗(yàn)數(shù)據(jù)的統(tǒng)計(jì)分析來估計(jì)。隨機(jī)誤差影響試驗(yàn)的精確性。統(tǒng)計(jì)上的試驗(yàn)誤差是指隨機(jī)誤差,這種誤差越小,試驗(yàn)的精確性越高。系統(tǒng)誤差也稱片面誤差(lopsided error),這是由于供試對(duì)象的品種、成熟度、病程等不同,食品配料種類、品質(zhì)、數(shù)量等相差較大,儀器不準(zhǔn)、標(biāo)準(zhǔn)試劑未經(jīng)校正,藥品批次不同、藥品用量以及種類不符合試驗(yàn)的要求等引起。試驗(yàn)中的系統(tǒng)誤差是無法估計(jì)的,因此應(yīng)當(dāng)通過試驗(yàn)設(shè)計(jì)徹底消除之。觀測、記載、抄錄、計(jì)算中的錯(cuò)誤等也將引起誤差,這種誤差實(shí)質(zhì)上是錯(cuò)誤。系統(tǒng)誤差影響試驗(yàn)的準(zhǔn)確性。圖1.1(b)、(c)所表示的情況就是由于出現(xiàn)了系統(tǒng)誤差的緣故。一般來說,只要試驗(yàn)工作做得精細(xì),系統(tǒng)誤差容易克服。圖1.1(a)表示克服了系統(tǒng)誤差的影響,且隨機(jī)誤差較小,因而準(zhǔn)確性高、精確性也高。
1.1.5 試驗(yàn)設(shè)計(jì)的基本原則
1)重復(fù)原則
重復(fù)是指在試驗(yàn)中每種處理至少進(jìn)行兩次以上。重復(fù)試驗(yàn)是估計(jì)和減小隨機(jī)誤差的基本手段。一般來說,重復(fù)次數(shù)越多越好。重復(fù)試驗(yàn)的目的是估計(jì)和減小隨機(jī)誤差。
2)隨機(jī)化原則
隨機(jī)化原則就是在試驗(yàn)中每一個(gè)處理及每一個(gè)重復(fù)都有同等的機(jī)會(huì)被安排在某一特定的空間和時(shí)間環(huán)境中,以消除某些處理或其重復(fù)可能占有的“優(yōu)勢”或“劣勢”,保證試驗(yàn)條件在空間和時(shí)間上的均勻性。
3)對(duì)照原則
對(duì)照原則包括空白對(duì)照、安慰劑對(duì)照、實(shí)驗(yàn)條件對(duì)照、標(biāo)準(zhǔn)對(duì)照、歷史或中外對(duì)照。
4)區(qū)組原則
人為劃分的時(shí)間、空間、設(shè)備等實(shí)驗(yàn)條件,稱為區(qū)組。區(qū)組因素也是影響實(shí)驗(yàn)指標(biāo)的因素,但并不是實(shí)驗(yàn)者所要考察的因素,故也稱為非處理因素。
【相關(guān)鏈接】
試驗(yàn)設(shè)計(jì)還有哪些常見術(shù)語?
(1)試驗(yàn)指標(biāo)(experimental index)
在試驗(yàn)設(shè)計(jì)中,根據(jù)試驗(yàn)的目的而選定的用來衡量或考核試驗(yàn)效果的質(zhì)量特性,稱為試驗(yàn)指標(biāo)。
(2)試驗(yàn)因素(experimental factor)
試驗(yàn)中,凡對(duì)試驗(yàn)指標(biāo)可能產(chǎn)生影響的原因,都稱為因素。通常把試驗(yàn)中所研究的影響試驗(yàn)指標(biāo)的因素稱為試驗(yàn)因素;把除試驗(yàn)因素外其他所有對(duì)試驗(yàn)指標(biāo)有影響的因素稱為條件因素,又稱試驗(yàn)條件。
(3)因素水平
在試驗(yàn)中,為考察試驗(yàn)因素對(duì)試驗(yàn)指標(biāo)的影響情況,要使試驗(yàn)因素處于不同的狀態(tài)。把試驗(yàn)因素所處的各種狀態(tài)稱為因素水平,簡稱水平。
(4)試驗(yàn)處理
試驗(yàn)處理簡稱處理,在單因素試驗(yàn)中,試驗(yàn)的一個(gè)水平就是一個(gè)處理。試驗(yàn)處理是指事先設(shè)計(jì)好的實(shí)施在試驗(yàn)單位上的一種具體措施。
反思與練習(xí)
1.試驗(yàn)設(shè)計(jì)與數(shù)據(jù)處理的意義是什么?
2.試驗(yàn)設(shè)計(jì)基本術(shù)語及其含義是什么?
3.試驗(yàn)設(shè)計(jì)的基本原則是什么?
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請(qǐng)告知,我們將盡快刪除相關(guān)內(nèi)容。