數(shù)據(jù)挖掘的步驟
16.5.2 數(shù)據(jù)挖掘的步驟
數(shù)據(jù)挖掘一般可由下面五個(gè)步驟組成。
(1)數(shù)據(jù)集成
數(shù)據(jù)挖掘的基礎(chǔ)是數(shù)據(jù),因此在挖掘前必須進(jìn)行數(shù)據(jù)集成,這包括首先從各類數(shù)據(jù)系統(tǒng)中提取挖掘所需的統(tǒng)一數(shù)據(jù)模型,建立一致的數(shù)據(jù)視圖,其次是作數(shù)據(jù)加載,從而形成挖掘的數(shù)據(jù)基礎(chǔ),目前,一般都用數(shù)據(jù)倉庫以實(shí)現(xiàn)數(shù)據(jù)集成。
(2)數(shù)據(jù)歸約
在數(shù)據(jù)集成后對(duì)數(shù)據(jù)作進(jìn)一步加工,這包括淘汰一些噪音與臟數(shù)據(jù),對(duì)有效數(shù)據(jù)作適當(dāng)調(diào)整,以保證基礎(chǔ)數(shù)據(jù)的可靠與一致。這兩個(gè)步驟是數(shù)據(jù)挖掘的數(shù)據(jù)準(zhǔn)備,它保證了數(shù)據(jù)挖掘的有效性。
(3)挖掘
在數(shù)據(jù)準(zhǔn)備工作完成后即進(jìn)入挖掘階段,在此階段可以根據(jù)挖掘要求選擇相應(yīng)的方法與相應(yīng)挖掘參數(shù),如可信度參數(shù)等,在挖掘結(jié)束后即可得到相應(yīng)的規(guī)則。
(4)評(píng)價(jià)
經(jīng)過挖掘后所得結(jié)果可有多種,此時(shí)可以對(duì)挖掘的結(jié)果按一定標(biāo)準(zhǔn)作出評(píng)價(jià),并選取評(píng)價(jià)較高者作為結(jié)果。
(5)表示
數(shù)據(jù)挖掘結(jié)果的規(guī)則可在計(jì)算機(jī)中用一定形式表示出來,它可以包括文字、圖形、表格、圖表等可視化形式,也可同時(shí)用內(nèi)部結(jié)構(gòu)形式存儲(chǔ)于知識(shí)庫中供日后進(jìn)一步分析之用。
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請(qǐng)告知,我們將盡快刪除相關(guān)內(nèi)容。