距離的定義
【摘要】:通過聚類分析,我們可以把事物分成若干個(gè)類別,使得類別的內(nèi)部差異盡可能小,類別間的差異盡可能大。那么最重要的問題是如何描述這種差異?偉大的統(tǒng)計(jì)學(xué)家發(fā)明了各式各樣的描述距離的方法,在統(tǒng)計(jì)學(xué)中常用的距離表達(dá)式歐氏距離。兩個(gè)樣本之間的歐氏距離是樣本各個(gè)變量值之差的平方和的平方根,計(jì)算公式為:在聚類分析中,人們往往會使用歐氏距離的平方來度量距離。
通過聚類分析,我們可以把事物分成若干個(gè)類別,使得類別的內(nèi)部差異盡可能小,類別間的差異盡可能大。那么最重要的問題是如何描述這種差異?人們通常的做法是通過計(jì)算距離或者相似的方法來描述。偉大的統(tǒng)計(jì)學(xué)家發(fā)明了各式各樣的描述距離的方法,在統(tǒng)計(jì)學(xué)中常用的距離表達(dá)式歐氏距離(Euclidean Distance)。兩個(gè)樣本之間的歐氏距離是樣本各個(gè)變量值之差的平方和的平方根,計(jì)算公式為:
在聚類分析中,人們往往會使用歐氏距離的平方來度量距離。兩個(gè)樣本之間的歐氏距離的平方是各個(gè)樣本之差的平方和,計(jì)算公式為:
兩個(gè)樣本之間的Chebychev距離是各樣本所有變量值之差絕對值中的最大值,計(jì)算公式為:
兩個(gè)樣本之間的Block距離是各樣本所有變量值之差絕對值的總和,計(jì)算公式為:
兩個(gè)樣本之間的Minkowski距離是各樣本所有變量值之差絕對值的p次方的總和,再求p次方根。計(jì)算公式為:
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請告知,我們將盡快刪除相關(guān)內(nèi)容。