批判"大數(shù)據(jù)崇拜"
最近以來(lái),對(duì)于“大數(shù)據(jù)”的崇拜,來(lái)勢(shì)洶洶,甚囂塵上。
但是,崇拜者和鼓吹者,多少也應(yīng)該有一點(diǎn)做研究的起碼常識(shí)吧?
無(wú)論在自然科學(xué)里,還是社會(huì)科學(xué)里,還是文本分析中,凡是進(jìn)行數(shù)據(jù)分析,只有兩種辦法:
第一種方法是:研究者自己首先提出某個(gè)或者某些假設(shè),然后去收集數(shù)據(jù),然后進(jìn)行統(tǒng)計(jì)檢驗(yàn),以便對(duì)于自己的假設(shè)做出適當(dāng)?shù)脑u(píng)價(jià),主要結(jié)論應(yīng)該是:該假設(shè)是否得以成立。也就是說(shuō),“沒(méi)有假設(shè),就沒(méi)有研究”或者“好的假設(shè)就是成功的一半”。這,對(duì)于任何一種遵循“科學(xué)主義”的研究來(lái)說(shuō),不但是金科玉律,而且根本就是不可突破的底線啊。
可是,所謂的“大數(shù)據(jù)”,在收集數(shù)據(jù)之前,可曾有過(guò)任何一個(gè)假設(shè)嗎?甚至,研究者究竟有沒(méi)有猜測(cè)到:那些數(shù)據(jù)之間,可能存在著某種聯(lián)系呢?例如,如果您把人們?cè)诰W(wǎng)上購(gòu)物時(shí)留下的痕跡,與他們?cè)卺t(yī)院就診時(shí)留下的記錄,強(qiáng)行放在同一個(gè)數(shù)據(jù)庫(kù)進(jìn)行分析;那么,您就等于在假設(shè):購(gòu)物與生病之間,可能存在著某種聯(lián)系。這并不是說(shuō),根本不可以提出這個(gè)假設(shè),而是說(shuō),您事先是這么想的嗎?如果沒(méi)有,那么跟盲人摸象有什么區(qū)別呢?
尤其是,無(wú)論您從這樣的“大數(shù)據(jù)”中分析出什么,都只能是誤人子弟。例如,早在上個(gè)世紀(jì),美國(guó)的統(tǒng)計(jì)學(xué)家就發(fā)現(xiàn),股市的漲落,與女人裙子的長(zhǎng)短,存在著相關(guān)關(guān)系??墒且恢币詠?lái),在任何一個(gè)國(guó)外大學(xué)里,這都被用來(lái)說(shuō)明“無(wú)假設(shè),不統(tǒng)計(jì)”這一常識(shí)??墒乾F(xiàn)在卻又被某些人翻出來(lái),作為“大數(shù)據(jù)之所以偉大”的證據(jù)啦。
我的一位學(xué)生說(shuō)得好:“這和去垃圾堆里翻安全套,本質(zhì)上一致吧?”我再引申一下:沒(méi)有假設(shè),大數(shù)據(jù)就是垃圾堆!
如此下去,科學(xué)還有存身之地嗎?
第二種研究方法,是從定性研究(質(zhì)性研究)里的“求異法”借鑒來(lái)的,就是:不去尋找數(shù)據(jù)的“規(guī)律性”,而是通過(guò)分析,去發(fā)現(xiàn)“特定事物(現(xiàn)象)內(nèi)部的多樣化的存在”,或者“同一事物(現(xiàn)象)在不同載體中的多樣化存在”。也就是說(shuō),研究者的假設(shè)是:任何事物(現(xiàn)象)都不可能是渾然一體,必定存在著萬(wàn)紫千紅甚至千奇百怪的存在形式。研究者的目標(biāo),就是去發(fā)現(xiàn)和揭示這一點(diǎn)。因此,研究者全神貫注的,恰恰是數(shù)據(jù)中那些小概率的、奇異的、甚至缺失的情況。
正是在這個(gè)意義上,而且僅僅在這個(gè)意義上,大數(shù)據(jù)才會(huì)有用。例如,哪怕只有萬(wàn)分之一的人,確實(shí)是在網(wǎng)上購(gòu)物之后才有病,或者有病之后才上網(wǎng)購(gòu)物;那么也可以提示我們:為什么僅僅是這些人才會(huì)出現(xiàn)這樣的聯(lián)系呢?其中是不是蘊(yùn)含著我們現(xiàn)在還不知道的某種學(xué)理呢?
所以說(shuō):這種“沙里澄金”的研究方法,主要是為了“發(fā)現(xiàn)”,而不是為了“檢驗(yàn)”。但是只有這種方法,才能實(shí)現(xiàn)理論的獨(dú)辟蹊徑,而不僅僅是既有成果的“層層疊加”。
可是,我真的很好奇:那些“大數(shù)據(jù)崇拜者”,聽(tīng)說(shuō)過(guò)這樣的“論方法”嗎?
什么叫“大”?
數(shù)據(jù),早已有之;因此“大數(shù)據(jù)”的買點(diǎn),其實(shí)僅僅在于一個(gè)“大”字。
鼓吹者們都在拼命宣揚(yáng):我們收集了多少多少人的,多少多少次的,多少多少種的記錄,因此,只有我們的數(shù)據(jù)才是“大”數(shù)據(jù)!
可是,我就奇怪啦,大數(shù)據(jù)怎么看起來(lái)像是打群架,人多為王?
其實(shí),如果我在自己的電腦上,安裝上足夠多的各種儀器,記錄下從鼠標(biāo)軌跡到上網(wǎng)痕跡直到我的表情動(dòng)作的自拍;那么只需要一天,我所收集到的、僅僅關(guān)于我一個(gè)人用電腦的數(shù)據(jù),也肯定是成千上萬(wàn)個(gè)G,足以成為貨真價(jià)實(shí)的“大數(shù)據(jù)”。
如果我再給自己身上安上一大堆醫(yī)學(xué)監(jiān)測(cè)儀器,給自己的書(shū)房安上360度攝像頭、溫度計(jì)、紅外線掃描甚至“地動(dòng)儀”,而且24小時(shí)開(kāi)動(dòng);那么您說(shuō),我這一個(gè)人的數(shù)據(jù)會(huì)有多大?
也就是說(shuō),數(shù)據(jù)大不大,根本不在于記錄了多少人或者多少次或者多少種行為,而僅僅在于:監(jiān)測(cè)手段用得多不多!
因此,現(xiàn)在之所以出現(xiàn)“大數(shù)據(jù)崇拜”,其實(shí)根本不是那些數(shù)據(jù)擁有者有什么高明之處,而是僅僅在于:人類的監(jiān)測(cè)手段出現(xiàn)了爆炸式的增長(zhǎng)。我們不但看到了火星上的水,還看到了我們自己的DNA!
當(dāng)然,大數(shù)據(jù)崇拜者可以說(shuō):我們意識(shí)到了大量的監(jiān)測(cè)數(shù)據(jù)的價(jià)值啊。可惜,如我前文所述,如果您都不知道該怎么用,那么您發(fā)現(xiàn)的,究竟是大數(shù)據(jù)的價(jià)值,還是大垃圾的價(jià)值?就算是廢物可以再生,您也應(yīng)該想想該怎么再生不是?
“大數(shù)據(jù)崇拜”里面,還有一個(gè)大大的貓膩,是死也不肯讓別人知道的:大,是整體的大,還是片面的大?
以購(gòu)物網(wǎng)站記錄下來(lái)的數(shù)據(jù)為例,它確實(shí)可以容納數(shù)千萬(wàn)人在購(gòu)物時(shí)不知不覺(jué)地留下的近乎無(wú)窮無(wú)盡的痕跡;但是,這就能反映出這些人的購(gòu)物偏愛(ài)嗎?難道這些人就再也不在實(shí)體商店中買東西了嗎?難道他們就只到您這一個(gè)購(gòu)物網(wǎng)站來(lái)買東西嗎?難道他們的偏愛(ài)就永恒不變嗎?那么,您怎么能夠確定:他們?cè)诓煌那乐?,在不同的情境之中,都?huì)做出一模一樣的選擇呢?可是,如果您無(wú)法證明這一點(diǎn),那么您的大數(shù)據(jù)就只能是大垃圾,一點(diǎn)兒也不冤。
交通監(jiān)控錄像、醫(yī)療記錄、通訊記錄等等,都足以號(hào)稱自己是“大數(shù)據(jù)”??墒牵羞@些數(shù)據(jù),都僅僅是記錄下了人們生活中的一個(gè)個(gè)零散的側(cè)面。因此,這樣的“大數(shù)據(jù)”再怎么大,也無(wú)法解決以下一系列常識(shí)性的問(wèn)題:
1.人在生活的某個(gè)側(cè)面里的表現(xiàn),與他/她的整個(gè)人格與人生,難道不存在緊密的關(guān)聯(lián)嗎?農(nóng)民工吃20元的盒飯都嫌貴;富豪買上千萬(wàn)的汽車也不眨眼;這難道僅僅是所謂的“消費(fèi)選擇”嗎?
2.人類生活的各個(gè)側(cè)面之間,難道不是相互影響著的嗎?農(nóng)民工吃20元的盒飯,卻可以搭上200元的禮錢;富豪買上千萬(wàn)的汽車,卻不肯做一點(diǎn)兒慈善;這也僅僅是所謂“購(gòu)買習(xí)慣”嗎?
3.任何一個(gè)人的生活,難道不是被社會(huì)、文化、歷史等因素制約著嗎?吃20元盒飯的,也有IT業(yè)白領(lǐng),也是來(lái)自農(nóng)村,卻從來(lái)不被認(rèn)為是農(nóng)民工。比爾·蓋茨的形象中,也從來(lái)不包括他的汽車是多少錢買來(lái)的;這,難道也是“可付資金”嗎?
4.……
5.……
所以說(shuō),所謂的大數(shù)據(jù),其實(shí)一點(diǎn)都沒(méi)有超出原有的定量研究的局限性,那就是:裁剪生活,撕碎人生;非要把整體生存的“人”,視為一堆雜亂的零碎。如此這般,數(shù)據(jù)越大,豈不是錯(cuò)誤越大?
當(dāng)然啦,大數(shù)據(jù)崇拜者已經(jīng)說(shuō)了:我們很快就可以把方方面面的大數(shù)據(jù),匯總為一個(gè)包羅萬(wàn)象的大“大數(shù)據(jù)”,例如全方位、不間斷地監(jiān)測(cè)所有人,就足以最終一勞永逸地解決那個(gè)“天問(wèn)”:人類為什么做什么和不做什么。
額滴親娘啊,這可真是道出了“司馬昭之心”啦!
“大數(shù)據(jù)崇拜”唯一的功勞,其實(shí)就是迫使我們不得不認(rèn)真思考一下:
在這種隨時(shí)隨地的、天羅地網(wǎng)般的、細(xì)致入微的、一生一世的被監(jiān)測(cè)中,
我們的生活,真的還有意義嗎?
能說(shuō)明什么?
盲目崇拜或者大肆鼓吹所謂“大數(shù)據(jù)”的那些人,或者不知道,或者刻意回避了一個(gè)根本的問(wèn)題:無(wú)論數(shù)據(jù)的規(guī)模多么大,它究竟能夠反映出什么樣的情況,能說(shuō)明什么樣的問(wèn)題呢?
迄今為止,“大數(shù)據(jù)崇拜者”所列舉的“豐功偉績(jī)”,其實(shí)僅僅局限于反映出人類的某些可監(jiān)測(cè)而且可記錄的行為,例如各種網(wǎng)上活動(dòng)、出行、通訊、接受各種服務(wù)等等。也就是說(shuō),如果人們不行動(dòng),或者不被監(jiān)測(cè)到,那么大數(shù)據(jù)就不可能存在。
可是,就算毫無(wú)隱私,就算監(jiān)測(cè)可以天羅地網(wǎng),那人心呢?靈魂呢?企盼呢?人類精神家園一切的一切,都可以被“數(shù)字化測(cè)定”嗎?如果至少現(xiàn)在還不能,那么大數(shù)據(jù)(且不論能不能分析)就是動(dòng)物學(xué),是植物學(xué),甚至是礦物學(xué)。君不見(jiàn),冰川也會(huì)運(yùn)動(dòng)啊。
當(dāng)然,一些科學(xué)主義者早就發(fā)誓要突破人類精神的壁壘了。我并不懷疑他們的成功可能性;只想問(wèn):他們究竟是終于把人類精神給數(shù)字化了,還是給靈魂豎起一面哈哈鏡呢?
“大數(shù)據(jù)崇拜者”很可能不知道,或者不敢承認(rèn):在人類生活中還有一種現(xiàn)象,叫做“主體建構(gòu)”;就是:人們對(duì)于自己的行為所做出的解釋,很可能與監(jiān)測(cè)者的解釋大相徑庭,甚至背道而馳。最常見(jiàn)的就是,一切人際的誤會(huì),蓋源于此?!盁o(wú)心插柳柳成蔭”也是如此。
以網(wǎng)購(gòu)的“大數(shù)據(jù)”為例,即使您總有一天可以把購(gòu)買者的內(nèi)心,全都數(shù)字化地一覽無(wú)余,那您怎么知道人家就真的就是這樣想的呢?科學(xué)嘛,總是需要驗(yàn)證的啊。
結(jié)果,
首先,您這種“客觀測(cè)定”,離礦物學(xué)很近,可是人卻是有主觀意志的啊,您是怎么監(jiān)測(cè)到的?連物理學(xué)還有個(gè)“測(cè)不準(zhǔn)原理”呢,何況您老?
第二,您知道人類還會(huì)“自我呈現(xiàn)”嗎?說(shuō)不好聽(tīng)一些,就是表演。如果連測(cè)謊儀的結(jié)果,法律都還不予采信,那么您怎么篩除被監(jiān)測(cè)對(duì)象的表演呢?
第三,難道您就不找被監(jiān)測(cè)對(duì)象去核實(shí)一下?連司法審判還要聽(tīng)被告怎么說(shuō)呢不是?難道真的把人當(dāng)成石頭?
第四,您聽(tīng)說(shuō)過(guò)弗洛伊德嗎?您知道除了“動(dòng)機(jī)”,還有“無(wú)意識(shí)”嗎?如果行為者自己都搞不清楚自己是怎么回事,那么您還怎么去核實(shí)呢?根據(jù)什么來(lái)判斷真?zhèn)文兀?/p>
總而言之,一切試圖用自然科學(xué)或者數(shù)字化來(lái)了解人類及其社會(huì)的嘗試,不是都必然失敗,而是都無(wú)法否定人類的“主體建構(gòu)”的重要性;結(jié)果都必然是把真實(shí)的生活給削足適履了。
說(shuō)到底,“大數(shù)據(jù)崇拜”,其實(shí)就是“唯科學(xué)主義”在人類歷史面前一敗涂地后的末日哀鳴。如果科學(xué)沒(méi)能阻止希特勒的統(tǒng)治,也沒(méi)能預(yù)測(cè)出此后人類的一切發(fā)展,那么就絕不是“藝不精”的問(wèn)題,而是用錯(cuò)了地方,是越界跑到了自己無(wú)能為力的領(lǐng)域。
中國(guó)社會(huì)學(xué),已經(jīng)飽受“唯量化主義”的侵蝕,如果現(xiàn)在還放任“大數(shù)據(jù)崇拜”肆虐,那么可就真是泥菩薩過(guò)河自身難保了。
因此,我才如此聲色俱厲,也因?yàn)槲冶救艘呀?jīng)完成第四次全國(guó)隨機(jī)抽樣的量化問(wèn)卷調(diào)查,深諳其弊,才更加有資格如此義憤填膺。
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請(qǐng)告知,我們將盡快刪除相關(guān)內(nèi)容。