大數(shù)據(jù)與社會(huì)科學(xué)量化研究
米加寧 李大宇 章昌平 林 濤*
* 米加寧,哈爾濱工業(yè)大學(xué)管理學(xué)院教授;李大宇,哈爾濱商業(yè)大學(xué)財(cái)政與公共管理學(xué)院講師;章昌平,桂林理工大學(xué)人文社會(huì)科學(xué)學(xué)院副教授;林濤,哈爾濱工業(yè)大學(xué)高等教育研究所/發(fā)展戰(zhàn)略研究中心講師。
摘 要:社會(huì)科學(xué)量化研究從誕生至今,經(jīng)歷了實(shí)證主義的因果關(guān)系解決方案、非線性問(wèn)題線性化的解決方案和基于主體的復(fù)雜系統(tǒng)建模解決方案。這些研究方案與大數(shù)據(jù)研究一同處于從通則論到個(gè)體論的連續(xù)統(tǒng)中,但上述既有社會(huì)科學(xué)量化研究方案存在生態(tài)謬誤、內(nèi)生性問(wèn)題、偶然性因素及數(shù)據(jù)短板等缺陷。大數(shù)據(jù)研究將重構(gòu)社會(huì)科學(xué)研究的方法論基礎(chǔ),對(duì)社會(huì)科學(xué)研究的未來(lái)發(fā)展形成重大影響,特別是將融合定性定量研究,為已有量化研究提供精準(zhǔn)的數(shù)據(jù)支撐和全新的視角。大數(shù)據(jù)研究的發(fā)展急需解決數(shù)據(jù)的可及性問(wèn)題,需由國(guó)家主導(dǎo),有計(jì)劃、分層次地構(gòu)建有中國(guó)特色的大數(shù)據(jù)開(kāi)放服務(wù)產(chǎn)業(yè)。
關(guān)鍵詞:大數(shù)據(jù);社會(huì)科學(xué);量化研究;研究方法
社會(huì)科學(xué)從誕生至今始終沒(méi)有作為一門嚴(yán)格的科學(xué)而得到大家的公認(rèn),其中最主要的原因就是社會(huì)科學(xué)缺少精確的量化描述(陶遠(yuǎn)華,1989)。當(dāng)然,現(xiàn)有的社會(huì)科學(xué)實(shí)證量化研究在數(shù)學(xué)表達(dá)上日趨精審,但與真實(shí)世界的契合度有限。“一門科學(xué)只有在成功地運(yùn)用數(shù)學(xué)時(shí),才算達(dá)到了真正完善的地步”(拉法格,1941),照此標(biāo)準(zhǔn),社會(huì)科學(xué)運(yùn)用數(shù)學(xué)進(jìn)行量化研究的程度遠(yuǎn)遠(yuǎn)沒(méi)有達(dá)到完善的地步。社會(huì)科學(xué)“學(xué)術(shù)思想和研究的演變過(guò)程受到特定歷史條件下研究方法和分析手段的深刻影響”(克魯格曼,2000),其量化方法整體上還處在“相當(dāng)初期和極其混亂的發(fā)展階段”和“描寫性、會(huì)診性和學(xué)術(shù)性狀態(tài)”(約翰·奇曼,1985;貝爾納,2003)。近年來(lái),隨著混合研究方法以及信息化帶來(lái)的社會(huì)測(cè)量水平的不斷提升,社會(huì)科學(xué)研究的這種狀況似乎迎來(lái)了改變的契機(jī)。美國(guó)哈佛大學(xué)定量社會(huì)科學(xué)研究院教授Gary King認(rèn)為在過(guò)去十年間,社會(huì)科學(xué)量化研究對(duì)世界產(chǎn)生了史無(wú)前例的影響,主要原因在于社會(huì)科學(xué)對(duì)與“人相關(guān)的大數(shù)據(jù)的擁抱”。社會(huì)科學(xué)正“處于一個(gè)歷史性變革”之中,“從用少量數(shù)據(jù)集的輔助研究,轉(zhuǎn)向?qū)?shù)量不斷擴(kuò)大的各種高信息含量數(shù)據(jù)進(jìn)行研究”是其重要表現(xiàn)之一,這將促使“大部分人文社會(huì)科學(xué)走向具有自然科學(xué)的特征”(Tony,Stewart and Kristin,2009)。這是繼Jim Gray2007年在自然科學(xué)研究領(lǐng)域提出基于數(shù)據(jù)密集型科學(xué)研究范式之后,在社會(huì)科學(xué)研究領(lǐng)域?qū)Υ髷?shù)據(jù)將會(huì)帶來(lái)革命性變革的預(yù)言。隨著信息化不斷深入發(fā)展,社會(huì)各領(lǐng)域?qū)⒃丛床粩嗟禺a(chǎn)生信息,這不僅造成數(shù)據(jù)量的激增,也將同時(shí)產(chǎn)生“理解個(gè)體、群體、社會(huì)如何思考和行為的方法上的顯著進(jìn)步”(King,2014)。國(guó)內(nèi)外學(xué)者都認(rèn)為大數(shù)據(jù)的到來(lái)必然會(huì)對(duì)傳統(tǒng)社會(huì)科學(xué)的研究方式產(chǎn)生巨大沖擊(劉林平,蔣和超,2016),大數(shù)據(jù)研究不僅能夠彌補(bǔ)長(zhǎng)期以來(lái)人們對(duì)社會(huì)科學(xué)產(chǎn)出不足的詬病,而且還將推進(jìn)社會(huì)科學(xué)自17世紀(jì)誕生以來(lái)對(duì)“科學(xué)”孜孜以求的探索,這無(wú)疑使社會(huì)科學(xué)研究迎來(lái)前所未有的機(jī)遇。
一、社會(huì)科學(xué)量化研究的三個(gè)解決方案
社會(huì)科學(xué)量化研究發(fā)展最早可以追溯到古希臘哲學(xué)家柏拉圖基于“二值原則”區(qū)分知識(shí)真假性問(wèn)題的“類型邏輯思維”,以及亞里士多德“四因說(shuō)”中“質(zhì)料因”、“動(dòng)力因”等有關(guān)量化研究方法論及因果關(guān)系的哲學(xué)思想,這些原初思想是社會(huì)科學(xué)量化研究的哲學(xué)啟蒙,“在希臘多種多樣的形式中,差不多可以找到以后各種觀點(diǎn)的胚胎、萌芽”(中共中央馬克思恩格斯列寧斯大林著作編譯局,1972)。17世紀(jì)下半葉開(kāi)始,研究者們?yōu)楦纳粕鐣?huì)管理水平開(kāi)始轉(zhuǎn)向?qū)ι鐣?huì)現(xiàn)象的量化研究,統(tǒng)計(jì)學(xué)創(chuàng)立并應(yīng)用到古典政治經(jīng)濟(jì)學(xué)研究中。從此以后的300余年,量化研究在社會(huì)科學(xué)創(chuàng)立和發(fā)展過(guò)程中發(fā)揮了巨大的作用。通過(guò)量化研究,政治學(xué)、經(jīng)濟(jì)學(xué)等諸多傳統(tǒng)社會(huì)科學(xué)學(xué)科獲得了新的發(fā)展空間,特別是社會(huì)學(xué)得以創(chuàng)立并不斷深化,社會(huì)科學(xué)學(xué)科分支逐步細(xì)化和延伸,學(xué)科理論不斷深化,與社會(huì)實(shí)踐的結(jié)合也更為緊密。直到近50年以來(lái),包括社會(huì)學(xué)、經(jīng)濟(jì)學(xué)、政治學(xué)、管理學(xué)、教育學(xué)、人口學(xué)在內(nèi)的社會(huì)科學(xué)總體向更為嚴(yán)格的科學(xué)主義取向、更為專業(yè)的方向發(fā)展,這在相當(dāng)程度上是以統(tǒng)計(jì)學(xué)的廣泛運(yùn)用和量化研究為基礎(chǔ)的。通過(guò)對(duì)社會(huì)科學(xué)量化研究方法的梳理,我們按照歷史發(fā)展序列將其總結(jié)為三個(gè)解決方案:實(shí)證主義因果關(guān)系的解決方案、非線性問(wèn)題線性化的解決方案和基于主體的復(fù)雜系統(tǒng)建模解決方案(詳見(jiàn)圖1)。
圖1 社會(huì)科學(xué)量化研究的三個(gè)解決方案
(一)實(shí)證主義的因果關(guān)系解決方案
實(shí)證主義的因果關(guān)系解決方案的哲學(xué)基礎(chǔ)是實(shí)證主義、邏輯實(shí)證主義和操作實(shí)證主義。基本脈絡(luò)分為三個(gè)部分:一是假設(shè)檢驗(yàn)成為主要量化研究方法論,在哲學(xué)基礎(chǔ)上建立了以孔德、維特根斯坦為代表的經(jīng)典實(shí)證主義與邏輯實(shí)證主義,進(jìn)化論補(bǔ)充總體邏輯思維;二是在方法上,概率論引入社會(huì)科學(xué)研究,并與高爾登提出的生物統(tǒng)計(jì)學(xué)相關(guān)分析和回歸方法結(jié)合,進(jìn)一步發(fā)展成為一般統(tǒng)計(jì)方法,t檢驗(yàn)、區(qū)間估值、方差分析等小樣本統(tǒng)計(jì)理論和推論統(tǒng)計(jì)學(xué)得到了應(yīng)用,如涂爾干的《自殺論》展現(xiàn)了“一個(gè)兼有正確性和精確性特征的經(jīng)驗(yàn)性實(shí)證科學(xué)”(郭大水,2007);三是操作上,與實(shí)用主義相結(jié)合,提出了操作主義測(cè)量理論、實(shí)驗(yàn)設(shè)計(jì)原理,特別是統(tǒng)計(jì)技術(shù)和工具的不斷改善促進(jìn)了調(diào)查革命。這些進(jìn)展使該解決方案在20世紀(jì)40—50年代推出一系列教科書和重要研究成果后,達(dá)到了鼎盛時(shí)期,成為社會(huì)科學(xué)量化研究的主流取向。
從孔德開(kāi)始,實(shí)證主義的因果關(guān)系解決方案認(rèn)為社會(huì)科學(xué)與自然科學(xué)性質(zhì)一樣,都是尋找和建立普遍規(guī)律(劉放桐,2000),主張以科學(xué)的經(jīng)驗(yàn)研究排斥形而上學(xué)的思辨和臆測(cè)(吳曉剛,2014)。在研究中堅(jiān)持歸納主義和價(jià)值中立,主張方法論的個(gè)體主義(認(rèn)為社會(huì)現(xiàn)象均可還原為個(gè)人行為的合力),對(duì)經(jīng)驗(yàn)的檢驗(yàn)不依賴于主觀的感覺(jué),而是邏輯的檢驗(yàn)(沃野,2005)。其基本研究路徑是“提出假設(shè)—驗(yàn)證假設(shè)”,遵循“觀察社會(huì)現(xiàn)象—發(fā)現(xiàn)研究問(wèn)題—收集有關(guān)個(gè)體的個(gè)性資料和數(shù)據(jù)—進(jìn)行統(tǒng)計(jì)和分析—發(fā)現(xiàn)共性的、普遍的規(guī)律”的研究理路。
20世紀(jì)20年代以來(lái),隨著自然科學(xué)研究的不斷發(fā)展,機(jī)械決定論產(chǎn)生了動(dòng)搖,經(jīng)典自然科學(xué)中自然定律時(shí)間反演對(duì)稱和“世界處于封閉的、唯一決定的因果鏈條中”被物理學(xué)、化學(xué)和生命科學(xué)的系列新發(fā)現(xiàn)打破了。對(duì)系統(tǒng)的綜合研究重新開(kāi)始重視集群效應(yīng)和相互作用、整體結(jié)構(gòu)和功能,在還原論指導(dǎo)下的學(xué)科劃分重新走向綜合,邊緣學(xué)科、交叉學(xué)科紛紛出現(xiàn)。二戰(zhàn)以后在數(shù)學(xué)和計(jì)算機(jī)科學(xué)上的突破也對(duì)社會(huì)科學(xué)量化研究的第一方案產(chǎn)生沖擊。再加上基于科學(xué)實(shí)證主義的哲學(xué)基礎(chǔ)開(kāi)始動(dòng)搖,這一方案在20世紀(jì)60年代以后逐漸受到質(zhì)疑,隨著定性研究方法和混合方法的興起,實(shí)證主義因果分析研究不再是社會(huì)科學(xué)量化研究的唯一取向。
(二)非線性問(wèn)題線性化的解決方案
非線性問(wèn)題線性化的解決方案以系統(tǒng)動(dòng)力學(xué)為代表,是在系統(tǒng)論、控制論、信息論、決策理論和計(jì)算機(jī)模擬技術(shù)基礎(chǔ)上(李旭,2009),對(duì)復(fù)雜巨系統(tǒng)開(kāi)展“定性到定量綜合集成”研究的方法(錢學(xué)森,2005)。這一解決方案的方法論基礎(chǔ)來(lái)自微分方程的數(shù)學(xué)原理,其廣泛應(yīng)用則依賴計(jì)算機(jī)技術(shù)在數(shù)學(xué)建模中的實(shí)現(xiàn)。在社會(huì)科學(xué)研究中,由于社會(huì)經(jīng)濟(jì)系統(tǒng)的非線性因素作用,高階次復(fù)雜時(shí)變系統(tǒng)往往表現(xiàn)出反直觀的、千姿百態(tài)的動(dòng)態(tài)特征。系統(tǒng)動(dòng)力學(xué)運(yùn)用系統(tǒng)結(jié)構(gòu)決定系統(tǒng)功能的原理,從系統(tǒng)的整體出發(fā)研究系統(tǒng)內(nèi)部要素之間的因果關(guān)系及反饋環(huán)的動(dòng)態(tài)行為特征,應(yīng)用計(jì)算機(jī)模擬技術(shù)求得系統(tǒng)的宏觀行為,建立各要素及其相互作用的流圖與模擬模型,實(shí)施不同的政策調(diào)控,從而尋求解決問(wèn)題的途徑,實(shí)現(xiàn)系統(tǒng)的優(yōu)化控制(張波、袁永根,2010)。其基本思路主要是將復(fù)雜的非線性問(wèn)題轉(zhuǎn)化成為大型差分方程系統(tǒng)(多階微分方程),以趨勢(shì)外推為研究方法,模擬變量隨時(shí)間變化的軌跡,從而達(dá)到預(yù)測(cè)的目標(biāo)。1972年,羅馬俱樂(lè)部利用系統(tǒng)動(dòng)力學(xué)方法建立的世界模型“WorldⅢ”,研究了世界范圍內(nèi)的人口、資源、工業(yè)、農(nóng)業(yè)和污染等諸多因素的相互聯(lián)系、制約和作用以及產(chǎn)生的后果的各種可能,提交了著名的《增長(zhǎng)的極限》報(bào)告,對(duì)人類社會(huì)指數(shù)式增長(zhǎng)的勢(shì)頭提出了悲觀的結(jié)論,并提出達(dá)到世界平衡和穩(wěn)定發(fā)展的決定性條件(Meadows and Rander,1972)。雖然該模型引發(fā)了激烈爭(zhēng)論,但也證明了系統(tǒng)動(dòng)力學(xué)在社會(huì)經(jīng)濟(jì)系統(tǒng)領(lǐng)域研究的可行性。羅馬俱樂(lè)部把系統(tǒng)動(dòng)力學(xué)模型推向了一個(gè)高峰,但模型預(yù)測(cè)的狀況未能在真實(shí)世界出現(xiàn),這也暴露出了系統(tǒng)動(dòng)力學(xué)模型的內(nèi)在缺陷,即模型不能隨環(huán)境的變化而進(jìn)化。20世紀(jì)90年代后,系統(tǒng)動(dòng)力學(xué)方法被用于社會(huì)經(jīng)濟(jì)復(fù)雜系統(tǒng)研究,國(guó)家系統(tǒng)動(dòng)力學(xué)、城市系統(tǒng)動(dòng)力學(xué)、社會(huì)系統(tǒng)動(dòng)力學(xué)得到不斷發(fā)展和推廣,為我們分析和研究這些復(fù)雜的巨系統(tǒng)提供了一種結(jié)構(gòu)化的思考方法、有效的交流工具和“政策實(shí)驗(yàn)室”。
(三)基于主體的復(fù)雜系統(tǒng)建模解決方案
基于主體的復(fù)雜系統(tǒng)建模解決方案主要基于復(fù)雜適應(yīng)性系統(tǒng)(CAS)理論,該理論由美國(guó)圣塔·菲研究所的Holand提出,同時(shí)他也提出了研究CAS系統(tǒng)的建模技術(shù),即采用基于主體建模(Agent-Based Modeling,ABM)方法對(duì)社會(huì)經(jīng)濟(jì)系統(tǒng)進(jìn)行仿真。CAS理論中最基本的組成元素是具有自主適應(yīng)能力個(gè)體,簡(jiǎn)稱主體,這種主體在與環(huán)境的交互作用中遵循一般的刺激—反應(yīng)模型,所謂適應(yīng)能力表現(xiàn)在它能夠根據(jù)行為的效果修改自己的行為規(guī)則,以便更好地在客觀環(huán)境中生存。由這樣的主體組成的系統(tǒng),將在主體之間以及主體與環(huán)境的相互作用中發(fā)展,表現(xiàn)出宏觀系統(tǒng)中的分化、涌現(xiàn)等種種復(fù)雜的演化過(guò)程。ABM建模方法采用“多主體建?!焙汀胺侵行幕枷搿?,借鑒非線性動(dòng)力學(xué)和人工智能領(lǐng)域的技術(shù),從社會(huì)科學(xué)研究的個(gè)體對(duì)象出發(fā),采取自下而上的建模策略,通過(guò)對(duì)主體行為的刻畫實(shí)現(xiàn)自下而上的宏觀涌現(xiàn)。與系統(tǒng)動(dòng)力學(xué)相比,ABM無(wú)法定義系統(tǒng)的整體行為,建模人員對(duì)各層級(jí)主體的行為進(jìn)行單獨(dú)界定,全局狀態(tài)是由個(gè)體與個(gè)體之間、個(gè)體與環(huán)境之間互動(dòng)作用的涌現(xiàn)結(jié)果,實(shí)現(xiàn)了從微觀層次的主體行為到宏觀涌現(xiàn)現(xiàn)象的過(guò)程。
二、社會(huì)科學(xué)量化研究的層次
(一)社會(huì)科學(xué)認(rèn)識(shí)論的連續(xù)統(tǒng)
有文獻(xiàn)在論述早期社會(huì)科學(xué)認(rèn)識(shí)論的連續(xù)統(tǒng)時(shí)認(rèn)為“社會(huì)科學(xué)關(guān)于社會(huì)知識(shí)的獲取途徑一直存在理性主義和經(jīng)驗(yàn)主義之爭(zhēng)”。理性主義的觀點(diǎn)源于柏拉圖,他在形式和理念中尋求確定性,并倡導(dǎo)確定性知識(shí),主張通過(guò)先驗(yàn)推理來(lái)獲得真理知識(shí)。而與柏拉圖不同的是,亞里士多德雖然也強(qiáng)調(diào)確定性,卻把感官所觸及世界作為一種實(shí)在,并且不贊同柏拉圖通過(guò)演繹性論證來(lái)獲得知識(shí)。這種差異影響了文藝復(fù)興時(shí)期科學(xué)的哲學(xué)思想及以后的社會(huì)科學(xué)研究。培根在建立實(shí)驗(yàn)科學(xué)時(shí)批判經(jīng)驗(yàn)哲學(xué),認(rèn)為知識(shí)來(lái)自感性世界,感覺(jué)經(jīng)驗(yàn)是一切知識(shí)的源泉。而笛卡爾則推崇演繹和先驗(yàn)推理,是唯理論者。此后,休謨提倡科學(xué)自然主義(徹底經(jīng)驗(yàn)主義),認(rèn)為世界的復(fù)雜程度遠(yuǎn)超個(gè)人有限的經(jīng)驗(yàn)?zāi)芰?,因此?dǎo)致超越個(gè)人實(shí)踐水平的任何陳述都不確定。波普爾提出證偽主義,認(rèn)為經(jīng)驗(yàn)科學(xué)無(wú)法歸納驗(yàn)證,但演繹可以通過(guò)基本觀測(cè)進(jìn)行反駁,即可以證偽。19世紀(jì),孔德和涂爾干認(rèn)為,社會(huì)科學(xué)應(yīng)拋棄所有形而上的思辨觀念,遵循自然科學(xué)的實(shí)證主義,探尋社會(huì)領(lǐng)域的規(guī)律。馬克斯·韋伯認(rèn)為社會(huì)科學(xué)是社會(huì)行動(dòng)的科學(xué),價(jià)值存在于個(gè)案、經(jīng)驗(yàn)細(xì)節(jié)和歷史知識(shí)當(dāng)中。在經(jīng)濟(jì)學(xué)領(lǐng)域,施穆勒和門格爾的歷史學(xué)派與理論經(jīng)濟(jì)學(xué)的歷史實(shí)踐科學(xué)和理論科學(xué)之爭(zhēng)也體現(xiàn)了這一分歧。
以定律、數(shù)學(xué)為基礎(chǔ)的自然科學(xué)與歷史學(xué)之間的差異也引起了康德和文德?tīng)柊嗟呐d趣??档虏粷M于休謨的懷疑主義,在其《純粹理性批判》中試圖重新樹(shù)立確定性知識(shí)的權(quán)威,他認(rèn)為不是物在影響人,而是人在影響物,人在構(gòu)造現(xiàn)實(shí)世界??档抡J(rèn)為人具有通過(guò)時(shí)空和因果性感知獲得普遍知識(shí)的能力,但人類理性無(wú)法獲得物自體的知識(shí)。他試圖在兩種對(duì)立的立場(chǎng)中尋求整合解決方案。他對(duì)自然科學(xué)知識(shí)和歷史知識(shí)的看法也反映了這一思想,認(rèn)為理性主義方法可以發(fā)現(xiàn)用以解釋現(xiàn)象的必然和普遍有效的法則,但歷史主義則因缺乏科學(xué)知識(shí)客體的必要性和一般有效性而不符合科學(xué)知識(shí)的標(biāo)準(zhǔn)。文德?tīng)柊嗪屠顒P爾特則建立了通則論和個(gè)體論術(shù)語(yǔ)。前者指自然科學(xué)知識(shí),是尋找普遍規(guī)律和制定法則的;后者指歷史知識(shí),是個(gè)體主義的和描述性的。同時(shí),文德?tīng)柊噙€認(rèn)識(shí)到通則論和個(gè)體論的差異并非產(chǎn)生于客體的不同,而是認(rèn)知目的和科學(xué)興趣。至此,根據(jù)韋伯理想類型的概念形成方法,可將社會(huì)科學(xué)的認(rèn)識(shí)論方法以在連續(xù)統(tǒng)中表示如圖2。
圖2 早期社會(huì)科學(xué)認(rèn)識(shí)論方法的連續(xù)統(tǒng)
從這個(gè)角度來(lái)講,以統(tǒng)計(jì)回歸方法為主的實(shí)證主義因果關(guān)系解決方案通過(guò)簡(jiǎn)單因果鏈條解釋和理解社會(huì)效果,并且傾向于從整體上解釋社會(huì),是對(duì)現(xiàn)實(shí)世界趨于通則化的解釋和理解;以系統(tǒng)動(dòng)力學(xué)方法為代表的非線性問(wèn)題線性化解決方案則在對(duì)社會(huì)結(jié)構(gòu)進(jìn)行劃分的基礎(chǔ)上,用函數(shù)關(guān)系組成的反饋回路、流等來(lái)模擬社會(huì)結(jié)果,實(shí)現(xiàn)社會(huì)作用機(jī)理的宏觀模擬;以基于主體建模的仿真方法為代表的第三方案則是通過(guò)封裝主體規(guī)則仿真主體行為,通過(guò)多主體的內(nèi)生互動(dòng),實(shí)現(xiàn)了自下而上的社會(huì)現(xiàn)象的宏觀涌現(xiàn)。這三種社會(huì)系統(tǒng)仿真方法處于社會(huì)科學(xué)研究方法連續(xù)統(tǒng)的內(nèi)部,其立場(chǎng)體現(xiàn)了由通則論向個(gè)體論的過(guò)渡(從整體解釋到結(jié)構(gòu)劃分再到基于主體仿真,從系統(tǒng)的定性或定量分析一般規(guī)律到社會(huì)計(jì)算實(shí)驗(yàn)或?qū)€(gè)體、個(gè)案的觀察),如圖3所示。
圖3 社會(huì)科學(xué)量化研究方案的連續(xù)統(tǒng)
(二)社會(huì)科學(xué)量化研究的層次
在社會(huì)科學(xué)研究領(lǐng)域,按照因變量(Y)和自變量(X)所在的社會(huì)結(jié)構(gòu)層次,可以將社會(huì)科學(xué)量化研究劃分為四層:①自變量和因變量都處于宏觀群體層次,從群體行為到群體結(jié)果的觀察Yd=f(Xa);②自變量和因變量都處于微觀個(gè)體層次,從微觀個(gè)體行為到微觀個(gè)體結(jié)果Yc=f(Xb);③自變量處于宏觀群體層次和因變量處在微觀個(gè)體層次,可以稱之為社會(huì)化過(guò)程Yb=f(Xa);④自變量處于微觀個(gè)體層次,因變量處于宏觀群體層次,可以稱之為涌現(xiàn)過(guò)程Zd=f(Xb,Yc)(陳云松,張亮亮,閔尊濤等,2016)。
這種社會(huì)科學(xué)量化研究的層次劃分實(shí)際上來(lái)源于科爾曼從20世紀(jì)70年代開(kāi)始建立的社會(huì)行動(dòng)理論模型(Coleman,1986)??茽柭纳鐣?huì)行動(dòng)理論模型(見(jiàn)圖4)重點(diǎn)在于解析宏觀現(xiàn)象D的形成過(guò)程,解析的重點(diǎn)是個(gè)體的行為取向B(包括愿望、信念和機(jī)遇等)以及由行為取向引致的個(gè)體行為C,因此要分析宏觀現(xiàn)象A與個(gè)體行為取向B之間的因果鏈條;然后解析個(gè)體的這些行為取向與其他個(gè)體和宏觀環(huán)境之間的作用機(jī)制,即個(gè)體行為C的生成機(jī)制,明晰個(gè)體的行為規(guī)則,這些規(guī)則將表現(xiàn)為基于主體的模型中的主體行為,進(jìn)而涌現(xiàn)出政策結(jié)果D(見(jiàn)圖4箭頭CD)??茽柭纳鐣?huì)行動(dòng)理論模型是宏觀現(xiàn)象A和D間的微觀分析,是對(duì)從宏觀現(xiàn)象到微觀行為再到宏觀現(xiàn)象的“影響—作用—涌現(xiàn)”機(jī)制的解析,在方法論上主張個(gè)人主義,排斥整體主義,是社會(huì)行動(dòng)理論的來(lái)源之一。
圖4 社會(huì)科學(xué)量化研究的層次——基于科爾曼的社會(huì)行動(dòng)理論模型
我們將上面社會(huì)科學(xué)量化研究的四種層次劃分放到科爾曼的社會(huì)行動(dòng)理論模型中,可以看出其與社會(huì)科學(xué)量化研究連續(xù)統(tǒng)的層次劃分是對(duì)應(yīng)的:Yb=f(Xa)和Yc=f(Xb)對(duì)應(yīng)的是追尋宏觀群體或微觀個(gè)人層次規(guī)律性的認(rèn)識(shí),屬于連續(xù)統(tǒng)中靠近通則論的方法,可以使用第一套量化方案,利用統(tǒng)計(jì)回歸即能較好地解決這一問(wèn)題,這也是目前社會(huì)科學(xué)量化研究的主流研究范式(如經(jīng)濟(jì)學(xué)),已有較為成熟的模型;Yd=f(Xa)則需要觀察宏觀群體行為到宏觀群體的結(jié)果,類似于結(jié)構(gòu)與功能的關(guān)系,需要采用系統(tǒng)動(dòng)力學(xué)的方法,但并非在所有社會(huì)科學(xué)領(lǐng)域都是如此,在經(jīng)濟(jì)學(xué)研究中,可以使用統(tǒng)計(jì)回歸等宏觀經(jīng)濟(jì)計(jì)量模型研究該類問(wèn)題;Zd=f(Xb,Yc)實(shí)現(xiàn)的是主體行為取向和主體行為對(duì)宏觀系統(tǒng)的涌現(xiàn)結(jié)果,在社會(huì)科學(xué)中一直屬于量化研究的難點(diǎn), CAS和ABM方法是目前的主要解決方案,此外也可以通過(guò)社會(huì)計(jì)算實(shí)驗(yàn)或平行系統(tǒng)數(shù)據(jù)測(cè)算解決該類問(wèn)題。
三、社會(huì)科學(xué)量化研究存在的問(wèn)題
在目前的三個(gè)社會(huì)科學(xué)量化研究方案中,主要存在的問(wèn)題如下:
(1)生態(tài)謬誤,主要由于社會(huì)科學(xué)量化研究中群體層次的數(shù)據(jù)不能用于推斷個(gè)體行為。這導(dǎo)致了在量化研究,特別是第一量化研究解決方案進(jìn)入操作化階段后,往往開(kāi)展微觀數(shù)據(jù)的調(diào)查,而在宏觀層面的定量分析停止不前,導(dǎo)致了一些重大、經(jīng)典理論問(wèn)題難以得到實(shí)證檢驗(yàn)。這也是對(duì)量化研究科學(xué)主義泛化進(jìn)行批判的主要依據(jù),認(rèn)為一味推崇量化研究而忽視了總體經(jīng)驗(yàn)或者個(gè)人感受的總結(jié),量化研究往往在現(xiàn)有理論的基礎(chǔ)上提出假設(shè),收集數(shù)據(jù)進(jìn)行驗(yàn)證,而無(wú)法對(duì)理論的發(fā)展做出貢獻(xiàn)。同時(shí),對(duì)量化研究的過(guò)度推崇,為追求學(xué)術(shù)的新穎性,而隨意“借用”數(shù)學(xué)或統(tǒng)計(jì)學(xué)模型,對(duì)模型的使用條件不做具體分析,變量之間的關(guān)系也不作判斷,結(jié)果就會(huì)出現(xiàn)經(jīng)過(guò)復(fù)雜的數(shù)據(jù)分析僅僅證明了一個(gè)定性研究的基本常識(shí),或者把兩個(gè)沒(méi)有關(guān)系的變量強(qiáng)制扯上關(guān)系的“拉郎配”現(xiàn)象。導(dǎo)致量化研究與社會(huì)現(xiàn)實(shí)之間常有脫節(jié)。美國(guó)社會(huì)科學(xué)家鄧肯曾批評(píng)這一現(xiàn)象:“我們常常會(huì)看到一種我稱之為‘統(tǒng)計(jì)學(xué)主義’的病癥:即認(rèn)為計(jì)算就是做研究的同義詞,那種認(rèn)為統(tǒng)計(jì)學(xué)是科學(xué)方法論的完整的充分的基礎(chǔ)的天真想法,那種迷信統(tǒng)計(jì)公式可以幫我們?cè)u(píng)估各種不同理論的相對(duì)優(yōu)點(diǎn),或一個(gè)原因的重要性?!备顚哟蔚脑蛟谟?,由于社會(huì)科學(xué)的統(tǒng)計(jì)單元(即作為自適應(yīng)主體的個(gè)人)不具有同質(zhì)性,信息條件的制約也使統(tǒng)計(jì)場(chǎng)景的設(shè)定不能做到窮盡所有重要的不確定性,這就在某種意義上導(dǎo)致社會(huì)科學(xué)“統(tǒng)計(jì)學(xué)主義”基礎(chǔ)的脆弱性。
(2)量化研究第一解決方案中的內(nèi)生性問(wèn)題。由于社會(huì)系統(tǒng)的復(fù)雜性,變量之間的關(guān)系也往往十分復(fù)雜,這反映在變量層次難以劃分,同一層次變量之間相互關(guān)聯(lián),以及從底層到頂層變量的涌現(xiàn),這導(dǎo)致統(tǒng)計(jì)回歸的方法十分不可靠,讓人質(zhì)疑是在用簡(jiǎn)單的數(shù)量關(guān)系來(lái)解決復(fù)雜的社會(huì)問(wèn)題。鄧肯認(rèn)為解決這一問(wèn)題有兩條可能的途徑:一是提高社會(huì)測(cè)量的水平,二是強(qiáng)調(diào)對(duì)社會(huì)過(guò)程的概念化,以及在研究設(shè)計(jì)中體現(xiàn)出這種概念化的社會(huì)過(guò)程。也有學(xué)者認(rèn)為更高級(jí)的計(jì)量模型可以解決這一問(wèn)題。但就目前來(lái)看,并沒(méi)有取得足夠的突破,加上社會(huì)系統(tǒng)描述的模糊性和社會(huì)關(guān)系的測(cè)不準(zhǔn)問(wèn)題,更使得“對(duì)于一些基本上是模糊的量,如果給以任何意味著準(zhǔn)確的數(shù)值的內(nèi)容,那是既無(wú)用處,也是不老實(shí)的,而任何想把精確的公式應(yīng)用于這些不精確定義的量的企圖,都只是胡鬧和浪費(fèi)時(shí)間”。同時(shí),鄧肯所說(shuō)的第一條途徑,如果不改變抽樣調(diào)查方法的話,隨著社會(huì)復(fù)雜程度不斷加深,定量研究的成本也是難以承受的。
(3)后兩個(gè)量化解決方案的問(wèn)題。系統(tǒng)動(dòng)力學(xué)排除了偶然性因素的影響,這種排除過(guò)程是不可控的、前操作化階段的,如果一旦出現(xiàn)排除的偶然性因素是對(duì)系統(tǒng)功能做出重要貢獻(xiàn)的要素(或是隨著時(shí)間的發(fā)展,其作用會(huì)越來(lái)越大或發(fā)生作用性質(zhì)的改變),則仿真的效果就會(huì)出現(xiàn)偏差。這也是羅馬俱樂(lè)部世界三模型引起爭(zhēng)議,與真實(shí)世界產(chǎn)生偏差的原因。20世紀(jì)90年代,羅馬俱樂(lè)部重新調(diào)整了世界模型,并重新發(fā)布報(bào)告《超越增長(zhǎng)的極限》,對(duì)其量化過(guò)程進(jìn)行修正。而基于主體建模的仿真方法則受到個(gè)體行為取向與環(huán)境數(shù)據(jù)短板的影響,這種數(shù)據(jù)短板表現(xiàn)在兩個(gè)方面,一是主體行為數(shù)據(jù)往往來(lái)源于主動(dòng)采集,所以存在回答數(shù)據(jù)與真實(shí)主體行為取向的偏誤;二是仿真環(huán)境數(shù)據(jù)往往來(lái)源于二次統(tǒng)計(jì)加工數(shù)據(jù),無(wú)法保證數(shù)據(jù)質(zhì)量。這兩方面的數(shù)據(jù)短板直接導(dǎo)致封裝在模型中數(shù)據(jù)的有效性問(wèn)題,這也是基于主體建模仿真方法有效性受到詬病的根源所在。
四、大數(shù)據(jù)與社會(huì)科學(xué)量化研究方法
(一)大數(shù)據(jù)的方法論含義
事實(shí)上,以孔德實(shí)證主義和馬克思唯物主義為分界,西方現(xiàn)代哲學(xué)已經(jīng)很少關(guān)心本體等形而上學(xué)問(wèn)題,而是轉(zhuǎn)而專注于對(duì)現(xiàn)象的分析,用胡塞爾及其后繼者的話來(lái)說(shuō),“現(xiàn)象即本質(zhì)”。隨著科學(xué)和技術(shù)的發(fā)展,在科學(xué)哲學(xué)領(lǐng)域,這種觀念得到了壓倒性的發(fā)展和繼承。
但大數(shù)據(jù)時(shí)代社會(huì)科學(xué)研究能否像實(shí)證主義脫離形而上學(xué)那樣再一次擺脫因果關(guān)系的束縛,取決于若干可能性。其一,大數(shù)據(jù)能否讓我們看到社會(huì)物自體的全貌,至少是像馬克斯·韋伯所認(rèn)為的那樣,能夠讓我們完整地看到與研究者的研究目的相對(duì)應(yīng)的社會(huì)物自體的全貌(這一點(diǎn)我們深表懷疑,網(wǎng)絡(luò)大數(shù)據(jù)是否能擔(dān)此重任不僅與大數(shù)據(jù)技術(shù)有關(guān),更重要的是社會(huì)相關(guān)的網(wǎng)絡(luò)大數(shù)據(jù)對(duì)應(yīng)的顯示偏好類型的完整性及其話語(yǔ)體系的可用性)。薩繆爾森處理經(jīng)濟(jì)人行為的方式給我們的啟示是用從網(wǎng)絡(luò)大數(shù)據(jù)中提取社會(huì)人的顯示社會(huì)偏好來(lái)替代社會(huì)行為,這些數(shù)據(jù)的可處理性以及能否完整呈現(xiàn)對(duì)象社會(huì)物自體首先決定了大數(shù)據(jù)能否在社會(huì)科學(xué)領(lǐng)域中超越因果關(guān)系。
其二,因果關(guān)系相當(dāng)于對(duì)象結(jié)構(gòu)判定的一部分,如果我們能夠獲得與研究目的相對(duì)應(yīng)的完整的對(duì)象社會(huì)數(shù)據(jù),我們能否在不使用先驗(yàn)的因果判斷或結(jié)構(gòu)判定的情況下實(shí)現(xiàn)社會(huì)建構(gòu)(仿照先進(jìn)的社會(huì)形態(tài)建構(gòu)我們的社會(huì)形態(tài)嗎?網(wǎng)絡(luò)大數(shù)據(jù)如何能夠提供完整的先進(jìn)的社會(huì)形態(tài),或者說(shuō)未經(jīng)結(jié)構(gòu)分析我們?cè)趺凑J(rèn)識(shí)先進(jìn)的社會(huì)形態(tài),他們真的能夠反映在網(wǎng)絡(luò)大數(shù)據(jù)中嗎?)。
其三,傳統(tǒng)的社會(huì)科學(xué)都離不開(kāi)基于因果關(guān)系的行為解析,這些行為的深度和廣度都差異巨大,網(wǎng)絡(luò)社會(huì)大數(shù)據(jù)能否替代對(duì)現(xiàn)實(shí)社會(huì)人或社會(huì)集團(tuán)行為的深度和廣度的觀察?
其四,技術(shù)上如何解決網(wǎng)絡(luò)大數(shù)據(jù)中社會(huì)數(shù)據(jù)的復(fù)雜性,包括異構(gòu)性、數(shù)據(jù)格式、語(yǔ)義或行為解析、不確定性和涌現(xiàn)等。
盡管實(shí)證哲學(xué)從孔德開(kāi)始與形而上學(xué)和神學(xué)分道揚(yáng)鑣,但后繼者逐漸讓我們看到沿著實(shí)證主義和形而上學(xué)傳統(tǒng)以后的研究、社會(huì)實(shí)踐和人類社會(huì)發(fā)展所遇到的前所未有的環(huán)境問(wèn)題不僅沒(méi)有使我們更加遠(yuǎn)離形而上學(xué),反而讓我們不斷重新認(rèn)識(shí)并更加靠近古典形而上學(xué),特別是在經(jīng)濟(jì)學(xué)、政治學(xué)、社會(huì)學(xué)、法學(xué)等社會(huì)學(xué)科當(dāng)中。在經(jīng)濟(jì)領(lǐng)域,哈耶克、弗里德曼和奧斯特羅姆繼承了經(jīng)濟(jì)學(xué)的古典自由傳統(tǒng),孟德斯鳩以及清教傳統(tǒng)的美國(guó)民主社會(huì)成功證明的政治哲學(xué)和實(shí)證哲學(xué)的法學(xué),20世紀(jì)社會(huì)主義的失敗、前所未有的環(huán)境災(zāi)難以及伊斯蘭運(yùn)動(dòng)對(duì)基督教社會(huì)的挑戰(zhàn),20世紀(jì)和21世紀(jì)天體物理和粒子物理的新發(fā)現(xiàn)所提供的科學(xué)證明和對(duì)不確定性的反證,不斷地提醒我們回到古典形而上學(xué),回到休謨、康德、黑格爾,回到老子以及猶太教的古老教義?,F(xiàn)在看來(lái)迪爾凱姆和馬克斯·韋伯都沒(méi)有錯(cuò),世界和社會(huì)都遵循著一些基本的法則,而世界和社會(huì)也都處于運(yùn)動(dòng)發(fā)展的過(guò)程中。正如奧斯特羅姆所指,我們對(duì)成功實(shí)踐的每一次深入剖析都將我們引向某些自然的決定力量。由此可見(jiàn),大數(shù)據(jù)之前基于結(jié)構(gòu)模型和因果的社會(huì)科學(xué)研究已經(jīng)能夠幫助我們開(kāi)展相當(dāng)深入而廣泛的社會(huì)研究和社會(huì)建構(gòu),大數(shù)據(jù)能夠在多大程度上突破上述若干限制和約束決定了大數(shù)據(jù)能夠在多大程度上影響和顛覆社會(huì)科學(xué)研究的方法論范式。
當(dāng)下,如果拋開(kāi)上述普世的、宏大的社會(huì)科學(xué)研究和社會(huì)建構(gòu)目的,拋開(kāi)數(shù)據(jù)低效和對(duì)數(shù)據(jù)精度及充分性的過(guò)高要求,將社會(huì)建構(gòu)和社會(huì)實(shí)踐的范圍縮小,并且將研究的目標(biāo)放置于社會(huì)建構(gòu)和社會(huì)實(shí)踐中與自然物和工程相似的特定的連續(xù)的過(guò)程表象,而非對(duì)象社會(huì)的完整現(xiàn)象,例如有目的的社會(huì)群體行為的研究和監(jiān)控,輿情的社會(huì)影響等等。網(wǎng)絡(luò)社會(huì)大數(shù)據(jù)已經(jīng)越來(lái)越多越深入地用于改進(jìn)某些社會(huì)公共項(xiàng)目或社會(huì)公共過(guò)程。
我們認(rèn)為以大數(shù)據(jù)為基礎(chǔ)的數(shù)據(jù)科學(xué)的發(fā)展將重構(gòu)社會(huì)科學(xué)研究的方法論基礎(chǔ),對(duì)社會(huì)科學(xué)研究的未來(lái)發(fā)展形成重大影響,并將因此重構(gòu)國(guó)家間社會(huì)科學(xué)研究的競(jìng)爭(zhēng)格局和國(guó)家間社會(huì)建構(gòu)的能力格局。如果我們將大數(shù)據(jù)看作一項(xiàng)工程技術(shù),在某些公共管理事務(wù)和商業(yè)過(guò)程中理解對(duì)象對(duì)于管理和運(yùn)營(yíng)就不是必要的,在類似的實(shí)踐領(lǐng)域中,大數(shù)據(jù)技術(shù)為我們提供了管理和預(yù)測(cè)行為的工具,而不必理解社會(huì)現(xiàn)象背后的因果關(guān)系。
(二)本體論的延展
如果使用胡塞爾現(xiàn)象學(xué)對(duì)本體的概念性定義,現(xiàn)象即世界的本質(zhì),世界本體由無(wú)限延展的現(xiàn)象構(gòu)成,而現(xiàn)象包括我、我思對(duì)象,以及從我到我思對(duì)象的過(guò)程“我思”。世界的本質(zhì)在于現(xiàn)象的無(wú)限延展和運(yùn)動(dòng)變化過(guò)程。無(wú)論是在前方法論階段還是在大數(shù)據(jù)和數(shù)據(jù)科學(xué)所開(kāi)啟的新方法論階段,“我”因?yàn)槎紵o(wú)法經(jīng)由“我思”直接抵達(dá)表象之后全部無(wú)限延展的現(xiàn)象(世界本質(zhì)),就都必須經(jīng)由抽象結(jié)構(gòu)對(duì)世界本質(zhì)進(jìn)行概念性判斷并借由抽象的概念性世界結(jié)構(gòu)進(jìn)行建構(gòu)操作(胡塞爾,1997)。
以科學(xué)和技術(shù)發(fā)展為依托的大數(shù)據(jù)和數(shù)據(jù)科學(xué)其特征在于通過(guò)直接抵達(dá)更多現(xiàn)象,從兩個(gè)方向?qū)崿F(xiàn)對(duì)世界的更廣更深的認(rèn)識(shí),一個(gè)方向是以不斷超越現(xiàn)有的方式直接抵達(dá)世界本質(zhì)的直觀顯現(xiàn),另一個(gè)方向是通過(guò)超大量級(jí)的數(shù)據(jù)反映出來(lái)的超維度現(xiàn)象奇點(diǎn)的相關(guān)性,反推世界直觀背后的復(fù)雜結(jié)構(gòu),幫助人們不斷修正抽象的結(jié)構(gòu)模型,使其更加接近世界的自在本原或不確定本原。
大數(shù)據(jù)和數(shù)據(jù)科學(xué)讓世界的變得更加透明,讓我們更加接近世界的本質(zhì),大數(shù)據(jù)的本質(zhì)依然是數(shù)據(jù),但我思對(duì)象已不再是前方法論下的世界,因此世界不再是原來(lái)的世界。在新方法論的世界中,“我”與“我思對(duì)象”日益融合。在新的本體維度下,世界正在開(kāi)啟難以估量的本質(zhì)多樣性,使我和我思在廣闊的維度上不斷超越本我,重塑本我和我思,重塑我和我思相互交融的世界——對(duì)象社會(huì)。
從上述意義來(lái)說(shuō),大數(shù)據(jù)將在一個(gè)更為基本的層面改變我們的認(rèn)識(shí)能夠抵達(dá)的對(duì)象本體和本體深度,能夠以大密度的數(shù)據(jù)將我們的對(duì)象從大粒度的抽象本體重新表述為更加精細(xì)直觀而又不缺乏整體審視的對(duì)象本體,幫助我們建立了一種能夠同時(shí)從微觀和宏觀兩個(gè)視角同時(shí)觀察對(duì)象本體的能力,是對(duì)從我到我思對(duì)象的雙重加深。
大數(shù)據(jù)不僅作為科學(xué)和社會(huì)科學(xué)研究的基礎(chǔ)性工具,更為重要的是它將傳統(tǒng)認(rèn)識(shí)能夠抵達(dá)的對(duì)象社會(huì)孤立的數(shù)據(jù)流進(jìn)行整合和連通,在科學(xué)家、決策者、專業(yè)工作人員和普羅大眾之間建立集中共享的新的對(duì)象社會(huì)本體和環(huán)境圖式,催生一個(gè)可供計(jì)算的對(duì)象社會(huì)本體(Thacker,Qualters and Lee,2012;Hesse,Moser and Riley,2015),它對(duì)創(chuàng)建一個(gè)一體化、有機(jī)的、速度更快、關(guān)聯(lián)更緊密、響應(yīng)更敏捷的可計(jì)算的社會(huì)體系提出了強(qiáng)烈的要求。
(三)方法論和認(rèn)識(shí)論的轉(zhuǎn)變
大數(shù)據(jù)和數(shù)據(jù)科學(xué)對(duì)社會(huì)科學(xué)研究將會(huì)帶來(lái)深遠(yuǎn)的影響,這種影響深入方法論和認(rèn)識(shí)論層面。首先,社會(huì)科學(xué)研究將從傳統(tǒng)的“先驗(yàn)—經(jīng)驗(yàn)—邏輯—理論—模型—數(shù)據(jù)—算法”單向度、單核心(迪爾凱姆、馬克斯·韋伯、鄧肯)的研究方法論和認(rèn)識(shí)論發(fā)展出新的研究方法論和認(rèn)識(shí)論形態(tài)。大數(shù)據(jù)研究前方法論階段,人們通過(guò)建立結(jié)構(gòu)模型和檢驗(yàn)?zāi)P蛠?lái)達(dá)到對(duì)對(duì)象社會(huì)或群體行為的認(rèn)識(shí),而大數(shù)據(jù)最重要的貢獻(xiàn)就是能夠發(fā)現(xiàn)傳統(tǒng)的人類評(píng)估所不能分析的數(shù)據(jù)集之間的相關(guān)關(guān)系,這些相關(guān)性能夠引導(dǎo)我們分析數(shù)據(jù)集之間、與他人有關(guān)的個(gè)體之間、人類群體之間的關(guān)系,以及信息自身的結(jié)構(gòu)。相關(guān)關(guān)系雖然并不意味著因果,建立在統(tǒng)計(jì)顯著性檢驗(yàn)基礎(chǔ)上的判斷雖然不能告訴我們相關(guān)背后的意義,但它至少為我們對(duì)原因的探索提供了有用的啟示,此時(shí)大數(shù)據(jù)的作用是一個(gè)更加有效的計(jì)算工具,所以我們不必用嚴(yán)格的科學(xué)標(biāo)準(zhǔn)對(duì)其加以衡量(Lin,2015)。大數(shù)據(jù)在社會(huì)科學(xué)研究中的應(yīng)用相當(dāng)于在方法論的籃子里增加一個(gè)新的重要工具,它之所以重要是因?yàn)樗该髁藢W(xué)術(shù)界和產(chǎn)業(yè)界正在上演的一種分析現(xiàn)象,它既是方法論的方法,也是分析的現(xiàn)象(Boyd and Crawford,2012)。
大數(shù)據(jù)分析的相關(guān)結(jié)果還可以用于與傳統(tǒng)的數(shù)據(jù)進(jìn)行對(duì)比,以便對(duì)新發(fā)現(xiàn)給出更好的解釋,以加強(qiáng)對(duì)現(xiàn)有數(shù)據(jù)、理論和方法的解釋,傳統(tǒng)方法論階段的定量研究將因此獲得突破性發(fā)展,使有爭(zhēng)議的重大結(jié)構(gòu)性問(wèn)題和經(jīng)典理論因?yàn)槭褂贸浞趾驼w數(shù)據(jù)得以精細(xì)化再檢驗(yàn)而發(fā)展得更加精密。早在2009年,哈佛大學(xué)的Gary King就預(yù)言,隨著大數(shù)據(jù)的出現(xiàn)和使用,整個(gè)社會(huì)科學(xué)研究的實(shí)證基礎(chǔ)將會(huì)出現(xiàn)重大變化,甚至?xí)铀俣ㄐ耘c定量研究的大融合。計(jì)算社會(huì)科學(xué)的發(fā)展以及整合來(lái)自不同學(xué)科的洞見(jiàn)和方法將成為社會(huì)科學(xué)研究方法論的關(guān)鍵議題。社交網(wǎng)絡(luò)平臺(tái)文本形式的數(shù)據(jù)將成為社會(huì)科學(xué)大數(shù)據(jù)研究的主要數(shù)據(jù)來(lái)源,意味著社會(huì)科學(xué)研究的數(shù)據(jù)獲取的核心方式的變遷。例如,在一些算法的支持下,通過(guò)跟蹤數(shù)據(jù)流和運(yùn)用最新的算法,將源于Facebook、Twitter、Linked In及其他來(lái)源的社交媒體數(shù)據(jù)作為分析對(duì)象,在來(lái)自社交媒體的私人交互數(shù)據(jù)或數(shù)據(jù)源之間建立聯(lián)系能夠有效地增進(jìn)我們對(duì)社會(huì)群體整體、個(gè)體行為及其關(guān)系的認(rèn)知,盡管這會(huì)帶來(lái)有關(guān)“隱私”的倫理問(wèn)題(Bizer,2009)。這些對(duì)象數(shù)據(jù)主要由非結(jié)構(gòu)化和半結(jié)構(gòu)化信息構(gòu)成,對(duì)于傳統(tǒng)的方法來(lái)說(shuō),使用這樣的數(shù)據(jù)開(kāi)展因果關(guān)系的檢驗(yàn)是不可能的。
數(shù)據(jù)科學(xué)將淡化、溝通甚至徹底革除學(xué)科邊界,將局部的還原論下的專業(yè)性社會(huì)建構(gòu)升級(jí)為廣域的社會(huì)整體系統(tǒng)建構(gòu)過(guò)程。大數(shù)據(jù)和數(shù)據(jù)科學(xué)可預(yù)期的社會(huì)價(jià)值仍在于驅(qū)動(dòng)基于結(jié)構(gòu)判斷(或復(fù)雜因果關(guān)系)的經(jīng)濟(jì)社會(huì)決策。人們對(duì)整體性涌現(xiàn)規(guī)律的渴求從來(lái)就沒(méi)有得到過(guò)有效的社會(huì)科學(xué)研究的回應(yīng),雖然基于主體建模仿真方法在解釋復(fù)雜系統(tǒng)理論階段初露端倪,但人們?nèi)匀粺o(wú)法在因果的框架下找到揭示涌現(xiàn)的有效方法。而基于更大范圍大數(shù)據(jù)的跨學(xué)科研究擁有巨大的未來(lái)潛力(其約束在于數(shù)據(jù)的可及性,例如關(guān)于維基百科的編者和使用者的數(shù)據(jù)),但跨學(xué)科研究必須懂得大數(shù)據(jù)資產(chǎn)如何產(chǎn)生、獲得、分享以及用于跨學(xué)科知識(shí)的進(jìn)化。
大數(shù)據(jù)使社會(huì)或政策過(guò)程演進(jìn)實(shí)時(shí)計(jì)算和可視化變得可行,社會(huì)研究和社會(huì)建構(gòu)的時(shí)效性和精確程度將取得前所未有的進(jìn)步,基于大數(shù)據(jù)的社會(huì)計(jì)算能夠有效處理人們?cè)诰W(wǎng)上的交流和互動(dòng)并徹底變革人們對(duì)人類群體行為的理解。社會(huì)計(jì)算致力于研究大數(shù)據(jù)環(huán)境下個(gè)人、組織和社會(huì)的交往方式和相互關(guān)系,及其對(duì)人類社會(huì)不同文化群體和社會(huì)結(jié)構(gòu)所造成的影響。大數(shù)據(jù)驅(qū)動(dòng)的決策導(dǎo)向技術(shù)可以理解為基于計(jì)算和設(shè)計(jì)的高時(shí)效政策工具,這種動(dòng)態(tài)數(shù)據(jù)格式的算法分析能夠以高度個(gè)性化的方式算出目標(biāo)個(gè)體的選擇環(huán)境。大數(shù)據(jù)的數(shù)字導(dǎo)向技術(shù)被證明是個(gè)體所難以抗拒的,因?yàn)樗ㄟ^(guò)微妙的說(shuō)服而不是脅迫得以讓個(gè)體改變其行為方式。當(dāng)然,這同時(shí)帶來(lái)大量倫理問(wèn)題和社會(huì)秩序問(wèn)題。新自由主義意識(shí)形態(tài)強(qiáng)化了大數(shù)據(jù)產(chǎn)業(yè)的快速增長(zhǎng),這些應(yīng)用展示出誘人的魅力,提供無(wú)數(shù)的現(xiàn)代便利設(shè)施,提供定制、高度個(gè)人化的服務(wù),通過(guò)算法旨在快速、動(dòng)態(tài)、高效、盡可能無(wú)縫地對(duì)需求做出反應(yīng)。因此,在大數(shù)據(jù)時(shí)代,數(shù)據(jù)所有權(quán)有可能成為焦點(diǎn)問(wèn)題。各種社會(huì)和經(jīng)濟(jì)行為將以大數(shù)據(jù)的形態(tài)被采集和分析,社會(huì)成員正在變得愈加透明。
應(yīng)用大數(shù)據(jù)研究社會(huì)科學(xué),并不是要拋棄社會(huì)科學(xué)原有的研究方法,相反,社會(huì)科學(xué)的概念、理論和方法不可或缺,而且我們必須清楚,數(shù)據(jù)并不是自然發(fā)生的和無(wú)中介的,大數(shù)據(jù)是社會(huì)技術(shù)性建構(gòu)的結(jié)果,產(chǎn)生于為特定平臺(tái)設(shè)計(jì)的媒介物,這些數(shù)據(jù)的意義并不是自明的,必須通過(guò)使用者的采用、適配和至少來(lái)自社會(huì)科學(xué)的強(qiáng)壯方法論和理論框架彰顯其意義所在。社會(huì)科學(xué)研究的此種進(jìn)化要求研究人員必須在數(shù)據(jù)密集和科學(xué)網(wǎng)絡(luò)化的時(shí)代重返方法論和認(rèn)識(shí)論的基礎(chǔ),必須在方法論和認(rèn)識(shí)論的若干方面達(dá)成一致,包括什么構(gòu)成可靠的和有效的數(shù)據(jù)描述,用于組織數(shù)據(jù)的類型,獲取、處理和結(jié)構(gòu)化數(shù)據(jù)的必要的工具。社會(huì)科學(xué)研究的組織方式已不可避免地需要進(jìn)行重新組織,以滿足社會(huì)科學(xué)研究人員與計(jì)算機(jī)科學(xué)家及工程師之間開(kāi)展合作的需要。另外,大數(shù)據(jù)分析還有一個(gè)自然特征,那就是隨著數(shù)據(jù)體量的快速增加,選取的變量之間會(huì)普遍呈現(xiàn)為統(tǒng)計(jì)顯著,因此,將大數(shù)據(jù)分析與基于結(jié)構(gòu)的量化方法相結(jié)合有其必要性。將大數(shù)據(jù)與小數(shù)據(jù)結(jié)合,與各個(gè)獨(dú)立領(lǐng)域的專業(yè)知識(shí)結(jié)合,就能夠探索出更科學(xué)的大數(shù)據(jù)分析方法。
五、大數(shù)據(jù)對(duì)社會(huì)科學(xué)量化研究影響展望
(一)定性定量研究的融合
定量和定性研究是目前社會(huì)科學(xué)研究中的兩大主流研究路徑。大數(shù)據(jù)研究發(fā)展之前,研究者一般會(huì)選擇其中一種作為社會(huì)科學(xué)研究方法。定量研究就是基于統(tǒng)計(jì)或調(diào)查數(shù)據(jù),運(yùn)用線性回歸或非線性建模(如離散事件建模)等相關(guān)技術(shù)進(jìn)行因果關(guān)系推斷與解釋的研究方法。規(guī)范的社會(huì)科學(xué)定量研究以研究問(wèn)題為基礎(chǔ),基于已有理論做出學(xué)理上的因果假設(shè),即對(duì)已有理論進(jìn)行演繹假設(shè),再通過(guò)選擇樣本及收集數(shù)據(jù),最終對(duì)理論假設(shè)進(jìn)行因果性驗(yàn)證。通常意義上的社會(huì)科學(xué)定量研究是指大樣本研究,而定性研究則多指基于小樣本或個(gè)案的扎根研究和對(duì)素材的深度分析;同時(shí),定量研究的背后分析邏輯是以變量為導(dǎo)向的,即要從大量樣本收集的數(shù)據(jù)中抽象出能夠指代已有理論和理論假設(shè)內(nèi)容的諸多自變量和因變量,繼而用實(shí)證主義的統(tǒng)計(jì)方法來(lái)檢測(cè)自變量和因變量之間可能存在的因果關(guān)系,而統(tǒng)計(jì)分析和檢驗(yàn)流程至今已經(jīng)發(fā)展成為程式化的易于重復(fù)的過(guò)程,且具有統(tǒng)計(jì)意義的科學(xué)性。對(duì)于一般社會(huì)科學(xué)問(wèn)題,為了對(duì)理論假設(shè)的因果關(guān)系的普遍性進(jìn)行檢驗(yàn),就要把研究議題放入大樣本中來(lái)考察,否則無(wú)法保證統(tǒng)計(jì)有效性的要求。盡管定量分析在理想狀態(tài)下對(duì)理論的一般性檢驗(yàn)具有邏輯上的科學(xué)性,但在定量分析的過(guò)程中,從把構(gòu)念概念化為變量,在大樣本中進(jìn)行統(tǒng)計(jì)計(jì)算,到找出變量間的相關(guān)性,進(jìn)而推斷出因果結(jié)論,每個(gè)環(huán)節(jié)都可能出現(xiàn)諸多問(wèn)題,特別是由相關(guān)性做因果性的判斷是容易為人詬病的。而小樣本的定性研究可以彌補(bǔ)大樣本研究的諸多缺陷,尤其是在因果關(guān)系的闡釋與理論的建構(gòu)方面。定性研究者認(rèn)為,案例以及比較分析能夠更為深入地對(duì)現(xiàn)象進(jìn)行描述性解釋,進(jìn)而闡釋或發(fā)現(xiàn)新的理論;更為重要的是,研究者對(duì)僅有的一個(gè)或幾個(gè)案例數(shù)據(jù)能夠更加容易地做到深入細(xì)致的分析,并找到其中真實(shí)的因果關(guān)系機(jī)制,真實(shí)因果關(guān)系機(jī)制的發(fā)現(xiàn)對(duì)新理論的創(chuàng)建和研究構(gòu)念的拓展具有重要意義。這樣,小樣本的定性研究對(duì)于大樣本定量研究中概念過(guò)度延伸、統(tǒng)計(jì)模型中因果機(jī)制展示相對(duì)缺失的問(wèn)題都可以得到一定程度的彌補(bǔ)與克服。
大數(shù)據(jù)研究引入量化社會(huì)科學(xué)研究之后,理論上融合了上述定量和定性研究過(guò)程:對(duì)個(gè)案的大數(shù)據(jù)深度挖掘突破了小樣本定性研究對(duì)個(gè)案獨(dú)特性的理論來(lái)源局限,通過(guò)個(gè)案的大數(shù)據(jù)研究緩解了小樣本個(gè)案定性研究的結(jié)論普適性問(wèn)題;同時(shí),具有“全樣本”意味的大數(shù)據(jù)研究也突破了傳統(tǒng)定量研究中關(guān)于從構(gòu)念框架到因變量自變量設(shè)置的信度和效度的問(wèn)題,因?yàn)榇髷?shù)據(jù)分析是直接面向研究對(duì)象的個(gè)體化數(shù)據(jù)的,不存在變量代理問(wèn)題,而且大數(shù)據(jù)挖掘得出的數(shù)據(jù)相關(guān)性呈現(xiàn)的就是理論的本身表象,在直接面向應(yīng)用的情況下,也不需要用定量分析方法對(duì)理論進(jìn)行假設(shè)檢驗(yàn)。因此,大數(shù)據(jù)研究通過(guò)直接從個(gè)體化數(shù)據(jù)中挖掘有用的相關(guān)性,打破了已有社會(huì)科學(xué)研究定量定性的界限,突破了定性定量研究的樣本量和變量有效性的限制,在一定意義上對(duì)定量和定性研究進(jìn)行了融合。
(二)大數(shù)據(jù)對(duì)已有社會(huì)科學(xué)量化方法的影響
大數(shù)據(jù)研究將為已有社會(huì)科學(xué)量化研究提供精準(zhǔn)的數(shù)據(jù)支撐。大數(shù)據(jù)資源池來(lái)源于對(duì)獨(dú)立研究客體的個(gè)體原始數(shù)據(jù)采集,而且大量數(shù)據(jù)不是像傳統(tǒng)社會(huì)科學(xué)量化研究那樣,針對(duì)理論假設(shè)和研究模型設(shè)計(jì)的變量數(shù)據(jù)需求,經(jīng)由對(duì)研究客體進(jìn)行統(tǒng)計(jì)抽樣并通過(guò)“提問(wèn)—思考—回答”路徑產(chǎn)生的,而是直接由研究客體的行為生成并經(jīng)由各類數(shù)據(jù)采集技術(shù)聚集的,因此大數(shù)據(jù)與傳統(tǒng)社會(huì)科學(xué)量化研究所使用的數(shù)據(jù)相比具有“全樣本”“自提供”的特性,這就能夠避免傳統(tǒng)社會(huì)科學(xué)量化研究中自變量數(shù)據(jù)的統(tǒng)計(jì)偏誤。顯然,大數(shù)據(jù)的這種特性能夠?yàn)橐延猩鐣?huì)科學(xué)量化研究方法提供更精準(zhǔn)的數(shù)據(jù)支撐。
大數(shù)據(jù)研究將為已有社會(huì)科學(xué)量化研究提供全新的視角。由于大數(shù)據(jù)是行為個(gè)體在網(wǎng)絡(luò)環(huán)境中的產(chǎn)物,同時(shí)大量數(shù)據(jù)本身也構(gòu)成了行為個(gè)體社會(huì)網(wǎng)絡(luò)的節(jié)點(diǎn),因此,大數(shù)據(jù)研究本質(zhì)上依托于對(duì)復(fù)雜網(wǎng)絡(luò)的挖掘和分析。憑借網(wǎng)絡(luò)分析和數(shù)據(jù)可視化技術(shù),大數(shù)據(jù)研究能夠發(fā)現(xiàn)已有社會(huì)科學(xué)量化研究所忽視的及受技術(shù)方法制約無(wú)法完成的大量網(wǎng)絡(luò)特征及相關(guān)性,這些網(wǎng)絡(luò)特征及相關(guān)性將為已有社會(huì)科學(xué)理論提供全新的研究視角。
相較既有社會(huì)科學(xué)量化研究,大數(shù)據(jù)研究對(duì)跨學(xué)科合作網(wǎng)絡(luò)有更高的要求。通過(guò)對(duì)大數(shù)據(jù)知識(shí)源的研究,社會(huì)科學(xué)與自然科學(xué)在大數(shù)據(jù)研究過(guò)程中實(shí)現(xiàn)了大學(xué)科交叉。對(duì)領(lǐng)域大數(shù)據(jù)的挖掘和分析,不僅需要本領(lǐng)域?qū)W者就領(lǐng)域內(nèi)現(xiàn)有理論及分析框架進(jìn)行問(wèn)題導(dǎo)入和研究需求設(shè)置,還需要與計(jì)算機(jī)、心理學(xué)等不同專業(yè)領(lǐng)域?qū)W者組成合作研究網(wǎng)絡(luò),對(duì)領(lǐng)域大數(shù)據(jù)進(jìn)行跨學(xué)科聯(lián)合研究。
(三)大數(shù)據(jù)研究對(duì)數(shù)據(jù)可及性的要求
隨著對(duì)大數(shù)據(jù)研究?jī)r(jià)值及知識(shí)外溢效應(yīng)的重視,國(guó)家層面的旨在提高大數(shù)據(jù)可及性的行動(dòng)越來(lái)越受到重視。2009年1月,美國(guó)總統(tǒng)奧巴馬簽署了《開(kāi)放和透明政府備忘錄》,提出要?jiǎng)?chuàng)建透明、參與和協(xié)作的開(kāi)放政府,并要求提高政府開(kāi)放程度,聯(lián)邦政府所擁有的信息要向公眾快速公開(kāi)。同年12月,美國(guó)行政管理和預(yù)算管理局發(fā)布了《開(kāi)放政府指令》,指示聯(lián)邦各機(jī)構(gòu)為美國(guó)公眾提供政府?dāng)?shù)據(jù),標(biāo)志著美國(guó)開(kāi)放政府?dāng)?shù)據(jù)走向政策層面。與此同時(shí),全球許多國(guó)家也紛紛發(fā)起了開(kāi)放政府?dāng)?shù)據(jù)行動(dòng),通過(guò)頒布政策促進(jìn)政府?dāng)?shù)據(jù)的開(kāi)放。2015年8月19日,中國(guó)國(guó)務(wù)院常務(wù)會(huì)議通過(guò)《關(guān)于促進(jìn)大數(shù)據(jù)發(fā)展的行動(dòng)綱要》,明確提出,“加快法規(guī)制度建設(shè)。修訂政府信息公開(kāi)條例。積極研究數(shù)據(jù)開(kāi)放、保護(hù)等方面制度,實(shí)現(xiàn)對(duì)數(shù)據(jù)資源采集、傳輸、存儲(chǔ)、利用、開(kāi)放的規(guī)范管理,促進(jìn)政府?dāng)?shù)據(jù)在風(fēng)險(xiǎn)可控原則下最大程度開(kāi)放”“2018年底前建成國(guó)家政府?dāng)?shù)據(jù)統(tǒng)一開(kāi)放平臺(tái)”。這是我國(guó)第一個(gè)關(guān)于開(kāi)放政府?dāng)?shù)據(jù)的宏觀政策,這標(biāo)志著我國(guó)的開(kāi)放政府?dāng)?shù)據(jù)也正式走向政策層面。
我們之所以希望我國(guó)政府部門在促進(jìn)優(yōu)化大數(shù)據(jù)可及性的進(jìn)程中起主導(dǎo)作用,是因?yàn)槲覈?guó)政府與其他國(guó)家政府相比,對(duì)大數(shù)據(jù)采集者和擁有者如互聯(lián)網(wǎng)企業(yè)、通信運(yùn)營(yíng)商等有較強(qiáng)的數(shù)據(jù)請(qǐng)求權(quán),更有能力將這些散布于不同大數(shù)據(jù)擁有者手中的不同類型、不同領(lǐng)域的大數(shù)據(jù)有機(jī)集成起來(lái),將這些大數(shù)據(jù)作為社會(huì)科學(xué)研究和知識(shí)進(jìn)步的必要資源,有計(jì)劃、分層次地構(gòu)建有中國(guó)特色的大數(shù)據(jù)開(kāi)放服務(wù)產(chǎn)業(yè)。
相信在《行動(dòng)綱要》頒布之后,我國(guó)政府應(yīng)“有計(jì)劃”地主導(dǎo)“大數(shù)據(jù)知識(shí)源集成網(wǎng)絡(luò)”的構(gòu)建,全面集成互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和社交網(wǎng)絡(luò)等不同生產(chǎn)方式的知識(shí)源,同時(shí)整合政府部門及事業(yè)單位的統(tǒng)計(jì)數(shù)據(jù)、社會(huì)民眾的輿論以及企業(yè)的產(chǎn)銷大數(shù)據(jù),為不同用戶“分層次”地提供數(shù)據(jù)支持服務(wù),如可按數(shù)據(jù)需求的合法性及迫切性,分層次地對(duì)刑偵、公共決策、學(xué)術(shù)研究、商貿(mào)應(yīng)用等不同需求主體提供大數(shù)據(jù)開(kāi)放服務(wù)。
參考文獻(xiàn)
Bizer,C,T Heath,and TBerners-Lee.2009.Linked Data—The Story So Far.International Journal on Semantic Web and Information Systems (IJSWIS).
Boyd,Danah and Kate Crawford.2012.Critical Questionsfor Big Data:Provocations for a Cultural,Technological,and Scholarly Phenomenon. In formation,Communication&Society15(5):662-679.
Coleman, J S 1986.Social Theory,Social Research,and a Theory of Action.American Journal of Sociology91(6):1309-1335.
Hesse,B W,R PMoser,W T Riley.2015.From Big Data to Knowledge in the Social Sciences.The ANNALS of the American Academy of Political and Social Science659(1):16-32.
King,G.2014.Restructuring the Social Sciences:Reflections from Harvard's Institute for Quantitative Social Science.Political Science&Politics47(1):165-172.
Lin,J.2015.On Building Better Mousetraps and Understanding the Human Condition:Reflections on Big Data in the Social Sciences.The ANNALS of the American Academy of Political and Social Science659(1):33-47.
Meadows,Donella H and J Rander.1972.The Limits to Growth:A Report for Club of Rome's Project on the Predicament of Mankind.New York:Universe Books.
Thacker,S B,and J R Qualters,L M Lee.2012.Public Health Surveillance in the United States:Evolution and Challenges.Morbidity and Mortality Weekly Report(MMWR)61(03):3-9.
Tony,H,T Stewart,and T Kristin.2009.The Fourth Paradigm:Data-intensive Scientific Discovery.The Science Press.
貝爾納.科學(xué)的社會(huì)功能[M].桂林:廣西師范大學(xué)出版社,2003.
陳云松,張亮亮,閔尊濤,等.大數(shù)據(jù)機(jī)遇與宏觀定量社會(huì)學(xué)的重啟[J].貴州師范大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2016(6):35-39.
中共中央馬克思恩格斯列寧斯大林著作編譯局.恩格斯.馬克思恩格斯選集:第三卷[M].北京:人民出版社,1972.
郭大水.社會(huì)學(xué)的三種經(jīng)典研究模式概論[M].天津:天津人民出版社,2007.胡塞爾.純粹現(xiàn)象學(xué)通論[M].李幼篜,譯.北京:商務(wù)印書館,1997:160.
克魯格曼.發(fā)展、地理學(xué)與經(jīng)濟(jì)理論[M].北京:北京大學(xué)出版社,2000.
拉法格.憶馬克思[M].北京:學(xué)術(shù)出版社,1941.
劉放桐.新編現(xiàn)代西方哲學(xué)[M].北京:人民出版社,2000.
劉林平,蔣和超,李瀟曉.規(guī)律與因果:大數(shù)據(jù)對(duì)社會(huì)科學(xué)研究沖擊之反思——以社會(huì)學(xué)為例[J].社會(huì)科學(xué),2016(9):67-80.
李旭.社會(huì)系統(tǒng)動(dòng)力學(xué):政策研究的原理、方法和應(yīng)用[M].上海:上海財(cái)經(jīng)大學(xué)出版社,2009.
錢學(xué)森.一個(gè)科學(xué)新領(lǐng)域——開(kāi)放的復(fù)雜巨系統(tǒng)及其方法論[J].城市發(fā)展研究,2005,12(5):1-8.
陶遠(yuǎn)華.理智的困惑:社會(huì)科學(xué)認(rèn)識(shí)論[M].北京:東方出版社,1989.
沃野.關(guān)于社會(huì)科學(xué)定量、定性研究的三個(gè)相關(guān)問(wèn)題[J].學(xué)術(shù)研究,2005(4):41-47.
吳曉剛.定量研究方法與現(xiàn)代社會(huì)科學(xué)[J].社會(huì)科學(xué)家茶座,2014(1):31-33.
約翰·奇曼.知識(shí)的力量:科學(xué)的社會(huì)范疇[M].上海:上??茖W(xué)技術(shù)出版社,1985.
張波,袁永根.系統(tǒng)思考和系統(tǒng)動(dòng)力學(xué)的理論與實(shí)踐[M].北京:中國(guó)環(huán)境科學(xué)出版社,2010.
Big Data and Quantitative Social Science Research
Mi Jianing,Li Dayu,Zhang Changping,Lin Tao
Abstract: Quantitative research of social science has experienced three main Solutions. They are positivist causal solution, linearization of nonlinear problems and agent based modeling of complex systems. These three solutions together with big data research are in the continuum of epistemological approaches from nomothetic to ideographic. However, there are statistical errors, endogenous problems, accidental factors and data defects in these three social science quantitative solutions. Big data research will reconstruct the methodological basis of social science research, significantly impact on the future development of social science research, and will particularly integrate qualitative and quantitative research. Big data research will provide accurate data support and new perspectives for the existing quantitative research. The development of big data research needs to solve the problem of data accessibility, which is necessary for the government to build a large data open service industry with Chinese characteristics in a planned and hierarchical way.
Key words:big data;social science;quantitative research;research method
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請(qǐng)告知,我們將盡快刪除相關(guān)內(nèi)容。