流感病毒神經(jīng)氨酸酶抑制劑的研究
本節(jié)將要介紹兩個(gè)實(shí)例,分別是針對(duì)流感病毒神經(jīng)氨酸酶NA的已知藥物的改造以及新藥的篩選與設(shè)計(jì),系統(tǒng)地闡述CADD在新藥開(kāi)發(fā)中的應(yīng)用。
10.3.1 神經(jīng)氨酸酶簡(jiǎn)介
引起禽流感(AI)的病原為禽流感病毒(avian influenza virus),是負(fù)鏈RNA病毒,該病毒屬正粘病毒科流感病毒屬,對(duì)呼吸道系統(tǒng)都有致病性等,特別是這兩種病毒對(duì)黏多糖和糖蛋白具有特殊的親和力,尤其是對(duì)細(xì)胞表面的含唾液酸的受體具有更強(qiáng)的親和力。神經(jīng)氨酸酶NA是AIV的一個(gè)重要的表面抗原,由RNA片段6編碼。NA由4個(gè)亞單位構(gòu)成,即2個(gè)相同的糖蛋白的聚體以二硫鍵相連成聚合物,其具有唾液酸酶活性,并在病毒出膜時(shí)起到釋放位于被感染區(qū)細(xì)胞表面的子代病毒作用。該功能不僅可以避免釋放過(guò)程中病毒的聚集,而且還有可能有助于病毒穿透上皮組織的黏液層以完成對(duì)細(xì)胞的吸附。神經(jīng)氨酸酶的這個(gè)特性也使其成為抗病毒藥物的靶標(biāo),病毒的HA和NA之間有拮抗效應(yīng),兩者相互協(xié)調(diào)地發(fā)揮作用是病毒有效吸附和釋放的關(guān)鍵。
HA和NA均是易發(fā)生變異的2種免疫抗原。目前,根據(jù)它們的變異,將HA分為H1~H15共15個(gè)亞型,NA分為N1~N9共9個(gè)不同的亞型,當(dāng)前,人類流感疾病在歷史上主要由3種HA亞型(H1、H2、H3)和2種NA亞型(N1、N2)引起。但是最近人類感染的流感病毒又增添了新的HA亞型,包括H5、H7和H9。由H5N1禽流感病毒人感染病例,致死率超過(guò)50%,針對(duì)H5N1病毒的研究也最為廣泛。
10.3.2 基于神經(jīng)氨酸酶N1晶體結(jié)構(gòu)對(duì)奧司米韋的修飾
10.3.2.1 奧司米韋的發(fā)展史
奧司米韋(Oseltamivir)是一種作用于神經(jīng)氨酸酶的特異性抑制劑,通過(guò)抑制神經(jīng)氨酸酶的作用,可以抑制成熟的流感病毒脫離宿主細(xì)胞,從而抑制流感病毒在人體內(nèi)的傳播以起到治療流行性感冒的目的。Oseltamivir是基于結(jié)構(gòu)的合理藥物設(shè)計(jì)的成功案例,在這種藥物的研發(fā)過(guò)程中大量應(yīng)用了CADD的手段,根據(jù)受體靶酶的三維結(jié)構(gòu)有針對(duì)性地設(shè)計(jì)了高效低毒專一性強(qiáng)的神經(jīng)氨酸酶抑制劑。
奧司米韋是利用天然底物唾液酸類似物與流感病毒神經(jīng)氨酸酶活性位點(diǎn)相結(jié)合的結(jié)晶X衍射結(jié)構(gòu),進(jìn)行合理化藥物設(shè)計(jì)而發(fā)現(xiàn)的。奧司米韋是通過(guò)對(duì)唾液酸類似物骨架進(jìn)行修飾(包括加了親脂側(cè)鏈)發(fā)展而來(lái)的,這種修飾主要是為了使藥物可用于口服。隨著抗Oseltamivir病毒株的出現(xiàn),而Zanamivir依然對(duì)這些抗藥性病毒株保持著敏感性,所以對(duì)Oseltamivir的研究并沒(méi)有結(jié)束。
圖10-26為唾液酸、DANA、Oseltamivir、Zanamivr以及對(duì)Oseltamivir進(jìn)行修飾用到的骨架分子的結(jié)構(gòu),從中可以看出這些分子的聯(lián)系與不同:Oseltamivir與Zanamivir的最大不同就是4位和6位的基團(tuán),兩個(gè)分子6位基團(tuán)一個(gè)是疏水性強(qiáng)的戊烷基,一個(gè)是親水性強(qiáng)的甘油基,而對(duì)Oseltamivir的修飾策略也正是希望找到一個(gè)疏水和親水性比較適中的基團(tuán)去適應(yīng)N1口袋疏水環(huán)境的變化。
圖10-26 唾液酸、DANA、Oseltamivir、Zanamivr以及對(duì)Oseltamivir進(jìn)行修飾用到的分子骨架結(jié)構(gòu)
10.3.2.2 H5N1-NA晶體結(jié)構(gòu)分析
神經(jīng)氨酸酶NA作為抗禽流感病毒的靶點(diǎn)一直是藥物設(shè)計(jì)關(guān)注的焦點(diǎn), H5N1-NA神經(jīng)氨酸酶晶體:2HTY(PDB bank code)的解析成功成為抗禽流感道路上的又一重大事件,其為合理的新藥物設(shè)計(jì)提供了N1靶點(diǎn)的三維結(jié)構(gòu)信息以及成功的機(jī)會(huì),因?yàn)楝F(xiàn)有的NA藥物都是基于N9、N2和B型流感病毒的NA設(shè)計(jì)的。
根據(jù)免疫原神經(jīng)氨酸酶NA表達(dá)不同,NA分為N1~N9共9個(gè)亞型,分成兩組,組1包括N1、N4、N5和N8;組2包括N2、N3、N6、N7和N9。Russell等人的研究表明組1中的神經(jīng)氨酸酶N1(2HTY)結(jié)構(gòu)與組2中的N9(1F8B)有很大的不同。主要的區(qū)別在于活性口袋位置由氨基酸殘基147~152構(gòu)成的所謂“150-Loop”區(qū)域。為了突出這個(gè)位置特點(diǎn),將N1:2HTY和N9:1F8B這兩個(gè)不同組的同源蛋白的序列進(jìn)行比對(duì)(見(jiàn)圖10-27),三維結(jié)構(gòu)進(jìn)行了骨架疊合(見(jiàn)圖10-28)。
圖10-27 神經(jīng)氨酸酶N9(Chain-1)與N1(Chain-2)序列比對(duì)(彩圖見(jiàn)第410頁(yè))
圖10-28 (a)神經(jīng)氨酸酶N9(2HTY)與N1(1F8B)三維骨架疊合圖;(b)奧司米韋(Os-eltamivir)在神經(jīng)氨酸酶N9中靠近150-loop附近的活性口袋中的微觀示意圖;(c)奧司米韋在神經(jīng)氨酸酶N1中的微觀示意圖(彩圖見(jiàn)第410頁(yè))
從圖10-27可看出,N1晶體的150-Loop由氨基酸殘基片段“GTVKDR”組成, N9相應(yīng)位置由“GTIHDR”組成。在圖10-28中看到由于這一段氨基酸殘基片段的變化,N1的晶體構(gòu)象出現(xiàn)了沒(méi)有預(yù)見(jiàn)到的情形,在臨近保守性活性口袋的邊緣這一段變化的片段向外打開(kāi),N1中的150-Loop中的氨基酸Val-149的Cα與N9中相應(yīng)位置的Ile-149的Cα有7?的距離,Asp151的羧酸基也指向口袋外,因此N1的口袋相對(duì)于N9的就成為一個(gè)敞開(kāi)式構(gòu)象(open-up conformation)[見(jiàn)圖10-28(b)、圖10-28(c)]。除此之外,N1中的保守性的功能性氨基酸殘基Glu-119的側(cè)鏈也與N9的取向不同。由于150-Loop的存在,N1中的酸性氨基酸殘基Val-149和Asp151遠(yuǎn)離了Oseltamivir上4位的氨基(—NH2),在配體與受體其他活性位點(diǎn)相互作用相同的情況下,口袋150-Loop位置氨基酸殘基構(gòu)象的變化使得分子間的結(jié)合能力降低了。
Oseltamivir與N1晶體2HTY結(jié)合時(shí)一般可分兩步,第一步是抑制劑與敞開(kāi)式構(gòu)象(open-up conformation)結(jié)合,然后口袋構(gòu)象慢慢變化成為類似N9的關(guān)閉式構(gòu)象(closed conformation)導(dǎo)致抑制劑與受體的結(jié)合力得到加強(qiáng)??傮w來(lái)講,在2HTY晶體結(jié)構(gòu)中150-Loop的存在使得這種敞開(kāi)式(open-upconformation)構(gòu)象的能量低于關(guān)閉式(closed conformation)構(gòu)象,所以一個(gè)低能量的敞開(kāi)式構(gòu)象更容易和抑制劑結(jié)合,其具有能量上的優(yōu)勢(shì)。研究同時(shí)也表明,Oseltamivir和Zanami-vir都有和2HTY敞開(kāi)式構(gòu)象結(jié)合的能力。所以對(duì)Oseltamivir的修飾希望能得到一個(gè)新的抑制劑讓它更好地、選擇性地與N1結(jié)合,尤其是在局部與150-Loop結(jié)構(gòu)得到很好的匹配。
10.3.2.3 Oselatmivir的修飾
基于以上對(duì)2HTY晶體結(jié)構(gòu)的分析,對(duì)Oseltamivir的修飾列出了其中53個(gè)典型的分子結(jié)構(gòu)(見(jiàn)表10-12)。為了提高Oseltamivir C4—NH2的結(jié)合能力, C4—NH2分別變?yōu)镹HC( NH═ +2 )和NHC( N—CH═ +4 )NH2;C8—戊烷基團(tuán)改成部分疏水、部分親水的基團(tuán),以便于這個(gè)基團(tuán)能適應(yīng)疏水環(huán)境的變化,修飾后的基團(tuán)又與Zanamivir對(duì)應(yīng)部分不同??紤]到Oseltamvir的羧酸基團(tuán)與受體的三個(gè)精氨酸很好的結(jié)合能力,以及—NHCOCH3與由Trp178和Arg224形成的疏水位置的匹配,所以對(duì)Oseltamivir的這兩個(gè)位置的基團(tuán)未作改動(dòng)。另外,由于C6—O—C8的柔性,C8的手性也未考慮改動(dòng),根據(jù)這個(gè)分子修飾的原則,表10-12中列出了修飾后的54個(gè)Oseltamivir的類似物分子,包括Oseltamivr本身在內(nèi)。
表10-12 Ose Itamivir的相似化合物
(續(xù)表)
(續(xù)表)
(續(xù)表)
10.3.2.4 分子對(duì)接結(jié)果及討論
為了研究分子中R和X取代基對(duì)分子間相互作用力的貢獻(xiàn)問(wèn)題,所有的分子與受體2HTY采用分子對(duì)接軟件Dock6.1版本進(jìn)行對(duì)接計(jì)算。新版本的Dock6.1對(duì)接計(jì)算對(duì)構(gòu)象的評(píng)估打分采用兩步進(jìn)行。
第一步采用分子格點(diǎn)打分(Grid Score),即結(jié)合能由范德華作用能與靜電作用能加和確定。即Ebinding=Evd W+Ees。
第二步采用Amber Score來(lái)給第一步Grid Score篩選的最好構(gòu)象再次進(jìn)行打分。在AMBERScore中加入了GB/SA(generalizedborn/surfacearea)模型考慮了溶劑化效應(yīng),而且在這一步,受體不再是剛性的,活性口袋的氨基酸和配體都是柔性的,允許配體周?chē)陌被釟埢嵝?,在?duì)接計(jì)算過(guò)程中就產(chǎn)生了所謂“誘導(dǎo)契合”(inducedfit)的效果。
Amber Score由Ebinding=Ecomplex-(Ereceptor+Eligand)定義,其中Ecomplex代表復(fù)合物的能量,Ereceptor、Eligand分別代表受體和配體的能量。配體與受體的結(jié)合自由能E由下式得到:
E=EMM+(Ep-sol+Enp-sol)
EMM=Evd W+Ees+Eint——依據(jù)AMBER力場(chǎng)得到的勢(shì)能函數(shù)
Ep-sol——溶劑化自由能的極性部分
Enp-sol——溶劑化自由能的非極性部分
其中EMM為結(jié)合自由能的勢(shì)能部分。計(jì)算中可以增加或減小能量最小化(minimi-zation)和分子動(dòng)力學(xué)(MD)模擬步長(zhǎng)(steps)的大小,由于計(jì)算時(shí)間的問(wèn)題并不是步階越大越好。對(duì)不同的蛋白測(cè)試表明,能量最小化和分子動(dòng)力學(xué)的步階分別取100和3000計(jì)算得到的結(jié)果最好。
對(duì)于每一個(gè)分子的對(duì)接結(jié)果,在前100個(gè)構(gòu)象里挑選出幾何構(gòu)型最佳匹配的那一個(gè),然后將這54個(gè)分子按照取代基的不同分成a、b、c三個(gè)系列,每個(gè)系列的18個(gè)分子構(gòu)象疊合在一起,如表10-13所示。a系列是0a~17a,X取代基是—NH+3的疊合;b系列是X取代基,是—NHC( NH+═ 2 )的疊合;c系列是X取代基,是—NHC( N—CH+═ 4)NH2的疊合。修飾后的R基團(tuán),由于部分疏水和部分親水的特點(diǎn),與受體2HTY活性口袋內(nèi)的疏水環(huán)境得到很好的匹配。修飾后的配體能否具有與受體更好的結(jié)合能力,從表10-13的具體數(shù)據(jù)便能說(shuō)明問(wèn)題,在結(jié)果中可以發(fā)現(xiàn)以下幾個(gè)特征:
(1)X基團(tuán)相同時(shí),每個(gè)系列的配體從0a~17a的分子格點(diǎn)打分有數(shù)值減小的趨勢(shì),即結(jié)合能力趨強(qiáng),這就說(shuō)明分子的修飾達(dá)到了預(yù)期的效果。
(2)R基團(tuán)相同時(shí),分子格點(diǎn)打分有a系列<b系列<c系列的規(guī)律,c系列化合物X基團(tuán)上的甲基(—CH3)由表可以看出,甲基深入到一個(gè)疏水孔洞里,所以延長(zhǎng)C4-NH2的空間可能會(huì)加強(qiáng)分子間的親和力。但是也發(fā)現(xiàn),無(wú)論是-NHC ( NH+═ 2)還是-NHC( N-CH═ +4)NH2,都無(wú)法越過(guò)由Asp151氨基酸殘基形成的“障礙”(見(jiàn)圖10-28)。因此,更好的辦法是設(shè)計(jì)一個(gè)新的分子片段匹配150-Loop口袋,然后將這個(gè)片段與C4-NH2鍵和成為一個(gè)分子,這樣極有可能會(huì)產(chǎn)生一個(gè)神經(jīng)氨酸酶抑制劑新系列。
表10-13 化合物0c~17c、0b~17b和0c~17c與神經(jīng)氨酸酶N9(2HTY)之間的結(jié)合自由能
(3)對(duì)于一個(gè)分子格點(diǎn)得分很低的配體來(lái)講,它的Amber力場(chǎng)打分卻不一定也低,如c系列分子的Amber力場(chǎng)打分就多數(shù)沒(méi)有b系列的低,除了1c、2c和8c三個(gè)例外,這三個(gè)分子有一個(gè)共同點(diǎn)就是它們都比其他的分子少一個(gè)C原子,所以造成這個(gè)結(jié)果的原因可能是分子的體積問(wèn)題。體積太大時(shí)可能去溶劑化比較困難,當(dāng)體積合適時(shí)效果才好。因此,從兩種打分情況看,b系列的化合物去溶劑化的效果要好。
按照分子格點(diǎn)打分+Amber力場(chǎng)打分值最大原則,以O(shè)seltamivir得分為參考,在每個(gè)系列化合物中挑選出幾個(gè)最有希望成為藥物候選物的分子,在表10-13中以粗體顯示,也許這種選擇有不妥之處,因?yàn)槿魏我环N藥物候選物分子都要用隨后的生物活性實(shí)驗(yàn)、生物利用度、藥物溶解度、毒性測(cè)試等一系列實(shí)驗(yàn)來(lái)驗(yàn)證理論設(shè)計(jì)的分子是否能成功。
10.3.2.5 結(jié)論
通過(guò)對(duì)Oseltamivr分子的局部修飾,從結(jié)果上看出,修飾得到了預(yù)期的效果,絕大多數(shù)修飾后的分子與受體對(duì)接的結(jié)果都要好于Oseltamivir,所以基于受體的結(jié)構(gòu)信息,有針對(duì)性地改造配體的部分片段,使得分子的藥效團(tuán)與受體口袋相應(yīng)位點(diǎn)達(dá)到很好的匹配,這種直接藥物設(shè)計(jì)的方法現(xiàn)在看來(lái)是非常有效也很流行的。
10.3.3 3D-QSAR在H5N1抑制劑模型中的應(yīng)用
本節(jié)將根據(jù)上市效果最好的兩種神經(jīng)氨酸酶抑制劑扎那米韋(Zanamivir)和奧司米韋(Oseltamivir),來(lái)進(jìn)行神經(jīng)氨酸酶抑制劑的改造、篩選和設(shè)計(jì),以獲取高效、毒副作用小的新型流感病毒抑制劑。
定量構(gòu)效關(guān)系(quantitative structure-activity relationship,QSAR)分析是搜尋新的潛在藥物分子的一種通用的手段。在設(shè)計(jì)和改進(jìn)神經(jīng)氨酸酶抑制劑方面起著重要的作用。本小節(jié)分別運(yùn)用偏最小二乘法(PLS),比較分子力場(chǎng)分析(Co MFA)法和分子相似性指數(shù)分析法(Co MSIA)對(duì)環(huán)己烯類衍生物類似神經(jīng)氨酸酶抑制劑的活性進(jìn)行了分組和整體兩種三維定量構(gòu)效關(guān)系(3D-QSAR)研究,分別建立了各自合理的預(yù)測(cè)模型,兩個(gè)模型均可以有效地指導(dǎo)先導(dǎo)化合物結(jié)構(gòu)改造和新的神經(jīng)氨酸酶抑制劑設(shè)計(jì),并通過(guò)3D-QSAR給出的等勢(shì)面圖加以分析,方便、直觀地指導(dǎo)新型藥物的改造工作。
10.3.3.1 數(shù)據(jù)來(lái)源
通過(guò)查找文獻(xiàn)從中挑選的126個(gè)類似神經(jīng)氨酸酶抑制劑化合物(neuramini-daseinhibitors,NIs),并經(jīng)過(guò)Auto Dock軟件對(duì)接后獲得結(jié)合自由能最低的構(gòu)象作為研究對(duì)象。這些類似NIs化合物的結(jié)構(gòu)差異較大,為提高模型的預(yù)測(cè)性,在具體QSAR模型建構(gòu)及數(shù)據(jù)分析時(shí)按共同骨架的異同將126種化合物分成了6類,各類中按比例挑選一部分分子作為本組訓(xùn)練集來(lái)構(gòu)建COMFA和COMSIA模型,本組其余部分小分子做預(yù)測(cè)集用以對(duì)本組所建模型進(jìn)行驗(yàn)證。它們的抑制活性指標(biāo)用半數(shù)抑制濃度IC50的負(fù)對(duì)數(shù)-lg IC50即p IC50進(jìn)行量度,數(shù)據(jù)依然是從文獻(xiàn)中獲得。
10.3.3.2 參數(shù)的選擇及模型的擬合方法
在QSAR模型建構(gòu)中,參數(shù)選擇過(guò)多可能會(huì)造成共線性或過(guò)擬合的不良影響,模型的預(yù)測(cè)能力也會(huì)減弱。選擇數(shù)量適當(dāng)?shù)膮?shù),有助于建立預(yù)測(cè)能力強(qiáng)、穩(wěn)定的模型。一般來(lái)說(shuō),若樣本容量為N,變量數(shù)為M,變量的選擇應(yīng)遵循N/M≥5經(jīng)驗(yàn)規(guī)則。本節(jié)實(shí)驗(yàn)樣本數(shù)一共為126個(gè),分為六組,各組變量依據(jù)經(jīng)驗(yàn)原則數(shù)量不等。QSAR模型評(píng)價(jià)的統(tǒng)計(jì)學(xué)指標(biāo)有:交叉驗(yàn)證系數(shù)Q2,相關(guān)系數(shù)R2,F(xiàn)isher檢驗(yàn)值(統(tǒng)計(jì)方差)F和均方根偏差S。R2和F值越大,S值越小,模型的擬合能力就越強(qiáng)。其中R2和S由系統(tǒng)自動(dòng)產(chǎn)生,F(xiàn)值由式(10-1)計(jì)算。
式中:n為樣本個(gè)數(shù);r2為相關(guān)系數(shù);k為描述值個(gè)數(shù)。
10.3.3.3 模型的預(yù)測(cè)能力評(píng)價(jià)
10.3.3.4 Co MFA和Co MSIA的原理
比較分子力場(chǎng)分析(Co MFA)是3D-QSAR常用的研究方法。它通過(guò)計(jì)算,定量地將分子的生物活性與其周?chē)牧?chǎng)(如靜電力、范德華作用力等)聯(lián)系起來(lái),應(yīng)用數(shù)學(xué)方法建立化合物的生物活性與周?chē)髁?chǎng)之間的空間分布關(guān)系的模型,為分子結(jié)構(gòu)的修飾改造提供信息。其基本假設(shè)是:①在分子水平上,影響生物活性的因素主要是非共價(jià)性相互作用;②分子力場(chǎng)則側(cè)重于處理立體場(chǎng)和靜電場(chǎng)的非共價(jià)相互作用,可以很好地解釋分子的各種理化參數(shù)性質(zhì)。因此計(jì)算分子中原子的電荷就顯得極為重要,不可或缺了。Co MFA方法是通過(guò)將一系列具有相同性質(zhì)的分子按照其相同的幾何作用點(diǎn)在三維空間進(jìn)行疊加,計(jì)算這一組分子疊加的靜電場(chǎng)和立體場(chǎng),用某種探針原子對(duì)這些場(chǎng)進(jìn)行作用,測(cè)試空間各點(diǎn)作用的能量,最后用偏最小二乘法(PLS)及交叉驗(yàn)證法(cross validated)獲取預(yù)測(cè)模型,其中PLS是通用的主流方法。
比較分子相似性指數(shù)分析(Co MSIA)方法是在Co MFA方法基礎(chǔ)上延伸發(fā)展起來(lái)的一種新穎的構(gòu)建三維定量構(gòu)效關(guān)系的方法。為了有效避免分子表面附近網(wǎng)格點(diǎn)上能量的顯著變化,分子場(chǎng)采用了與距離相關(guān)的高斯函數(shù)形式,與Co MFA法相比,不需要定義能量閾值。Co MSIA方法考慮分子靜電場(chǎng)、立體場(chǎng)、疏水場(chǎng)、氫鍵受體場(chǎng)、氫鍵給體場(chǎng)的貢獻(xiàn),用高斯函數(shù)表示,是對(duì)Co MFA的改進(jìn)。
10.3.3.5 參數(shù)的設(shè)定和模型構(gòu)建
本實(shí)例首先使用SYBYL中自帶的優(yōu)化功能對(duì)對(duì)接后所得的126個(gè)小分子結(jié)構(gòu)進(jìn)行幾何上的優(yōu)化,具體參數(shù)設(shè)置如下:使用Amber4.0立場(chǎng)中的Amber-all-at-om來(lái)設(shè)定電荷和將Powell中的根均方差能量梯度值設(shè)定為0.05kcal/(mol· ?),整個(gè)系統(tǒng)進(jìn)行最小化收斂。在計(jì)算能量的過(guò)程中,使用絕緣系數(shù)5來(lái)模擬在蛋白酶環(huán)境中溶劑對(duì)抑制劑的溶劑化影響。并按照分組,依據(jù)共同骨架把這些構(gòu)象和位置疊合在一起,即將藥效團(tuán)或力場(chǎng)等進(jìn)行分子疊合,使每一個(gè)分子采用相同最大力場(chǎng)相似的空間取向進(jìn)行計(jì)算。疊合時(shí)以本組最高活性化合物的最優(yōu)構(gòu)象為模板分子,采用Align Database方法,將其余化合物與模板分子疊合。為進(jìn)行更深入的Co MFA和Co MSIA研究分析做準(zhǔn)備。
本實(shí)例考慮到不同空間網(wǎng)格大小和不同的探針對(duì)3D-QSAR模型的預(yù)測(cè)能力都有一定的影響,所以對(duì)網(wǎng)格的大小及探針的類型對(duì)模型的影響都做了模擬測(cè)試,通過(guò)調(diào)試獲取最佳匹配。模擬結(jié)果表明:空間的網(wǎng)格從0.3nm減小到0.2nm,對(duì)Co MFA的預(yù)測(cè)結(jié)果有所改善,其交叉驗(yàn)證的值有所提高。通過(guò)使用了各種不同的探針,包括帶SP3雜化的碳原子、氮原子、氧原子及鹵素離子和氧負(fù)離子,還有鈉、鉀離子等,發(fā)現(xiàn)不同的探針對(duì)預(yù)測(cè)結(jié)果均有一定的影響。其中當(dāng)探針原子選擇帶1個(gè)正電荷的SP3雜化碳原子時(shí)交叉驗(yàn)證值最大,模擬效果最好,成為后續(xù)Co MFA分析中的空間場(chǎng)探針。模型構(gòu)建的具體過(guò)程為:
(1)Co MFA:用SP3雜化的碳原子作為空間場(chǎng)探針,C+離子作為靜電場(chǎng)探針來(lái)測(cè)定空間場(chǎng)和靜電場(chǎng)的相互作用。在x,y,z軸方向上格子的長(zhǎng)度設(shè)定為2.0?, Co MFA將會(huì)自動(dòng)生成打格區(qū)域,這些打格區(qū)域?qū)鼑械姆肿樱⒃诿總€(gè)方向上有4.0?的延伸。靜電場(chǎng)和空間場(chǎng)的最大能量閾值采用空白設(shè)置,為30kcal/mol。采用標(biāo)準(zhǔn)選項(xiàng)進(jìn)行變量變換,留一法、SAMPLE方法作為交叉驗(yàn)證來(lái)確定OPC的數(shù)目。最后COMFA模型使用這個(gè)優(yōu)化的OPC數(shù)在非交叉驗(yàn)證的情況下建立。
(2)Co MSIA:在Co MSIA模型構(gòu)建過(guò)程中,五種物理化學(xué)特性,即靜電場(chǎng)、立體場(chǎng)、疏水場(chǎng)、氫鍵的受體和供體,將被逐個(gè)計(jì)算。靜電場(chǎng)特性可以表現(xiàn)為Gasteiger Hückel電荷,立體場(chǎng)的貢獻(xiàn)可以通過(guò)原子半徑的第三種力來(lái)描述。評(píng)估原子疏水性時(shí)按照Ghose及其合作者建立的參數(shù)進(jìn)行操作。格子的空間要像在Co MFA中一樣,大到足夠包圍整個(gè)配體分子。這里為避免Co MSIA中的單獨(dú)格點(diǎn)位置依賴于化合物的物理化學(xué)特性,沒(méi)有隨意設(shè)置閾值。用半徑為1?的正一價(jià)疏水離子探針,衰減因子0.3來(lái)計(jì)算與前面相似的指數(shù)。統(tǒng)計(jì)分析采用方法與Co MFA相同。
10.3.3.6 結(jié)果與討論
表10-14為126個(gè)小分子的活性實(shí)驗(yàn)值,還有各自通過(guò)本組訓(xùn)練集疊合,構(gòu)建模型的模型預(yù)測(cè)值,為方便比較,突出分組構(gòu)建模型的優(yōu)越性,將它們與不分組的模型預(yù)測(cè)值集中于一個(gè)表格中。
表10-14 抑制劑的活性值及分組與不分組時(shí)Co MFA和Co MSIA預(yù)測(cè)值
(續(xù)表)
(續(xù)表)
(續(xù)表)
(續(xù)表)
注:有*的分子為測(cè)試集,無(wú)*的分子為訓(xùn)練集。
1)分組模型與整體模型的比較
(1)第一組分子:包括1~57號(hào)分子,以活性最高的是35號(hào)分子為模板,其中帶有星號(hào)的分子為本組的預(yù)測(cè)集,不帶星號(hào)的為訓(xùn)練集,其共同骨架為A(見(jiàn)圖10-29)。
圖10-29 第一組分子,包括1~57號(hào)分子
將其抑制劑的生物活性(p IC50)以及Co MFA方法和Co MSIA方法的預(yù)測(cè)值列于表10-14,通過(guò)表10-14,給出了各個(gè)組化合物的模型預(yù)測(cè)活性和實(shí)驗(yàn)活性的對(duì)比以及與整體模型的預(yù)測(cè)值。將表10-15中的第一組化合物統(tǒng)計(jì)表和已知的相關(guān)性一起考慮,可以推斷Co MFA和Co MSIA模型對(duì)于骨架相同的類似化合物有較高的預(yù)測(cè)能力。為了進(jìn)一步驗(yàn)證構(gòu)建模型的可靠性,用這兩種模型來(lái)預(yù)測(cè)測(cè)試集中5種抑制劑的抑制活性。結(jié)果也在表10-15中列出。對(duì)于測(cè)試集的Co MFA和Co MSIA模型的相關(guān)系數(shù)r2的預(yù)測(cè)值分別是0.895和0.920。這表明兩種預(yù)測(cè)模型是可靠的,對(duì)于含有相同骨架的化合物的預(yù)測(cè)性較高,可以用來(lái)指導(dǎo)改造同類新型抑制劑。
表10-15 第一組分子的Co MFA和Co MSIA模型統(tǒng)計(jì)分析
(2)第二組分子:包括58~69號(hào)分子,以活性最高的60號(hào)分子為模板,以B為共同骨架(見(jiàn)圖10-30)。
圖10-30 第二組分子,包括58~69號(hào)分子
通過(guò)疊合構(gòu)建第二組的Co MFA和Co MSIA,其對(duì)應(yīng)的活性值和預(yù)測(cè)值見(jiàn)表10-14所示。通過(guò)觀察預(yù)測(cè)值與實(shí)驗(yàn)值的殘差、統(tǒng)計(jì)表(見(jiàn)表10-16)以及相關(guān)活性可以看到第二組的模型預(yù)測(cè)性也非??煽?,比起不分組模型的預(yù)測(cè)有很大的改善。為進(jìn)一步驗(yàn)證模型的可靠性,也對(duì)本組中測(cè)試集的小分子進(jìn)行預(yù)測(cè),其相關(guān)系數(shù)分別為0.971和0.843,本組模型通過(guò)驗(yàn)證再次說(shuō)明了其對(duì)骨架相同的抑制劑小分子的預(yù)測(cè)性是可信的。
表10-16 第二組分子的Co MFA和Co MSIA模型統(tǒng)計(jì)分析表
(3)第三組分子:包括70~74號(hào)分子,以70號(hào)為模板,72號(hào)做預(yù)測(cè),共同骨架為C(見(jiàn)圖10-31)。
圖10-31 第三組分子,包括70~74號(hào)分子
由于實(shí)驗(yàn)得到含有相同骨架的小分子的活性值較少,訓(xùn)練集也比較少,故模型的統(tǒng)計(jì)表(見(jiàn)表10-17)和相關(guān)系數(shù)雖然比較高,其通過(guò)對(duì)72號(hào)分子的驗(yàn)證也和實(shí)驗(yàn)值非常貼近,但其統(tǒng)計(jì)學(xué)意義并不大,僅作參考,需要對(duì)含有相同骨架的類似分子做預(yù)測(cè)時(shí),不分組的模型的預(yù)測(cè)性也比較可靠,具有更好的統(tǒng)計(jì)意義。
(4)第四組分子:包括75~94號(hào)分子,以90號(hào)分子為模板,其骨架為D(見(jiàn)圖10-32)。
表10-17 第三組分子的Co MFA,Co MSIA模型統(tǒng)計(jì)分析表
圖10-32 第四組分子,包括75~94號(hào)分子
疊合方法與以上三組相同,通過(guò)表10-14實(shí)驗(yàn)值與模型預(yù)測(cè)值比較看出,預(yù)測(cè)值和實(shí)驗(yàn)值非??拷⑶艺?fù)誤差分布均勻,絕對(duì)值較小,模型預(yù)測(cè)性較高。模型統(tǒng)計(jì)表(見(jiàn)表10-18)以及相關(guān)性也顯示了相同的結(jié)果,再看本組模型對(duì)預(yù)測(cè)集預(yù)測(cè)的結(jié)果,其Co MFA和Co MSIA模型的相關(guān)性分別為0.918和0.957,預(yù)測(cè)集相關(guān)性也非常高,最終得出第四組模型完全可靠的結(jié)論。
(5)第五組分子:包括95~109號(hào)分子,以99號(hào)分子為模板,其骨架為E(見(jiàn)圖10-33)。
(6)第六組分子:包括110~126號(hào)分子,以126號(hào)抑制劑為模板,以F為骨架(見(jiàn)圖10-34)。
表10-18 第四組抑制劑分子的Co MFA和Co MSIA模型統(tǒng)計(jì)表
對(duì)第五、第六組采用與以上四組完全相同的疊合操作,分別構(gòu)建各自的預(yù)測(cè)模型。其活性及預(yù)測(cè)值列于表10-14中,其中第五組的統(tǒng)計(jì)表為表10-19,第六組統(tǒng)計(jì)表為表10-20。參照它們的活性值與預(yù)測(cè)值以及各自的統(tǒng)計(jì)表,還有對(duì)各自測(cè)試集的預(yù)測(cè)可以看出,第五、第六組的模型搭建也是非常成功的,完全具備預(yù)測(cè)骨架相同的抑制劑分子的能力。
圖10-33 第五組分子,包括95~109號(hào)分子
圖10-34 第六組分子,包括110~126號(hào)分子
將126個(gè)小分子不分組的模型構(gòu)建時(shí),首先將各組活性最高的小分子的最優(yōu)構(gòu)象(36、60、70、90、99、126號(hào))在SYBYL軟件包中進(jìn)行手動(dòng)疊合,然后再將組內(nèi)其他分子分別與所在組活性最高的抑制劑分子進(jìn)行構(gòu)象疊合,使它們處在同一個(gè)三維空間內(nèi),來(lái)構(gòu)建Co MFA和Co MSIA模型,它們對(duì)小分子的預(yù)測(cè)值列于表10-14中。統(tǒng)計(jì)表如表10-21所示。
表10-19 第五組抑制劑分子的Co MFA和Co MSIA模型統(tǒng)計(jì)表
表10-20 第六組抑制劑小分子活性統(tǒng)計(jì)表
通過(guò)表10-15~表10-21的7個(gè)模型統(tǒng)計(jì)表可以看出,分組模型構(gòu)建比整體模型構(gòu)建的相關(guān)系數(shù)有所提高,其對(duì)骨架相同的分子預(yù)測(cè)能力更強(qiáng)。對(duì)抑制劑的預(yù)測(cè)能力更為可靠,為了更直觀地比較其模型的可靠性,分別把它們的實(shí)驗(yàn)值與預(yù)測(cè)值作線性擬合,觀察散點(diǎn)分布圖(見(jiàn)圖10-35和圖10-36,分組模型實(shí)驗(yàn)活性值與預(yù)測(cè)值的散點(diǎn)圖;圖10-37、圖10-38整合模型實(shí)驗(yàn)活性值與預(yù)測(cè)值的散點(diǎn)圖),可以看出,圖中直線均近似為通過(guò)原點(diǎn)、斜率為1的直線,但分組模型構(gòu)建得到的直線A值更小,幾乎完全靠近原點(diǎn),B值更大,較之整合的Co MFA,Co MSIA模型更近于1,其散點(diǎn)分布也更為集中、密集、均勻地分布在直線上以及附近,較之整體模型離群點(diǎn)更少。所以對(duì)于骨架相同的抑制劑進(jìn)行模型構(gòu)建及分析預(yù)測(cè)時(shí),分組構(gòu)建更為可靠,其預(yù)測(cè)的活性值和實(shí)驗(yàn)以及真實(shí)的活性值更為接近,對(duì)新型藥物篩選和設(shè)計(jì)的指導(dǎo)有非常重要的意義。但未知抑制劑的分子與以上骨架均不相同時(shí),整體模型就會(huì)體現(xiàn)出其適用性廣泛的優(yōu)點(diǎn)。
表10-21 整體抑制劑的Co MFA和Co MSIA模型統(tǒng)計(jì)表
圖10-35 分組Co MFA預(yù)測(cè)值與實(shí)驗(yàn)活性值散點(diǎn)圖(A=0.34843,B=0.94554)
2)Co MFA和Co MSIA模型的比較
最終模型的取舍及評(píng)價(jià)可通過(guò)抽一法交叉驗(yàn)證的相關(guān)性系數(shù)q2作為依據(jù)。一般而言,當(dāng)q2>0.6時(shí),模型的可靠性較好;若q2<0.6,而相關(guān)性系數(shù)r2較大,則模型面臨較高的過(guò)擬合風(fēng)險(xiǎn)。傳統(tǒng)驗(yàn)證系數(shù)r2的值較高是由于采用了不同的描述變量(空間場(chǎng)、靜電場(chǎng)、疏水場(chǎng)、氫鍵受體和供體),這些變量適合描述神經(jīng)氨酸酶和抑制劑間的相互作用,同時(shí)也適用闡述抑制劑周?chē)牧?chǎng)特性。通過(guò)對(duì)分組以及整體模型的7個(gè)統(tǒng)計(jì)表的對(duì)比分析可以看出,除Co MFA模型中的吡咯烷衍生物和Co MSIA模型中唾液酸衍生物外,在這兩種模型中其他各類化合物的交叉驗(yàn)證系數(shù)都大于0.6,因此建立的兩個(gè)QSAR模型都有一定的預(yù)測(cè)能力。通過(guò)更為深入的比較分析,可以發(fā)現(xiàn)在Co MSIA模型中立體場(chǎng)和疏水場(chǎng)貢獻(xiàn)的和與Co MFA模型中立體場(chǎng)的貢獻(xiàn)大體相同;暗示了這兩種模型是相互聯(lián)系并且內(nèi)在一致的。而Co MFA中靜電場(chǎng)的貢獻(xiàn)相當(dāng)于Co MSIA中靜電場(chǎng)和氫鍵場(chǎng)貢獻(xiàn)和的60%,這表明了極性的相互作用是抑制劑與神經(jīng)氨酸酶反應(yīng)的必要條件。這與神經(jīng)氨酸酶的鍵合位點(diǎn)有10個(gè)電荷和只有4個(gè)有疏水性特性的氨基酸表現(xiàn)出高度的極性完全吻合。
圖10-36 分組Co MSIA預(yù)測(cè)值與實(shí)驗(yàn)活性值散點(diǎn)圖(A=0.17762,B=0.97224)
圖10-37 整合Co MFA預(yù)測(cè)值與實(shí)驗(yàn)活性值散點(diǎn)圖(A=0.64443,B=0.89882)
圖10-38 整合Co MSIA預(yù)測(cè)值與實(shí)驗(yàn)活性值散點(diǎn)圖(A=0.6263,B=0.90167)
通過(guò)整合Co MFA和Co MSIA模型直觀結(jié)果可以通過(guò)St Dev*Coeff圖選項(xiàng)獲得,可視化的等勢(shì)圖可按照貢獻(xiàn)因子得到。支持水平設(shè)定為0.8,不支持水平設(shè)定為0.2。在圖10-39中,給出了Co MFA的等勢(shì)圖。
圖10-39 COMFA的勢(shì)能圖[嵌合1號(hào)分子(GS4071)](彩圖見(jiàn)第411頁(yè))
GS4071與抑制劑在4?距離內(nèi)的神經(jīng)氨酸酶殘基都可在輔助的可視化中看到。在這個(gè)模型中的靜電場(chǎng)項(xiàng),有兩個(gè)高極性區(qū)域是值得注意的(強(qiáng)極性區(qū)域)。在抑制劑的C1取代位置(羧酸的官能團(tuán)處),有一個(gè)高的靜電偏愛(ài)區(qū)。在這里抑制劑的羧酸與神經(jīng)氨酸酶的2個(gè)氨基酸殘基Arg292、Arg371有強(qiáng)烈的靜電相互作用。在這個(gè)模型C4胍基附近有顯著的親電性傾向,這可以滿足有3個(gè)氨基酸殘基Glu119、Asp151、Glu227產(chǎn)生的負(fù)電荷環(huán)境的要求。顯然,靜電和氫鍵的相互作用都與這兩個(gè)強(qiáng)極性區(qū)域相關(guān),同時(shí)這兩個(gè)區(qū)域是有效的神經(jīng)氨酸酶抑制劑與神經(jīng)氨酸酶鍵合所必需的,是藥物設(shè)計(jì)時(shí)必須考慮的兩個(gè)最重要的部分,羧酸和氨基或胍基是保持抑制劑生物活性必要的官能團(tuán)。
除了上面提到的兩處高極性區(qū)域外,在Co MFA等勢(shì)圖上,在C2和C3處也觀察到強(qiáng)極性區(qū)域,這意味著在這些位置有正電荷的取代基可以增加NI的活性。例如,70號(hào)帕拉米韋的活性就比它的類似物74的要高,這是因?yàn)楹笳逤2羥基上缺少帶正電的氫。然而,為了維持這些位置正電荷的需求,用亞氨基代替2-CH2,得到一系列的新型吡咯化合物95~109,也具有高效的神經(jīng)氨酸酶抑制活性。但是在等勢(shì)圖中,靠近C′2乙基正丁基出現(xiàn)了靜電作用區(qū)域與1號(hào)GS4071的顯示圖像不符。事實(shí)上,這個(gè)區(qū)域與另外一種高效藥物達(dá)菲的極性甘油的側(cè)鏈相關(guān),因此,這個(gè)模型實(shí)際上反映了在這個(gè)區(qū)域通過(guò)靜電相互作用而得到的強(qiáng)的鍵合作用。
至于空間相互作用,在Co MFA模型中顯示,在C1-羧基旁邊存在一個(gè)大的空間阻礙作用區(qū)域,這意味著,在這些位置上有體積大的取代基對(duì)活性是不利的。這也可以解釋為什么43號(hào)GS4071的R2位置上的氫被甲基取代導(dǎo)致44號(hào)類似物活性急劇下降。在C1′-乙酰胺基下面的兩個(gè)黃色區(qū)域(即第一組R1的位置)暗示包含這些基團(tuán)是受空間限制的,位于由Arg152、Trp178、Ile222形成了疏水性的小口袋入口處,此處取代基尺寸要滿足幾何匹配(即把口袋口填滿),這就是37~40號(hào)分子生物活性急速降低的原因,雖然42號(hào)分子的R1取代基也很小,但R2取代基的強(qiáng)極性作用很好地補(bǔ)充了其幾何不匹配的弱勢(shì),這也正是產(chǎn)生38號(hào)分子與神經(jīng)氨酸酶的結(jié)合能很低且活性不高的矛盾的原因,與分子對(duì)接結(jié)果的分析完全吻合,與之類似還有115號(hào)分子的生物活性比110號(hào)分子要低很多。
在Co MFA模型中,還有兩個(gè)又長(zhǎng)又窄的與空間等勢(shì)面相關(guān)的區(qū)域,它們都靠近1號(hào)的GS4071C2′原子上的乙醛基。在Co MSIA模型中,這兩個(gè)區(qū)域被預(yù)測(cè)為疏水區(qū)(見(jiàn)圖10-34)。根據(jù)兩親性原理,增加疏水的烷基的長(zhǎng)度將會(huì)提高NIs的抑制活性,這與60>59>58的實(shí)驗(yàn)值活性排序相符合。
對(duì)于Co MSIA中的氫鍵受體和供體圖(見(jiàn)圖10-40),正如預(yù)料,這些都是與對(duì)接得到抑制劑-酶鍵合模型相一致的。在NA—NI復(fù)合物中,Glu119和Asp151形成了作為氫鍵受體與NI結(jié)構(gòu)中胍基或氨基部分形成氫鍵,而Arg292和Arg371作為氫鍵供體與抑制劑羧基部分形成氫鍵。在Co MSIA立場(chǎng)中的貢獻(xiàn)因子和對(duì)接得到NIs鍵合位點(diǎn)的拓?fù)浣Y(jié)構(gòu)特性的相符性表明了Co MSIA結(jié)果的可靠性。Co MSIA中立體場(chǎng)和靜電場(chǎng)等勢(shì)圖與Co MFA模型是總體相似的。
圖10-40 COMSIA模型等勢(shì)面圖[嵌套1號(hào)分子(GS4071)](彩圖見(jiàn)第411頁(yè))
通過(guò)把Co MFA模型和Co MSIA模型的等勢(shì)圖與NI鍵合位點(diǎn)的3D拓?fù)浣Y(jié)構(gòu)結(jié)合起來(lái)很容易得到鍵合模型。這個(gè)模型不僅很好地符合鍵合口袋的環(huán)境特性,而且可以為進(jìn)一步設(shè)計(jì)和改造NI結(jié)構(gòu)提供幫助。
QSAR模型對(duì)訓(xùn)練集數(shù)據(jù)庫(kù)有較好表現(xiàn),但是對(duì)于新的數(shù)據(jù)庫(kù)表現(xiàn)不是十分理想。但對(duì)于Co MFA和Co MSIA模型會(huì)更加完善,因?yàn)楣ぷ鞅环肿拥慕Y(jié)構(gòu)類型和疊合規(guī)則(共同骨架)所約束。接下來(lái)研究的目的之一就是得到更加普遍和有力的模型來(lái)設(shè)計(jì)新型的神經(jīng)氨酸酶抑制劑,所以要進(jìn)行更有說(shuō)服力的驗(yàn)證。
除了關(guān)心模型的普遍性之外,兩種QSAR模型有內(nèi)部較好的驗(yàn)證性表現(xiàn),說(shuō)明這些模型是相互聯(lián)系的。為了闡明這個(gè)問(wèn)題,分組所建的模型可以應(yīng)用Y隨機(jī)化進(jìn)行驗(yàn)證。這包含了多次隨機(jī)轉(zhuǎn)換Y向量之后的重復(fù)計(jì)算。經(jīng)過(guò)多次重復(fù)驗(yàn)證,結(jié)果顯示它們的q2和r2值都較低,這意味著用這些分組所得模型獲得成功并不是偶然的或是依賴訓(xùn)練集中的結(jié)果。
10.3.3.7 結(jié)論
在本研究中,108個(gè)抑制劑類似物選擇出來(lái)作為訓(xùn)練集分別進(jìn)行分組和整體構(gòu)建Co MFA和Co MSIA模型,18個(gè)帶星號(hào)的抑制劑作為測(cè)試集進(jìn)行外部模型驗(yàn)證。來(lái)自訓(xùn)練集和外部測(cè)試集的統(tǒng)計(jì)結(jié)果都表明分組所建模型較整體模型預(yù)測(cè)準(zhǔn)確性有所提高,但受疊合規(guī)則和骨架結(jié)構(gòu)的限制更多,其廣泛性有所降低,即分組模型預(yù)測(cè)準(zhǔn)確性高,整體模型更具普遍意義,它們各有優(yōu)缺點(diǎn),但都是成功的。當(dāng)新的未知抑制劑骨架與分組內(nèi)骨架結(jié)構(gòu)相同,則采用分組的模型預(yù)測(cè)會(huì)獲得更為準(zhǔn)確的預(yù)測(cè)結(jié)果,當(dāng)其骨架相似性不高,則采用整體進(jìn)行預(yù)測(cè),很多時(shí)候整體和分組模型預(yù)測(cè)相結(jié)合,會(huì)獲得更準(zhǔn)確的結(jié)果。Co MFA和Co MSIA力場(chǎng)圖都為研究人員提供了有用的信息來(lái)幫助他們進(jìn)行抑制劑類似物的結(jié)構(gòu)改造。因此,這些3D-QSAR模型都是快速有效地預(yù)測(cè)及新藥設(shè)計(jì)必不可少的通用工具,可以用來(lái)指導(dǎo)新型抗禽流感藥物的篩選和設(shè)計(jì),減少日漸蔓延的可能將在全球爆發(fā)的流感疫情造成的惡劣影響,也為應(yīng)用支持向量積提高3D-QSAR模型預(yù)測(cè)性、更深入地了解和設(shè)計(jì)神經(jīng)氨酸酶抑制劑提供重要的理論基礎(chǔ)和支持。
免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請(qǐng)告知,我們將盡快刪除相關(guān)內(nèi)容。