精品欧美无遮挡一区二区三区在线观看,中文字幕一区二区日韩欧美,久久久久国色αv免费观看,亚洲熟女乱综合一区二区三区

        ? 首頁(yè) ? 理論教育 ?基因的啟動(dòng)子序列怎么查詢

        基因的啟動(dòng)子序列怎么查詢

        時(shí)間:2023-02-17 理論教育 版權(quán)反饋
        【摘要】:酵母的第三號(hào)染色體含有5萬(wàn)個(gè)堿基對(duì),攜帶有28個(gè)基因;而在玉米的基因組中,根據(jù)已知的部分序列的分析,其中一段DNA的5萬(wàn)個(gè)堿基對(duì)中,只有兩個(gè)基因,其中一個(gè)基因的功能還是未知的。內(nèi)含子的生物學(xué)功能還不是非常清楚,有研究表明在某些基因中內(nèi)含子的存在可以保證或增強(qiáng)基因的穩(wěn)定表達(dá)。
        染色體_醫(yī)學(xué)分子生物學(xué)

        圖1-10 人類(lèi)基因的細(xì)胞核和線粒體成分

        人類(lèi)基因組包含3×109個(gè)堿基對(duì),有3萬(wàn)~3.5萬(wàn)個(gè)編碼特異蛋白的基因,分布在23對(duì)染色體上。其中一號(hào)染色體上的基因數(shù)目最多,為4 635個(gè);Y染色體上的基因數(shù)目最少,約為330個(gè)。不同生物的基因組大小差異很大(表1-2)。大腸埃希菌的基因組含有4.2×106個(gè)堿基對(duì);酵母的基因組含有1.3×107個(gè)堿基對(duì);而某些哺乳動(dòng)物的基因組含有的堿基對(duì)高達(dá)109以上。但是基因組的大小與基因的數(shù)目并沒(méi)有直接的線性關(guān)系。酵母的第三號(hào)染色體含有5萬(wàn)個(gè)堿基對(duì),攜帶有28個(gè)基因;而在玉米的基因組中,根據(jù)已知的部分序列的分析,其中一段DNA的5萬(wàn)個(gè)堿基對(duì)中,只有兩個(gè)基因,其中一個(gè)基因的功能還是未知的。這種差異固然是長(zhǎng)期進(jìn)化的結(jié)果。我們今天所看到的這種進(jìn)化結(jié)果就是不同生物的基因結(jié)構(gòu)形成了各自的特點(diǎn)。

        表1-2 幾種不同生物的基因組大小

        (一)單拷貝基因與多基因家族

        最初,人們推測(cè)人類(lèi)基因組含有8萬(wàn)~15萬(wàn)個(gè)基因。隨著人類(lèi)基因組計(jì)劃的完成,通過(guò)對(duì)所獲得基因組序列的分析,認(rèn)為人類(lèi)基因組含有3萬(wàn)~3.5萬(wàn)個(gè)編碼特異蛋白的基因。而最新資料表明人類(lèi)基因可能在5萬(wàn)個(gè)左右。這些基因,小的只有幾百個(gè)堿基對(duì),而大的可以多達(dá)200多萬(wàn)個(gè)堿基對(duì),平均為3萬(wàn)個(gè)堿基對(duì)。許多基因是單拷貝基因,編碼的蛋白質(zhì)維系著細(xì)胞的功能,如酶、激素、受體、結(jié)構(gòu)蛋白和調(diào)節(jié)蛋白等。這些單拷貝基因或低重復(fù)序列基因約占全基因組序列的75%。它們也具有人類(lèi)基因的共同結(jié)構(gòu)特點(diǎn)。

        1.人類(lèi)基因的結(jié)構(gòu)特點(diǎn) 人類(lèi)基因的顯著特征是含有非編碼的插入序列,稱(chēng)為內(nèi)含子(intron)。內(nèi)含子能夠轉(zhuǎn)錄成mRNA前體(precursor),但是在mRNA前體的轉(zhuǎn)錄后加工過(guò)程中被剪切掉,因此不包括在成熟的mRNA序列中。被內(nèi)含子分隔開(kāi)的編碼序列稱(chēng)為外顯子(exon),剪接后連在一起形成成熟的mRNA,參與指導(dǎo)蛋白質(zhì)合成。不同基因的內(nèi)含子和外顯子的數(shù)目及大小各不相同,人的胰島素啟動(dòng)子因子1(insulin promoter factor 1,IPF1)基因全長(zhǎng)為5 000個(gè)堿基對(duì),含有2個(gè)外顯子(852個(gè)堿基的mRNA)、1個(gè)內(nèi)含子;而人的膜輔因子蛋白(membrane cofactor protein,MCP)基因全長(zhǎng)超過(guò)8萬(wàn)個(gè)堿基對(duì),含有14個(gè)外顯子(1 125個(gè)堿基的mRNA)、13個(gè)內(nèi)含子。由此可見(jiàn),內(nèi)含子的序列遠(yuǎn)遠(yuǎn)大于編碼序列(coding region)。根據(jù)人類(lèi)基因組草圖的分析推測(cè),基因的編碼序列僅占全基因組序列的3%。內(nèi)含子的生物學(xué)功能還不是非常清楚,有研究表明在某些基因中內(nèi)含子的存在可以保證或增強(qiáng)基因的穩(wěn)定表達(dá)。還有些基因的內(nèi)含子中包含其他基因的編碼序列,即基因內(nèi)基因。例如,在人的神經(jīng)纖維瘤病1型基因(neurofibromatosis type 1,NF1)的第27內(nèi)含子序列中,含有3個(gè)小基因:少突神經(jīng)膠質(zhì)細(xì)胞髓磷脂糖蛋白(oligodendrocyte myelin glycoprotein,OMG),嗜同病毒整合位點(diǎn)2A和2B(ecotropic virus integration site 2A/2B,EVI2B,EVI2A),在這3個(gè)基因內(nèi)也還都含有外顯子和內(nèi)含子。真核生物基因的兩側(cè)各有一段不被轉(zhuǎn)錄的序列,對(duì)基因表達(dá)、調(diào)控具有重要作用。在這些序列中主要有啟動(dòng)子、增強(qiáng)子和終止子等。

        (1)啟動(dòng)子(promoter):一般位于基因轉(zhuǎn)錄起始點(diǎn)上游-100~-200堿基對(duì)范圍,是能夠與RNA聚合酶結(jié)合并起始轉(zhuǎn)錄的核苷酸序列,包括一組轉(zhuǎn)錄調(diào)控序列:①TATA盒(TATA Box):人類(lèi)許多基因的轉(zhuǎn)錄起始點(diǎn)上游-25~-30堿基對(duì)的位置有一段高度保守的序列,即TATA盒。它由7個(gè)堿基組成,即TATAAAA或TATATAT。TATA盒是轉(zhuǎn)錄因子TFⅡD的結(jié)合位點(diǎn),TFⅡD再與RNA聚合酶Ⅱ形成復(fù)合物,啟動(dòng)基因轉(zhuǎn)錄。②CAAT盒(CAAT Box):是位于轉(zhuǎn)錄起始點(diǎn)上游-70~-80個(gè)堿基對(duì)位置的一段保守序列,由9個(gè)堿基組成,即GGNCAATCT,其中N=C或T。CAAT盒與轉(zhuǎn)錄因子CTF結(jié)合,決定啟動(dòng)子轉(zhuǎn)錄的效率。③GC盒(GC Box):有一些基因沒(méi)有TATA盒與CAAT盒,但在轉(zhuǎn)錄起始點(diǎn)上游-35堿基對(duì)的位置發(fā)現(xiàn)富含GC的核苷酸序列(GGGCGG),稱(chēng)為GC盒。GC盒能與轉(zhuǎn)錄因子Sp1結(jié)合,促進(jìn)轉(zhuǎn)錄的過(guò)程。

        典型的啟動(dòng)子通常含有TATA盒以及上游的CAAT盒及GC盒。這類(lèi)啟動(dòng)子一般具有一個(gè)轉(zhuǎn)錄起始點(diǎn)及較高的轉(zhuǎn)錄活性。僅有TATA盒和轉(zhuǎn)錄因子也可以構(gòu)成最簡(jiǎn)單的啟動(dòng)子。然而,還有許多啟動(dòng)子不含TATA盒。這類(lèi)啟動(dòng)子分為兩類(lèi):一類(lèi)是富含GC的啟動(dòng)子,最初發(fā)現(xiàn)于一些管家基因(housekeeping genes),這類(lèi)啟動(dòng)子一般含有數(shù)個(gè)分離的轉(zhuǎn)錄起始點(diǎn);另一類(lèi)啟動(dòng)子既不含TATA盒,也沒(méi)有GC富含區(qū),這類(lèi)啟動(dòng)子可有一個(gè)或數(shù)個(gè)轉(zhuǎn)錄起始點(diǎn),大多數(shù)轉(zhuǎn)錄活性很低或根本就沒(méi)有轉(zhuǎn)錄活性,而只是在胚胎發(fā)育、組織分化和再生過(guò)程中受到調(diào)節(jié)。

        (2)增強(qiáng)子(enhancer):是一段短的DNA序列,其中含有多個(gè)作用元件,可以特異性地與轉(zhuǎn)錄因子結(jié)合,增強(qiáng)基因的轉(zhuǎn)錄活性。與啟動(dòng)子不同,增強(qiáng)子可以位于基因的任何位置。盡管通常處于轉(zhuǎn)錄起始點(diǎn)上游-100~-300個(gè)堿基對(duì)處,但在內(nèi)含子中也發(fā)現(xiàn)有增強(qiáng)子的存在。增強(qiáng)子的功能與其位置和方向無(wú)關(guān),可以是5′→3′方向,也可以是3′→5′方向。1986年,Maniatis等研究干擾素-β(IFN-β)基因轉(zhuǎn)錄時(shí)發(fā)現(xiàn)其增強(qiáng)子內(nèi)含有負(fù)調(diào)控序列,稱(chēng)為負(fù)增強(qiáng)子,又稱(chēng)為沉默子(silencer)。由于負(fù)增強(qiáng)子的發(fā)現(xiàn),有人建議用調(diào)變子(modulator)取代增強(qiáng)子的概念。

        (3)終止子(terminator):是在結(jié)構(gòu)基因中的最后一個(gè)外顯子中的一段保守的AATAAA序列。在此位點(diǎn)的下游有一段GT或T豐富區(qū),與AATAAA序列共同構(gòu)成poly(A)的加尾信號(hào)。mRNA轉(zhuǎn)錄到此部位后,產(chǎn)生AAUAAA和隨后的富含GU或U的序列,被結(jié)合在RNA聚合酶上的延長(zhǎng)因子識(shí)別并與其結(jié)合,然后在AAUAAA下游10~30個(gè)堿基的部位切斷RNA,并加上poly(A)尾。

        2.多基因家族(multigene family) 本意是指核苷酸序列或編碼產(chǎn)物的結(jié)構(gòu)具有一定程度同源性的基因,其編碼產(chǎn)物常常具有相似的功能。另外,還有一種基因家族,是由多基因家族及單基因組成的更大的基因家族,它們的結(jié)構(gòu)有程度不等的同源性,但是它們的功能不一定相同,稱(chēng)為基因超家族(gene superfamily)。根據(jù)基因家族內(nèi)成員同源性的程度,以下分別進(jìn)行介紹。

        (1)核酸序列相同:這種家族實(shí)際上是一個(gè)基因的多次拷貝,成簇地排列在同一條染色體上,形成一個(gè)基因簇。包括rRNA基因家族、tRNA基因家族和組蛋白基因家族等。有些家族的基因在染色體上是串聯(lián)排列的,如5SrRNA基因借間隙區(qū)串聯(lián)成簇,其中每一個(gè)5SrRNA都被間隔序列分開(kāi),間隔序列的大小比5SrRNA的基因長(zhǎng)度大2~6倍,而且還含有中度重復(fù)序列。每一個(gè)5SrRNA基因都被單獨(dú)轉(zhuǎn)錄,產(chǎn)生出一個(gè)獨(dú)立的RNA分子。

        真核細(xì)胞一般都有幾百到1 000多個(gè)tRNA基因,每種tRNA含有10個(gè)到幾百個(gè)基因拷貝。同種tRNA往往串聯(lián)在一起形成基因簇,但在基因間有非轉(zhuǎn)錄區(qū)分隔,可以比結(jié)構(gòu)基因長(zhǎng)將近10倍。組蛋白基因家族在染色體上的排列是另外一種形式,5種組蛋白基因串聯(lián)成一個(gè)單元,許多單元再串聯(lián)成一個(gè)大簇。這種重復(fù)成串的排列與DNA復(fù)制時(shí)需要大量的組蛋白有關(guān)。

        (2)核酸序列高度同源:在這種基因家族中,多數(shù)成員的同源性非常高。如人的生長(zhǎng)激素基因家族,包括3種激素的基因:生長(zhǎng)激素(growth hormone,GH)、胎盤(pán)促乳素(chorionic samatomammotropin,CS)和催乳素(prolactin,PRL)。它們之間的同源性非常高,尤其是GH和CS之間,氨基酸序列有85%的同源性、mRNA序列有92%的同源性,說(shuō)明它們來(lái)自于一個(gè)共同祖先基因。但是,PRL與GH和CS之間僅在氨基酸序列上有50%的同源,mRNA水平上的同源性非常低。這3種基因在不同的染色體上,GH和CS基因位于第17號(hào)染色體長(zhǎng)臂,而PRL基因位于第6號(hào)染色體。α珠蛋白基因家族則是由高度同源的幾個(gè)基因成簇地排列在同一條染色體上。有些基因可能同時(shí)發(fā)揮作用,也有些基因在不同發(fā)育階段進(jìn)行表達(dá)。

        (3)編碼產(chǎn)物的功能或功能區(qū)同源:在某些基因家族成員之間,基因全長(zhǎng)序列的相似性可能較低,但其編碼產(chǎn)物卻具有高度保守的功能區(qū)。如src癌基因家族,各成員基因結(jié)構(gòu)并無(wú)明顯的同源性,但每個(gè)基因產(chǎn)物都含有250個(gè)氨基酸順序的同源蛋白激酶結(jié)構(gòu)域。一些結(jié)構(gòu)類(lèi)似、功能相關(guān)的受體也是這樣被劃分成一個(gè)個(gè)家族的。還有些基因家族成員的DNA序列并不明顯相關(guān),但所編碼的產(chǎn)物卻具有共同的功能特征,如DEAD盒基因家族含有幾個(gè)不同的基因,它們的產(chǎn)物都具有解旋酶的功能,其結(jié)構(gòu)特征是8個(gè)氨基酸的保守序列,內(nèi)含DEAD盒序列:Asp-Glu-Ala-Asp。

        (4)基因超家族:其組成更為復(fù)雜。其成員雖然在結(jié)構(gòu)上有一定的相似性,但是功能不一定相同。這些基因在進(jìn)化上親緣較遠(yuǎn),最經(jīng)典的是免疫球蛋白基因超家族。開(kāi)始,這一家族只包括α2微球蛋白、MHCⅠ類(lèi)抗原的α鏈、Ⅱ類(lèi)抗原的α鏈和β鏈、Thy1、CD4、CD8等免疫相關(guān)分子的基因,以后又發(fā)現(xiàn)了許多免疫系統(tǒng)內(nèi)以及與免疫無(wú)關(guān)的家族成員。通過(guò)應(yīng)用計(jì)算機(jī)分析基因結(jié)構(gòu)序列,可以使越來(lái)越多的基因歸為一類(lèi),從而使原來(lái)的多基因家族成為基因超家族。例如絲氨酸蛋白酶(serine proteases)基因家族,原來(lái)是多基因家族。它們的基因產(chǎn)物都有一個(gè)特殊的功能區(qū),具有酶的功能。絲氨酸是活性中心的關(guān)鍵氨基酸殘基,因此稱(chēng)為絲氨酸蛋白酶家族?,F(xiàn)在已有很多新成員加入進(jìn)去,特別是載脂蛋白(apolipoprotein),只是轉(zhuǎn)移膽固醇蛋白顆粒中的成分,而不具有水解蛋白質(zhì)的酶功能。因此成為基因超家族。

        (二)假基因

        假基因(pseudogene,ψ)是指與某些有功能的基因結(jié)構(gòu)相似,但不能表達(dá)基因產(chǎn)物的基因。這些基因起初可能是有功能的,在基因復(fù)制時(shí)編碼序列或調(diào)控元件發(fā)生突變,或是插入了mRNA反轉(zhuǎn)錄的cDNA,缺少基因表達(dá)所需要的啟動(dòng)子序列,變成了無(wú)功能的基因。

        由突變而引起的功能缺失通常是在編碼區(qū)引入了終止子,這種假基因稱(chēng)為傳統(tǒng)假基因(conventional pseudogene)。例如,存在于α珠蛋白基因簇中的假基因(ψβ)就是由于在β基因編碼序列的第20位堿基的丟失而引起移碼突變所造成的。由插入了mRNA反轉(zhuǎn)錄生成的cDNA而造成的假基因稱(chēng)為加工的假基因(processed pseudogene)。這種假基因?qū)嶋H上是一個(gè)功能基因的mRNA被反轉(zhuǎn)錄成為cDNA,然后cDNA又被插入到基因組中(圖1-11)。它們不含有內(nèi)含子,大多數(shù)也沒(méi)有基因表達(dá)所需要的調(diào)控區(qū),因此不能被表達(dá)。假基因在高等哺乳動(dòng)物基因組中是一種普遍的現(xiàn)象,許多多基因家族中的部分成員為假基因。通常,假基因僅占總基因數(shù)目當(dāng)中極少的一部分。小鼠核糖體蛋白的編碼基因是個(gè)例外。在這個(gè)基因家族中,只有一個(gè)是有功能的編碼基因,而有15個(gè)假基因。在這種情況下,根據(jù)分子雜交結(jié)果進(jìn)行基因數(shù)目分析時(shí)就要考慮到真正有功能的基因數(shù)目要遠(yuǎn)遠(yuǎn)低于雜交結(jié)果所預(yù)示的數(shù)目。

        假基因的存在可能是在長(zhǎng)期進(jìn)化過(guò)程中所形成的。但是作為一種沒(méi)有生物學(xué)功能的基因,為什么能夠一直保存下來(lái),難道它們真的沒(méi)有任何功能,還是我們所看到的假基因沒(méi)有來(lái)得及被丟失?許多問(wèn)題有待于解答。

        (三)重復(fù)序列DNA

        在人類(lèi)基因組中,編碼序列只占基因組總DNA量的3%左右,非編碼序列占95%以上。其中一部分是基因的內(nèi)含子、調(diào)控序列等,另一部分便是重復(fù)序列(repeat sequences)。真核基因組的重復(fù)序列可以高達(dá)總DNA量的50%。重復(fù)序列中,除了編碼rRNA、tRNA、組蛋白以及免疫球蛋白的結(jié)構(gòu)基因外,大部分是非編碼序列。其功能主要與基因組的穩(wěn)定性、組織形式以及基因的表達(dá)調(diào)控有關(guān)。除單拷貝或低重復(fù)序列DNA外,根據(jù)重復(fù)序列出現(xiàn)的頻率不同,可以將DNA序列分為高度重復(fù)序列DNA和中度重復(fù)序列DNA。

        1.高度重復(fù)序列DNA DNA序列在基因組中的重復(fù)次數(shù)可高達(dá)數(shù)百萬(wàn)次(>105),這種序列可以集中在某一區(qū)域串聯(lián)排列。典型的高重復(fù)序列DNA有衛(wèi)星DNA(satellite DNA)和反向重復(fù)序列(inverted repeats)。

        圖1-11 加工的假基因來(lái)源

        加工的假基因被認(rèn)為是某個(gè)功能性基因轉(zhuǎn)錄出的mRNA拷貝整合到基因組而產(chǎn)生的。這個(gè)mRNA先被反轉(zhuǎn)錄成cDNA拷貝,而后者可能整合到母體基因所在的染色體中,或整合到其他染色體中

        (1)衛(wèi)星DNA:實(shí)際上是出現(xiàn)在非編碼區(qū)的串聯(lián)重復(fù)序列。其特點(diǎn)是具有固定的重復(fù)單位,該重復(fù)單位首尾相連形成重復(fù)序列片段,通常存在于間隔DNA和內(nèi)含子中。串聯(lián)重復(fù)單位可以從2個(gè)堿基起,長(zhǎng)短不等;重復(fù)次數(shù)可以從幾次到數(shù)百次,甚至幾十萬(wàn)次。串聯(lián)重復(fù)序列是形成衛(wèi)星DNA的基礎(chǔ)。衛(wèi)星DNA可以分為三類(lèi):①大衛(wèi)星DNA(macro-satellite)也稱(chēng)經(jīng)典衛(wèi)星DNA,是在CsCl密度梯度離心時(shí)發(fā)現(xiàn)的。將基因組DNA打斷成為約104堿基對(duì)大小的片段,加入到CsCl溶液進(jìn)行超速離心形成密度梯度,原核生物DNA可顯示一條寬帶,而真核生物DNA除形成同樣的主要寬帶外,還出現(xiàn)其他條帶,這些條帶中的DNA稱(chēng)為衛(wèi)星DNA(圖1-12)。這是由于某段DNA分子中存在大量重復(fù)序列,DNA的(G+C)/(A+T)的比值不同于主帶DNA的比值,因而密度也不同于主帶DNA。大衛(wèi)星DNA可以根據(jù)密度不同分為幾種不同類(lèi)型,同一類(lèi)型不同家族成員之間堿基組成比例相同,但是DNA序列未必相同。大衛(wèi)星DNA的確切功能還不清楚。②小衛(wèi)星DNA(mini-satellite)是由中等大小的串聯(lián)重復(fù)順序構(gòu)成,分布在所有染色體,又可以分為高度可變的小衛(wèi)星DNA和端粒DNA。前者重復(fù)單位9~24bp,重復(fù)次數(shù)變化很大,呈高度多態(tài)性(稱(chēng)為可變數(shù)目串聯(lián)重復(fù)序列,variable number of tandem repeats,VNTRs)。其核心序列是GGGCAGGAXG,可能與DNA的同源重組有關(guān)。端粒DNA的主要組成成分是由重復(fù)序列(TTAGGG)n組成的2~20kb的DNA區(qū)段,在染色體的復(fù)制、末端保護(hù)等方面起重要作用。③微衛(wèi)星DNA(micro-satellite)是一類(lèi)更簡(jiǎn)單的寡核苷酸串聯(lián)重復(fù)序列,其重復(fù)單位為1~5bp,重復(fù)次數(shù)10~60次,其總長(zhǎng)度通常小于150bp,分布在所有的染色體。常見(jiàn)的是以(AC)n和(TG)n的二聚核苷酸為重復(fù)單位,存在于內(nèi)含子、間隔DNA中,也可以存在于編碼區(qū),編碼區(qū)的重復(fù)順序均為3個(gè)堿基組成的重復(fù)單位,如人雄激素受體基因內(nèi)的(AGC)n。微衛(wèi)星DNA由于重復(fù)單位的重復(fù)次數(shù)不同而具有高度的遺傳多態(tài)性,并且遵照孟德?tīng)栠z傳規(guī)律,可以作為很好的遺傳標(biāo)記。

        (2)反向重復(fù)序列:是指兩個(gè)順序相同的拷貝在DNA鏈上呈反向排列。一種形式是兩個(gè)反向排列的拷貝之間隔著一段間隔序列;另一種形式是兩個(gè)拷貝反向串聯(lián)在一起,中間沒(méi)有間隔序列,這種結(jié)構(gòu)又稱(chēng)為回文結(jié)構(gòu)。人類(lèi)基因組中約含5%的反向重復(fù)序列,常見(jiàn)于基因的調(diào)控區(qū)內(nèi),可能與復(fù)制、轉(zhuǎn)錄的調(diào)控有關(guān)。

        圖1-12 人類(lèi)基因組衛(wèi)星DNA

        人DNA的平均GC含量為40.3%,平均浮力密度為1.701g/cm3,主要由單拷貝DNA組成的片段,其GC含量接近平均值,且位于主帶中。衛(wèi)星帶浮力密度為1.678、1.693和1.697g/cm3,由重復(fù)DNA的長(zhǎng)段組成。這些片段GC含量取決于各自重復(fù)模體的序列,與基因組的平均值不同,由此,這些片段與單拷貝DNA的浮力密度不同,在密度梯度離心時(shí)會(huì)移動(dòng)到不同的部位

        2.中度重復(fù)序列DNA 在基因組中的重復(fù)次數(shù)為10~105次,散在分布于基因組中,約占基因組DNA總量的35%。中度重復(fù)序列常與單拷貝基因間隔排列,有一部分是編碼rRNA、tRNA、組蛋白及免疫球蛋白的結(jié)構(gòu)基因,另外一些可能與基因的調(diào)控有關(guān)。Alu家族是中度重復(fù)序列中研究最多的一種散在重復(fù)序列,由于序列中有限制性內(nèi)切酶Alu的酶切位點(diǎn)而得名。其重復(fù)單位是300bp,由兩個(gè)130bp的重復(fù)序列組成,中間有31bp間隔序列。Alu序列在單倍體基因組中重復(fù)30萬(wàn)~50萬(wàn)次,散在分布于整個(gè)基因組中,但相對(duì)集中在染色體的R帶。Alu序列300bp兩側(cè)各有一段17~21bp的正向重復(fù)序列,類(lèi)似于轉(zhuǎn)位因子的靶位點(diǎn)順序。Alu順序之所以散在分布于整個(gè)基因組,可能是由于Alu序列轉(zhuǎn)錄形成的RNA分子在反轉(zhuǎn)錄酶的作用下,產(chǎn)生cDNA,然后又重新插入到基因組中。因此推測(cè)Alu序列可能是人類(lèi)基因組DNA中的一種逆轉(zhuǎn)座子。Alu序列是靈長(zhǎng)類(lèi)基因組所特有的,因此可以作為天然標(biāo)記。

        3.重復(fù)序列的多態(tài)性 人類(lèi)個(gè)體的千差萬(wàn)別,其物質(zhì)基礎(chǔ)在于基因組DNA的差異。DNA重復(fù)序列的多態(tài)性是構(gòu)成這些差異中十分重要的一種。在高度重復(fù)序列中的無(wú)間隔反向重復(fù)序列很容易形成限制性內(nèi)切酶識(shí)別位點(diǎn),也很容易由于突變產(chǎn)生或失去一個(gè)酶切位點(diǎn),因而可以造成限制性片段長(zhǎng)度多態(tài)性(restriction fragment length polymorphism,RFLP),即用同一種限制性內(nèi)切酶消化不同個(gè)體的同一段DNA時(shí),由于堿基組成的變化而改變限制性內(nèi)切酶識(shí)別位點(diǎn),從而會(huì)產(chǎn)生長(zhǎng)度不同的DNA片段。這種方法稱(chēng)為限制性片段長(zhǎng)度多態(tài)性技術(shù),簡(jiǎn)稱(chēng)RFLP技術(shù)。

        如前所述,小衛(wèi)星DNA和微衛(wèi)星DNA也具有很高的多態(tài)性,并且按孟德?tīng)栆?guī)律遺傳,具有體細(xì)胞穩(wěn)定性和種系穩(wěn)定性,因此可以作為遺傳標(biāo)記,在疾病基因的檢測(cè)、產(chǎn)前診斷以及法醫(yī)學(xué)鑒定等方面具有重要作用。

        免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請(qǐng)告知,我們將盡快刪除相關(guān)內(nèi)容。

        我要反饋

      1. 數(shù)學(xué)天賦來(lái)自基因排列異常  

        數(shù)學(xué)天賦來(lái)自基因排列異常

        2020-02-17
      2. 查詢機(jī)構(gòu)組織名稱(chēng)  

        查詢機(jī)構(gòu)組織名稱(chēng)

        2020-03-30