精品欧美无遮挡一区二区三区在线观看,中文字幕一区二区日韩欧美,久久久久国色αv免费观看,亚洲熟女乱综合一区二区三区

        ? 首頁 ? 理論教育 ?老年癡呆癥的生物學(xué)發(fā)現(xiàn)

        老年癡呆癥的生物學(xué)發(fā)現(xiàn)

        時(shí)間:2023-03-08 理論教育 版權(quán)反饋
        【摘要】:OMIM可以為研究人員提供迅速、簡練的對(duì)于某一基因或遺傳疾病研究的關(guān)鍵信息和綜述,并且提供對(duì)于其表型和基因型的相關(guān)分析,讓科研人員迅速獲取疾病遺傳研究的進(jìn)展情況以及活躍于該領(lǐng)域的學(xué)者的資料。DIAGNOSIS(診斷)說明的是AD1各種臨床診斷方式的研究進(jìn)展情況。下面我們以Protein庫為例說明,Protein鏈接列出了目前已知與老年癡呆有關(guān)的一些蛋白質(zhì)。

        實(shí)驗(yàn)一 老年癡呆癥的生物學(xué)發(fā)現(xiàn)——生物學(xué)網(wǎng)絡(luò)資源檢索

        毫無疑問,最基本的生物學(xué)數(shù)據(jù)就是序列,序列是非常直觀的數(shù)據(jù),如DNA包括基因組序列和基因序列,它是由A,T,C,G四種脫氧核糖核苷酸構(gòu)成的有序的集合,而RNA則由A,U,C,G四種核糖核苷酸組成,蛋白質(zhì)的組成較為復(fù)雜,主要有20種較為常見的氨基酸。因此,生物信息學(xué)的一個(gè)重要任務(wù)就是收集、組織和存儲(chǔ)生物序列數(shù)據(jù)。

        作為入門級(jí)的教程,為了讓同學(xué)們對(duì)生物序列有一個(gè)更加直觀的認(rèn)識(shí),在這里我們從一種常見的疾病入手,并找到與該疾病相關(guān)的基因、蛋白以及序列的相關(guān)功能注釋信息和代謝通路。

        OMIM數(shù)據(jù)庫是在線人類孟德爾遺傳數(shù)據(jù)庫(Online Mendelian Inheritance in Man)的縮寫。數(shù)據(jù)庫涵蓋了關(guān)于人類遺傳疾病和基因座位(locus)相關(guān)信息和文獻(xiàn)的中心數(shù)據(jù)庫。OMIM可以為研究人員提供迅速、簡練的對(duì)于某一基因或遺傳疾病研究的關(guān)鍵信息和綜述,并且提供對(duì)于其表型和基因型的相關(guān)分析,讓科研人員迅速獲取疾病遺傳研究的進(jìn)展情況以及活躍于該領(lǐng)域的學(xué)者的資料。

        OMIM的每一條記錄都有唯一對(duì)應(yīng)的MIM記錄號(hào)(表5-1),對(duì)應(yīng)于某種基因或者是疾病,如果是序列,則必然包含對(duì)應(yīng)的基因功能注釋。一般而言,每一個(gè)基因座位和記錄存在一一映射的關(guān)系。另外,許多疾病雖然在基因和生物化學(xué)水平上沒有詳細(xì)的描述,但仍然包含在記錄中。OMIM的另一個(gè)主要目標(biāo)是實(shí)現(xiàn)已定位表型和對(duì)應(yīng)基因序列的關(guān)聯(lián)(圖5-10)。

        表5-1 MIM記錄號(hào)的含義

        img113

        續(xù) 表

        img114

        img115

        圖5-10 OMIM數(shù)據(jù)庫頁面截圖

        (http://www.ncbi.nlm.nih.gov/omim)

        OMIM的查詢方式有簡單查詢、高級(jí)查詢和復(fù)雜布爾(Boolean)查詢(圖5-11)。

        (1)簡單查詢 OMIM默認(rèn)的查詢方式,不指明搜索范圍、限制(limits)或布爾算子(如AND/OR/NOT等)。假如我們要查詢“與心肌病相關(guān)的定位于11號(hào)染色體的常染色體隱性遺傳疾病基因”,只需要在輸入欄填入“cardiomyopathy 11autosomal recessive”,就可以得到相關(guān)記錄。

        (2)高級(jí)查詢 可通過歷史(history)、索引(index)和限制(limit)三個(gè)菜單的組合實(shí)現(xiàn)比較多樣的查詢。歷史菜單可以提供之前的查詢歷史結(jié)果,并支持布爾算子的組合,可以對(duì)之前的查詢進(jìn)行修改。布爾算子必須為大寫,支持“*”等通配符和“()”的限制。限制菜單可指定關(guān)鍵詞的搜索范圍,如標(biāo)題(title)、MIM記錄號(hào)(entry)、參考文獻(xiàn)(reference)、染色體位置(chromosome)、記錄號(hào)前綴(prefix)、記錄建立和修改的時(shí)間等。索引包括有關(guān)術(shù)語(terms)的字母列表及其對(duì)應(yīng)術(shù)語的記錄數(shù)。

        img116

        圖5-11 OMIM查詢限制

        (3)復(fù)雜布爾查詢 是高級(jí)查詢的命令行方式,其優(yōu)點(diǎn)是可以一步即可完成高級(jí)查詢的任務(wù),但前提是必須熟悉布爾算子的語法。

        1.OMIM數(shù)據(jù)庫檢索

        (1)打開瀏覽器,進(jìn)入NCBI主頁(http://www.ncbi.nlm.nih.gov)。

        (2)從頁面的下拉菜單中選擇OMIM并按下GO,進(jìn)入如圖5-12所示的OMIM數(shù)據(jù)庫主頁。

        (3)輸入你希望查詢的疾病的名稱進(jìn)行簡單查詢,例如老年癡呆癥(Alzheimer),近年來,上海的老齡化趨勢(shì)非常明顯,老年癡呆癥已經(jīng)成為非常明顯的威脅之一,因此需要我們對(duì)老年癡呆癥有更加清楚的認(rèn)識(shí)。

        (4)在搜索欄輸入“Alzheimer”,我們可以看到返回許多記錄,如圖5-13所示,從這里你可以得到多少條記錄?

        (5)如果需要對(duì)結(jié)果進(jìn)行限制,可以相應(yīng)地在Limits欄加入限制,例如該關(guān)鍵詞出現(xiàn)的位置,基因座位所在的染色體,提交和最后修改的日期,還有對(duì)前綴(Prefix)的限制等,這樣可以大大縮小搜索范圍,確定我們真正想要獲取的信息。如果我們要將范圍限制在具有明確分子機(jī)制的形狀描述,則頁面記錄減少到多少條?

        img117

        圖5-12 老年癡呆癥在OMIM數(shù)據(jù)庫中的查詢結(jié)果

        img118

        圖5-13 老年癡呆癥MIM#104300記錄

        (6)打開其中一個(gè)記錄“#104300”,可以看到如圖5-13所示的結(jié)果。TEXT(文本)部分簡單陳述了家族性阿爾茨海默癥-1(familial Alzheimer disease-1,AD1)及其位于21號(hào)染色體短臂上的相關(guān)的基因——淀粉樣蛋白前體(amyloid precursor protein,APP),該基因突變的遺傳方式,還提到了與APP基因相關(guān)的腦淀粉樣血管病。DESCRIPTION(描述)部分則對(duì)該疾病的特征和定義進(jìn)行了簡單的描述,并對(duì)可能相關(guān)的遺傳因素和多態(tài)性位點(diǎn)、其他AD類型等進(jìn)行了綜述說明。CLINICAL FEATURES(臨床特征)則重點(diǎn)介紹了臨床研究的歷史及臨床特征。BIOCHEMICAL FEATURES(生化特征)則介紹了AD1的生物化學(xué)特征。PATHOGENESIS(病因)部分是對(duì)可能病因的分析的研究進(jìn)展進(jìn)行了綜述介紹。INHERITANCE(遺傳)從遺傳方式的角度對(duì)AD1進(jìn)行了分析。DIAGNOSIS(診斷)說明的是AD1各種臨床診斷方式的研究進(jìn)展情況。采用連鎖分析(linkage analysis)的相關(guān)基因定位結(jié)果出現(xiàn)在MAPPING(定位)部分。分子遺傳學(xué)、群體遺傳學(xué)和動(dòng)物模型研究的結(jié)果則分別在MOLECULAR GENETICS(分子遺傳學(xué))、POPULATION GENETICS(群體遺傳學(xué))、ANIMAL MODEL(動(dòng)物模型)這幾個(gè)部分逐一進(jìn)行了詳細(xì)介紹。其他如歷史和參考文獻(xiàn)就不在這里贅述了。

        (7)圖5-13中左下欄“Entrez Gene”列出了Nomenclature(命名)、RefSeq(參考序列)、GenBank(GenBank核酸序列)、Protein(蛋白)、UniGene(單基因簇)等其他數(shù)據(jù)庫鏈接。下面我們以Protein庫為例說明,Protein鏈接列出了目前已知與老年癡呆有關(guān)的一些蛋白質(zhì)(圖5-14)。

        img119

        圖5-14 與老年癡呆相關(guān)的蛋白列表

        (8)打開Alpha 2macroglubulin variant[Homo sapiens](人α-Ⅱ巨球蛋白),輸出如圖5-15所示。

        默認(rèn)的顯示格式是GenPept,其他可選的格式還包括FASTA、Graphics(圖形)、GenePept(Full)、ASN.1等。右邊還有其他一些功能鍵如Download(下載)可以把各種不同格式的文件保存到本地,Save(保存)到Clipboard(剪貼板)等,而Links則列出了相關(guān)的鏈接如Blink、Related sequences(相關(guān)序列)、BioSystems(生物系統(tǒng))、Conserved domain(保守結(jié)構(gòu)域)、Domain relatives(結(jié)構(gòu)域相關(guān))、Gene(基因)、Gene genotype(基因型)、GeneView in dbSNP(單核苷酸多態(tài)性庫中的GeneView)、Nucleotide(核苷酸)、PubMed(相關(guān)文獻(xiàn))、Related Structure(相關(guān)結(jié)構(gòu))、Taxonomy(物種分類庫)等。

        img120

        圖5-15 人Alpha-2巨球蛋白突變體的GenPept格式

        (9)讓我們來仔細(xì)看看GenPept格式文件的條目,如圖5-15所示,所包含的條目的詳細(xì)信息主要包括以下內(nèi)容。

        ①Locus(位點(diǎn)信息)主要列出了蛋白序列在數(shù)據(jù)庫中的身份證號(hào)碼——Accession number(登錄號(hào):BAD92851),序列長度(1482aa,aa為氨基酸殘基),序列為linear(線性),來源于哺乳動(dòng)物(PRI,Primate的縮寫),序列的提交日期是2009年9月12日。

        ②Definition(描述)是對(duì)序列的簡單描述,事實(shí)上常常就是給出序列的完整名稱。

        ③Accession和Version分別給出序列的登錄號(hào)(Accession number)、版本號(hào)(Version)及其Gene Identifier(GI)。

        ④Source給出了序列的物種來源及其相應(yīng)的分類信息,如本例中為人(Homo sapiens),分類信息都是用拉丁語描述的,我們不必深究。

        ⑤Reference(參考文獻(xiàn))則給出了與序列相關(guān)的參考文獻(xiàn)的信息,或者期刊文章或者是其他格式的文獻(xiàn),對(duì)應(yīng)每一篇參考文獻(xiàn)有對(duì)應(yīng)的Author(作者)、Title(文獻(xiàn)標(biāo)題)、Journal(期刊)等。

        ⑥Comment給出的是序列的一些注釋信息,例如本例給出的是支持本工作的項(xiàng)目(Project)的一些信息。

        ⑦緊接著的是Feature,其給出了一些序列特征信息,例如Source(來源與其他數(shù)據(jù)庫鏈接)、Region(對(duì)應(yīng)于不同結(jié)構(gòu)或者功能域的片段以及功能等相關(guān)信息)。

        ⑧最后是從Origin(起始)開始后面的真正的蛋白序列,每60個(gè)氨基酸殘基為一行,結(jié)束后有一行結(jié)束符“//”。

        (10)接著我們?cè)賮砜纯聪嚓P(guān)的基因信息,從Links(鏈接)彈出菜單中選擇Gene(基因),就可以得到如圖5-16所示的信息。Summary(小結(jié))部分給出包括official symbol(學(xué)名)、Official Full Name(完整的學(xué)名)、Primary Source(主要來源)、Gene type(基因類型)、Organism(物種)和Summary(概括了該基因編碼蛋白的功能以及與老年癡呆癥的相關(guān)性)等信息。第二部分Genomic regions(基因組區(qū)域)、transcripts(轉(zhuǎn)錄本)和Products(產(chǎn)物)給出了基因組序列、以及轉(zhuǎn)錄RNA產(chǎn)物、蛋白翻譯產(chǎn)物的詳細(xì)信息及鏈接。后面部分則給出了更加詳細(xì)的一些關(guān)于genomic context(基因組上下游)、Bibliography(參考文獻(xiàn))、Interaction(與其他基因相互作用列表)、marker(遺傳標(biāo)記)、Homology(同源基因)、Pathway(代謝通路)等一系列的信息,這里略過,同學(xué)們有興趣的自己去閱讀。

        img121

        圖5-16 人Alpha-2巨球蛋白突變體的GenPept詳細(xì)信息

        (11)圖5-16給出的是有關(guān)A2M基因的Full Report(完整報(bào)告),但有時(shí)候我們只想要獲取其基因的結(jié)構(gòu)信息,也就是想要了解基因哪些片段是編碼蛋白質(zhì)的(也就是所謂的Coding Exon,編碼外顯子),哪些是可以轉(zhuǎn)錄為成熟RNA的(Exon,外顯子),而哪些不包含在成熟的轉(zhuǎn)錄產(chǎn)物中(intron,內(nèi)含子),這時(shí)可以用一種比較簡潔的方式來呈現(xiàn)相關(guān)的信息,這就是Gene Table(基因表)格式,選擇Display(顯示格式)后面的下拉菜單,選擇Gene Table就可以得到圖5-17的格式,繼而可以得到圖5-18的結(jié)果。

        思考題

        ①該基因包含多少個(gè)內(nèi)含子(intron),外顯子(exon)呢?

        ②是否外顯子都是編碼蛋白質(zhì)的?如果不是,哪幾個(gè)外顯子具有不編碼的部分?這些外顯子中,不編碼蛋白質(zhì)的長度分別是多少?

        img122

        圖5-17 人Alpha-2巨球蛋白突變體基因(A2M)信息

        img123

        圖5-18 人Alpha-2巨球蛋白突變體(A2M)的基因結(jié)構(gòu)信息

        ③我們都知道三聯(lián)密碼子(triplet codons),也就是說每3位核苷酸編碼一個(gè)氨基酸。那么,根據(jù)你的觀察,每個(gè)編碼蛋白質(zhì)的外顯子(coding exon)長度都是3的倍數(shù)嗎?

        2.實(shí)驗(yàn)小結(jié)

        本實(shí)驗(yàn)從廣受關(guān)注的一種常見疾病——老年癡呆癥出發(fā),介紹了諸如OMIM、GenBank等一系列位于NCBI的網(wǎng)絡(luò)數(shù)據(jù)庫資源,幫助同學(xué)們熟悉網(wǎng)絡(luò)數(shù)據(jù)庫的常用檢索方法。

        免責(zé)聲明:以上內(nèi)容源自網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵犯您的原創(chuàng)版權(quán)請(qǐng)告知,我們將盡快刪除相關(guān)內(nèi)容。

        我要反饋