真核生物基因組-4
(2) 苯丙酮尿癥
苯丙酮尿癥(PKU)的病因是患者肝細胞缺乏苯丙氨酸羥化酶,使體內的苯丙氨酸不能正常代謝為酪氨酸,導致血清中苯丙酮酸濃度升高。現已知苯丙氨酸羥化酶基因定位于12q24.1,此基因全長約90kb,含13個外顯子,在中國人中已發現10余種點突變,這是造成酶活性缺乏的原因。
2.多基因病
(1) 原發性高血壓
原發性高血壓的致病基因及相關基因尚不明確。高血壓候選基因有150多個,血管緊張素轉換酶(angiotensin-converting
enzyme,ACE)、血管緊張素原、內皮素、β2腎上腺素受體(β2-adrenergic
receptor)、G蛋白鳥嘌呤核苷結合蛋白β3亞基基因最有可能成為高血壓相關基因。ACE基因定位于染色體17q23,有26個外顯子和25個內含子,全長約21kb,在16號內含子內存在插入(I)和缺失(D)兩種變異體。人類ACE基因型與血清ACE的活性有關:DD>DI>II,ACE基因的插入/缺失多態性與動脈粥樣硬化性心血管疾病、心肌肥厚和再狹窄有一定的相關性。
(2) 糖尿病
糖尿病是一種具有明顯遺傳傾向的多基因疾病,根據發病機制,可分為Ⅰ型、Ⅱ型、和妊娠型糖尿病。
Ⅰ型糖尿病(Ⅰ-DM)遺傳背景研究早期主要集中在人類白細胞抗原(HLA)和易感性和抗性位點上。在Ⅰ-DM
患者中,HLA-Ⅰ類抗原中B15、B8、B18出現頻率明顯增加,而B7出現頻率顯著下降。HLA-Ⅱ類抗原中DQα52位精氨酸為Ⅰ-DM的易感受性位點,而DQβ57天冬氨酸為Ⅰ-DM的抗性位點。近年來采用微衛星熒光標記半自動全基因組掃描技術,陸續發現許多位點與1-DM相關,如IDDM1:6p21;IDDM2:11p15;IDDM3:15q26;IDDM4:11p13;IDDM5:6q25;等等。
Ⅱ型糖尿病(Ⅱ-DM)的遺傳缺陷包括:胰島素基因點突變、胰島素受體前缺陷、胰島素受體缺陷、胰島素受體后及信號傳導系統缺陷、胰島素作用的靶組織的遺傳缺陷,等等。現已知的2-DM易感基因位點有:D2S125(位于2q37)、D12S1349(位于12號染色體)、D20S197(位于20q),等等。
三、端粒與端粒酶
1930’,著名的遺傳學家 B.Mcclintock
和HJ.Müller發現,真核細胞的染色體末端存在著一種由DNA片段和蛋白組成的獨特的結構,這種結構對維持染色體的穩定性具有重要的作用,失去了這些片段,染色體就會互相粘連到一塊,發生結構及功能上的改變,從而影響到細胞的分裂與生長,這一結構定義為端粒(telomere)。
人及其它脊椎動物中是以5’TTAGGG 3’為單位進行重復,其它物種可有5~8bp的長度。重復的次數(n)也因物種而異,由幾十到數千不等。
端粒的主要作用是:維持染色體的穩定性,防止染色體的重組及末端被降解。最近的一些研究表明,端粒還能保證細胞在有絲分裂時染色體準確地分離,在減數分裂時保證染色體的成對及運動。端粒的另一個重要作用是它在細胞生長中的作用。
端粒酶是一種核糖蛋白酶,具有逆轉錄酶活性。人端粒酶分子有三個主要的組分,人端粒酶RNA(human telomerase
RNA,hTR)、人端粒酶相關蛋白(telomerase-associated
protein,TP1/TLP1)和人端粒酶催化蛋白亞單位(the catalytic protein subunit of
telomerase,hTERT)。
細胞內端粒酶活性的缺失導致端粒縮短,端粒隨細胞分裂每次丟失50~200個堿基,
端粒一旦縮短到短于某個“關鍵長度”時,就很有可能導致染色體雙鏈斷裂,并激活細胞自身的檢驗系統,使細胞進入M1期死亡狀態;隨著端粒的進一步丟失,發生染色體重排,結果導致了無著絲粒染色體和非整倍體染色體的形成等,使細胞進入M2期死亡狀態。因此,細胞要維持其正常分裂,就必須激活端粒酶,阻止端粒的進一步丟失,否則,細胞不能進行染色體的正常復制,所以只有重新獲得端粒酶活性的細胞,才能繼續生存下去。對于那些無法激活端粒酶活性的細胞,即無法阻止端粒的進一步丟失,細胞只能面臨趨向衰老。
第三節 人類基因組與人類基因組計劃
一、人類基因組
人類基因組包括細胞核內的核基因組和細胞質內的線粒體基因組。核基因組由3.16×10 9 bp
組成,線粒體基因組由16569bp組成。正常體細胞(二倍體)基因組包括二個核基因組和多個線粒體基因組。核基因組包含在22條常染色體和X、Y性染色體內,每條染色體大小不等。
人類基因組的組織特點為:①功能相似或相關的基因常常散在分布于不同的染色體上(爾偶聚集在一起);②基因組中各個基因的大小和內部組織的差異極大;③各個基因的大小差異很大,從數百個bp、幾個kb到數百個kb不等;④基因組含重復序列,重復序列大多為非編碼的,與編碼序列相間排列,以此來分散結構基因;⑤每個結構基因都有單獨的調控序列。
人類基因組中,存在著大量的非編碼序列,如前述的高度重復順序、內含子、間隔區DNA等。這些序列中,只有很小一部份具有重要的調節功能,絕大部分都沒有什么特殊功用。在這些DNA序列中雖然積累了大量缺失,重復或其他突變,但對生物并沒有什么影響,它們的功能似乎只是自身復制,因此將這類DNA稱為自私DNA(selfish
DNA)或寄生DNA(parasite DNA)。自私DNA也許有重要的功能,只是目前我們對其功能還未了解而已。
二、人類基因組計劃
HGP的基本任務可用4張圖譜來概括,即遺傳圖譜、物理圖譜、序列圖譜和基因圖譜。
1.遺傳圖譜
遺傳圖又稱連鎖圖。即在基因組中尋找可以表明基因之間位置關系的遺傳標記。
第一代標記是經典的遺傳標記,最初主要是利用蛋白質和免疫學的標記,如ABO血型位點標記、HLA位點標記。70年代中后期建立起來的限制性片段長度多態性(RFLP)方法在整個基因組中確定的位點數目達到105以上,該系統一經建立就廣泛應用到基因組的研究中。RFLP最成功的運用是在Hungtington舞蹈癥的基因定位。然而,RFLP可提供的信息量很有限,并且有時還需用放射性同位素標記的DNA片段為探針檢測RFLP,因而又存在著工作環境和費用等問題。
第二代標記稱“小衛星中心”(minisatellite core)和“微衛星標記”(microsatellite marker),這一系統是目前在基因定位的研究中應用最多的標記系統。
STR的遺傳學圖距是以cM(厘摩爾根)為單位的,反映基因遺傳效應的基因組圖。STR作為遺傳標記使人類基因組的遺傳制圖與連鎖分析發生了革命性的變化。
第三代標記是稱作單核苷酸多態性標記(single nucleotide
polymorphism,SNP)的遺傳標記系統。人類群體有很大的遺傳多樣性,由這種方式產生的單堿基變異就形成許多雙等位型標記。這種標記在人類基因組中可達到300萬個,平均每1000個堿基對就有一個。因此,3~4個相鄰的這種標記構成的單倍型(haplotype)就可以有8~16種,相當于一個微衛星標記形成的多態性。
2.物理圖譜
完整的物理圖應包括人類基因組的不同載體DNA克隆片段重疊群圖,大片段限制性內切酶切點圖,DNA片段(探針)或一段特異DNA序列(STS)的路標圖,以及基因組中廣泛存在的特征性序列等的標記圖,人類基因組的細胞遺傳學圖,最終在分子水平上與序列圖的統一。
以STS位路標的物理圖與已建的遺傳圖進行對比,可以把遺傳學信息和物理信息進行互相轉換(如某一
區域1cM的遺傳間距可以粗略的“折算”成某一區域1cM的物理間距)。片段重疊群則為研究該區域提供了可以操作的基因組材料,及相互重疊、覆蓋這一區域的DNA片段,可以在這一區域尋找某一基因或進行這一區域基因組的研究。而作為人類基因組物理圖的組成部分的最基本層次的“細胞遺傳圖”是統一物理圖與遺傳圖的根本之圖。
3.序列圖譜
人類基因組計劃最初的目標是要在15年內完成測定總長度由30億個核苷酸組成的人類基因組的序列圖。目前的策略是把龐大的基因組分成若干有路標的區域后,進行測序分析。
4.基因圖譜
在人類基因組中鑒別出占據2%~5%長度的全部基因的位置、結構與功能。涉及辦法很多,但最主要的是通過基因的表達產物mRNA反追到染色體的位置,其原理是:所有生物性狀和疾病都是由結構或功能蛋白質決定的,而已知的所有蛋白質都是由RNA聚合酶指導合成的帶有多聚A尾巴的mRNA編碼的,這樣就可以把mRNA通過反轉錄酶合成cDNA或稱作EST的部分cDNA片段,然后,再用這種較穩定的cDNA或EST作為“探針”進行分子雜交,鑒別出與轉錄有關的基因。
(三) 人類基因組計劃的延伸——后基因組計劃
功能基因組學延伸的內容有:人類基因組多樣性計劃、環境基因組學、腫瘤基因組解剖學計劃及藥物基因組學等。其核心問題一般包括:基因組多樣性、遺傳疾病產生的起因、基因的表達調控的協調作用以及蛋白質產物的功能等。模式生物體在研究功能基因組學中將起到重要的工具作用。此外,HGP及其延伸內容決定性的成功取決于生物信息學和計算機生物學的發展和應用,主要體現在數據庫對數據的儲存能力和分析工具的開發。這些都將成為人類基因組計劃延伸篇中的主要內容。