轉載
蛋白質組學(proteomics)是產生于20世紀90年代中期的一門新興學科,以細胞內全部蛋白質的存在及其活動方式為研究對象,是后基因組時代生命科學研究的核心內容。蛋白質組學的產生與發展經歷了一個漫長的過程,在這個過程中,研究者不斷修正蛋白質組學的發展方向和推進蛋白質組學相關支撐技術的快速發展,進而拓展蛋白質組學在整個生命科學和生物醫學研究中的應用,迅速成為后基因組時代重要的研究領域。以下就蛋白質組學研究的歷史與背景、核心內容、支撐技術、應用和發展趨勢予以介紹。
1. 蛋白質組學研究的歷史與背景
蛋白質組(
proteome)一詞,源于蛋白質(PROTEin)與基因組(genOME)兩個詞的結合,是由澳大利亞Macquarie大學的兩位科學家Wilkins和Williams于1994年在意大利Siena召開的第一次國際蛋白質組學專題研討會上提出的,是指細胞內所表達的全套蛋白質,后引申為一種基因組全部蛋白質的存在及其活動方式。雖然第一次提出蛋白質組概念是在1994年,但相關研究可以追溯到上世紀90年代中期甚至更早,尤其是80年代初,在基因組計劃提出之前,就有人提出過類似的蛋白質組計劃,當時稱為Human
Protein
Index計劃,旨在分析細胞內的所有蛋白質。但由于種種原因,這一計劃被擱淺。90年代初期,各種技術已比較成熟,在這樣的背景下,經過各國科學家的討論,才提出蛋白質組這一概念。
蛋白質組學最初的提出可以理解為基因組學的延續,主要基于人類基因組測序完成,生命科學研究進入后基因組學,也就是功能基因組學時代的大背景。這是因為2001年人類基因組框架圖的發表使大眾對科學家將揭示人類的遺傳奧秘充滿了幻想和信心。但是,真實的圖景遠不像普通人想象的那樣簡單。在所有完成測序的基因組中,通常有一半以上基因的功能是未知的。早期功能基因組中所采用的策略,如基因芯片、基因表達序列分析(Serial
Analysis of Gene Expression,
SAGE)等,都是從細胞中mRNA的角度來考慮的,其前提是細胞中mRNA的水平反映了蛋白質表達的水平。但事實并不完全如此,從mRNA角度考慮,實際上僅包括了轉錄水平調控,并不能全面代表蛋白質表達水平。蛋白質復雜的翻譯后修飾、蛋白質的亞細胞定位或遷移、蛋白質和蛋白質相互作用等則幾乎無法從mRNA水平來判斷。毋庸置疑,蛋白質是生理功能的執行者,是生命現象的直接體現者,對蛋白質結構和功能的研究將直接闡明生命在生理或病理條件下的變化機制。蛋白質本身的存在形式和活動規律,如翻譯后修飾、蛋白質間相互作用以及蛋白質構象等問題,仍依賴于直接對蛋白質的研究來解決。雖然蛋白質的可變性和多樣性等特殊性質導致了蛋白質研究技術遠遠比核酸技術要復雜和困難得多,但正是這些特性參與和影響著整個生命過程。
另一方面,傳統的對單個蛋白質進行研究的方式已經無法滿足后基因組時代的要求,這是因為:(1)
生命現象的發生往往是多因素影響的,必然涉及到多個蛋白質。(2) 多個蛋白質的參與是交織成網絡的,或平行發生,或呈級聯因果。(3)
在執行生理功能時蛋白質的表現是多樣的、動態的,并不象基因組那樣基本固定不變。因此要對生命的復雜活動有全面和深入的認識,必然要在整體、動態、網絡的水平上對蛋白質進行研究。
蛋白質組產生至今,其研究進展十分迅速,不論基礎理論還是技術方法,都在不斷進步和完善。相當多種細胞的蛋白質組數據庫已經建立,相應的國際互聯網站也層出不窮。1996年,澳大利亞建立了世界上第一個蛋白質組研究中心:Australia
Proteome Analysis Facility ( APAF
)。丹麥、加拿大、
日本也先后成立了蛋白質組研究中心。在
美國,各大藥廠和公司在巨大財力的支持下,也紛紛加入蛋白質組的研究陣容。去年在瑞士成立的GeneProt公司,是由以蛋白質組數據庫“SWISSPROT”
著稱的蛋白質組研究人員成立的,以應用蛋白質組技術開發新藥物靶標為目的,建立了配備有上百臺
質譜儀的高通量技術平臺。而當年提出Human Protein Index
的美國科學家Norman G.
Anderson也成立了類似的蛋白質組學公司,繼續其多年未實現的夢想。2001年4月,在美國成立了國際人類蛋白質組研究組織(Human Proteome
Organization, HUPO),隨后歐洲、亞太地區都成立了區域性蛋白質組研究組織,試圖通過合作的方式,融合各方面的力量,完成人類蛋白質組計劃(Human
Proteome Project),并在2002年和2003年陸續啟動了人類血漿,肝和腦的蛋白質組研究國際合作計劃(見www.hupo.org)。
2. 蛋白質組學研究的策略和核心內容
早期蛋白質組學的研究沿襲了基因組學的研究思路,出現了稱為“竭澤法”的研究策略,即采用高通量的蛋白質組研究技術分析生物體內盡可能多乃至接近所有的蛋白質,即蛋白質的表達模式(Expression
Profile),這種觀點從大規模、系統性的角度看待蛋白質組學,也更符合蛋白質組學的本質。但是由于由于同一基因組在不同的細胞、不同的生理條件甚至不同的
環境的影響下,其蛋白質的存在狀態也不相同,因此,蛋白質組是動態變化的,包括蛋白質的動態表達(表達與降解)、動態定位(不同亞細胞定位)、動態修飾(可逆翻譯后修飾)、動態相互作用(蛋白質復合物的聚合與解聚)等,于是,另一種策略應運而生,即“功能法”,
旨在研究不同狀態細胞蛋白質組成、定位和修飾等的變化,如蛋白質在不同環境下的差異表、差異定位和差異修飾,以發現有差異的蛋白質種類或者形式作為主要目標。目前后一種,即蛋白質的動態變化研究,已經成為蛋白質組學研究的核心內容。
3. 蛋白質組學研究的支撐技術
蛋白質組學的發展和其技術的發展是緊密聯系并相互作用的,一方面蛋白質組學的發展依靠技術進步的推動,另一方面蛋白質組學研究本身反過來又促進了技術的突破。
蛋白質組研究技術可以簡單的分為兩大類。第一類是蛋白質組的分離技術。如雙向凝膠電泳技術,細胞分級分離技術、親和層析技術等。第二類是蛋白質組的鑒定技術,其核心是質譜技術。質譜鑒定技術面臨的一個最大問題是,它要依賴于已知的蛋白質或基因的序列作為
檢測的基礎,通過比較來確定待測定的蛋白質。對于在已有數據庫中沒有記載的全新蛋白質進行鑒定則非常困難,對于這種蛋白質,一般是利用經典的Edman降解法進行N端序列測定或C端化學降解法測定C端序列,即
“從頭測定”(De Novo Identification)從而得到未知蛋白質的信息。
隨著蛋白質組學的不斷發展,蛋白質組學還建立了一系列基于凝膠和基于質譜的定量技術,以適應越來越深入的功能蛋白質組學研究和蛋白質動態定位的研究。
此外,伴隨著蛋白質組學研究通量的不斷擴大,其所產生的數據規模也不斷增長,因此以生物信息學為支柱的蛋白質組數據采集、存貯、分析處理與可視化技術也不斷發展和完善。
4. 蛋白質組學在各個領域的應用
在基礎研究方面,蛋白質組研究技術已被應用到各種生命科學領域,如細胞生物學、神經生物學等。在研究對象上,覆蓋了原核
微生物、真核微生物、植物和動物等范圍,涉及到各種重要的生物學現象,如信號轉導、細胞分化、蛋白質折疊等等。在未來的發展中,蛋白質組學的研究領域將更加廣泛。
在應用研究方面,蛋白質組學將成為尋找疾病分子標記和藥物靶標最有效的方法之一。在對
癌癥、早老性癡呆等人類重大疾病的
臨床診斷和治療方面蛋白質組技術也有十分誘人的前景,目前國際上許多大型藥物公司正投入大量的人力和物力進行蛋白質組學方面的應用性研究。
5. 蛋白質組學的發展趨勢
蛋白質組學具有廣闊的研究前景,同時也面臨著巨大的挑戰,其廣闊的研究前景在于對復雜生物系統的理解,以及由此帶來的產品和技術的進步;其巨大的挑戰在于要對極其微量卻又不計其數的蛋白質進行分離、識別、表征和定量測定。目前科學家發現,現有的技術只能分析和鑒定約1/3的高豐度和中豐度的蛋白質,低豐度蛋白質的分級及鑒定仍然是一個艱巨的前沿研究任務。因此,今后幾年對于蛋白質復雜體系分級及鑒定方法的研究將是蛋白質組學研究的一個重要內容。
在技術發展方面,蛋白質組學的研究方法將出現多種技術并存,各有優勢和局限的特點,而難以象基因組研究一樣形成比較一致的方法。除了發展新方法外,更強調各種方法間的整合和互補,以適應不同蛋白質的不同特征。另外,蛋白質組學與其他學科的交叉也將日益顯著和重要,這種交叉是新技術新方法的活水之源,更重要的是,蛋白質組學與其他大規模科學如基因組學,生物信息學等領域的交叉,所呈現出的系統生物學(Systems
Biology)研究模式,將成為未來生命科學最令人激動的新前沿。