周正洪組:冷凍電鏡研究蛋白組比傳統方法強在哪?
自DNA重組技術和蛋白親和純化方法問世以來,研究人員利用蛋白異源表達純化技術與X射線晶體衍射學方法解析了大量蛋白的高分辨結構,極大地豐富了我們對細胞中各種重要生命過程分子機制的認知【1】。然而這種方法需要大量高純度蛋白樣品,無法應用于異源系統表達量較低或或不易結晶的蛋白樣品,比如大的蛋白復合物。另外,由于蛋白異源表達過程涉及蛋白序列的剪切、突變及添加標簽,這種方法獲得的重組蛋白結構可能無法準確反映細胞中內源蛋白的分子作用機理。
近年來冷凍電鏡技術發展迅猛【2,3】。與傳統方法相比,冷凍電鏡單顆粒分析技術對蛋白樣品的數量和純度要求大大降低,且可獲得蛋白不同構象結構【4-8】。周正洪組進一步發現冷凍電鏡單顆粒技術可用于研究從細胞勻漿直接富集的內源蛋白樣品,從同一樣品中獲得多個內源蛋白的近原子分辨率電鏡結構。這種高通量的自下而上的結構蛋白組研究方法樣品制備流程簡單,可捕捉到蛋白在細胞內行使功能時的結構,但也產生了非常有趣且富有挑戰性的問題:這些近原子分辨率電鏡結構是什么?該如何搭建原子模型?
2019年11月25日,加州大學洛杉磯分校(UCLA)周正洪組在Nature Methods在線發表題為Bottom-up structural proteomics: cryoEM of protein complexes enriched from the cellular milieu文章,提出一種自下而上的高通量結構蛋白組研究方法。利用該方法,研究人員可直接從細胞勻漿富集多種內源性蛋白,并利用冷凍電鏡單顆粒分析技術獲得多個近原子分辨率(未知)電鏡結構。作者開發的cryoID程序可準確、高效地從數萬條候選序列中鑒別出未知電鏡結構的蛋白序列,并輔助原子模型搭建工作。作為例證作者將該方法應用于引起瘧疾的惡性瘧原蟲,獲得了多個重要蛋白復合物的近原子分辨率結構。該方法為具有挑戰性的蛋白復合物結構研究提供了新思路。
周正洪組提出從未知電鏡結構中選取高分辨率區域進行序列搭建(以下稱檢索序列),然后利用序列搜索比對方法從候選序列庫(可由蛋白樣品質譜分析獲得)中鑒別出目標蛋白序列。由于部分氨基酸側鏈形狀非常相似,僅僅根據電鏡結構側鏈密度圖進行準確的氨基酸預測與檢索序列搭建非常困難(例如天冬氨酸D和天冬酰胺N很難被區分開)。為應對這個挑戰,周正洪組根據二十種氨基酸側鏈形狀相似性將它們簡化為六個類,并使用簡化類進行檢索序列搭建與搜索。例如,天冬氨酸D和天冬酰胺N被歸為亮氨酸類(用L表示),在檢索序列搭建過程中將它們預測為亮氨酸類即可。簡化類的使用引入了容錯機制,大大提高了檢索序列的準確率。周正洪組開發的cryoID程序可自動定位未知冷凍電鏡結構中信號好的區域并搭建檢索序列原子模型供用戶查看,之后cryoID調用經優化的BLASTP程序對簡化的檢索序列和候選序列進行序列搜索比對,找到匹配的蛋白序列【9,10】。利用模擬數據和已發表電鏡結構的測試結果表明,cryoID可從上萬條候選序列(蛋白組或由質譜分析獲得的候選序列庫)中準確、高效鑒別出目標蛋白序列。
惡性瘧原蟲可引起瘧疾。使用傳統方法進行惡性瘧原蟲蛋白結構解析遭遇了極大挑戰。周正洪組將他們的結構蛋白組研究方法應用于惡性瘧原蟲,從同一樣品中獲得了三種蛋白的四個近原子分辨率結構,經cryoID鑒別是M18 aspartyl aminopeptidase,glutamine synthetase和20S proteasome兩個不同構象結構。
論文的共同第一作者是UCLA的Chi-Min Ho博士和中國科大的李曉潤博士,通訊作者是UCLA的周正洪教授。有多位來自不同學科的研究人員參與此項目。
專家點評
劉攀、王祥喜(中科院生物物理所)
冷凍電鏡技術通過近一二十年的快速發展已經成熟地用于蛋白質的結構解析。但是通過冷凍電鏡密度圖直接識別和鑒定蛋白質卻因為潛在候選蛋白的數量眾多和電鏡密度圖整體與局部的分辨率起伏變化而陷入瓶頸。文章提出了基于對細胞環境中富集蛋白質復合物的近原子分辨率的冷凍電鏡模型的自下而上的結構蛋白質的組學方法,以及開發了僅在蛋白質的冷凍電鏡密度圖信息的基礎上準確唯一識別蛋白質ID的CryoID程序。其中最為重要的最后一步主要通過近原子分辨率(3.0~4.0?)的冷凍電鏡密度模型結構與由選擇、預測、簡化和搜索四步組成的cryoID程序實現。對已存在的結構驗證證實了方法的可行性與程序的準確性。
此方法的創新性主要體現在:
1.僅需要map的信息就可以鑒定蛋白質。傳統的蛋白質鑒定方法對實驗條件要求很高,實驗周期較長,而通過冷凍電鏡map運行程序就可以實現氨基酸序列的確定和樣品的蛋白質鑒定,為解放繁雜的實驗操作提供了可能性。
2.氨基酸容錯度的引入、評價體系的合理確定與科學的參數調試極大地提高了cryoID程序對于蛋白質鑒定的準確性和廣泛性。將20種氨基酸按照其側鏈的冷凍電鏡密度相似度分成6類,并在兼顧查詢序列與候選蛋白序列的匹配效率與匹配準確度條件下,通過參數調試確定最佳的查詢序列數量和長度,從而大大縮短了匹配所需的時間。
3.為難以結構表征的蛋白質的預測和蛋白質新構象態的識別提供了潛在的工具。對于像P.falciparum這樣與醫學高度相關的病原體難以使用傳統的蛋白質重組方法進行結構表征,通過對其高分辨的冷凍電鏡密度圖來從候選池中確定蛋白質的種類無疑是一種有效的方案。同時,此方法還為多種天然構象狀態(例如,結合伴侶的變化)和生物過程的各個階段(例如,寄生蟲的生命周期)捕獲的復合物的準確鑒定打開了的大門。
但是,由于CryoID程序的蛋白質鑒定的準確性很大程度上依賴于冷凍電鏡map的分辨率,導致該方法不適用于map質量較差的蛋白質(例如柔性蛋白質的內在無序區域)的預測。然而一個好消息是,通過CryoID程序可以大大縮小候選池中蛋白質的數量。
專家點評
孫林峰(中國科學技術大學)
隨著冷凍電鏡單顆粒重構技術的發展和成熟,解析生物大分子高分辨三維結構已經變得相對容易。相比于晶體學手段,冷凍電鏡技術對樣品量和均一度的要求大幅降低,我們已經時常可以看到利用同一套電鏡數據,觀察到同一蛋白處于不同構象狀態下的結構,甚至同時解析出不同蛋白的高分辨率結構。冷凍電鏡技術的這一優勢為研究內源性生物大分子樣品的三維結構開辟了一條捷徑,特別是在細胞中豐度較高的蛋白或復合物分子。但是,目前利用單顆粒技術解析的生物大分子結構的整體分辨率大多在3埃到4埃范圍內。對于內源性純化的樣品,由于其組分復雜,時常存在一些之前未被鑒定的蛋白成員。在相對較低的分辨率下,很難單純依靠密度圖來確定未知組分的來源,并搭建完整的序列結構。
在這篇文章中,周正洪教授課題組針對這一問題提出了一套自下而上的高通量結構蛋白組學的方法,將冷凍電鏡單顆粒重構技術和質譜技術相關聯,在解析內源性蛋白結構的基礎上,利用其開發的cryoID程序,可準確、高效地從數萬條候選序列中鑒別出未知電鏡結構的蛋白序列,并輔助原子模型的搭建。將這一方法應用在惡性瘧原蟲的內源蛋白結構解析中,課題組成功獲得了多個重要蛋白復合物的近原子分辨率結構,包括兩個之前未知結構的蛋白復合物。該方法巧妙借鑒了經驗豐富的結構生物學家搭建原子模型的最初過程,先利用清晰的密度部分,根據氨基酸的側鏈特征,推測最有可能的蛋白序列,進而確定整個蛋白的序列走向。在推測蛋白序列的過程中,課題組設計了6種簡化的氨基酸模型(G/L/K/P/Y/W),對應不同側鏈形狀和大小的氨基酸,從而提供了一定的容錯空間。之后,利用推測的具有一定長度的序列,在質譜結果提供的序列數據庫中進行比對搜索,找到最可能對應的蛋白分子。
利用這套近乎全自動的前導原子模型搭建和未知蛋白組分鑒定程序,可以非常好的輔助對內源蛋白復合物的結構生物學研究,完善了冷凍電鏡模型搭建的方法軟件。利用計算機代替人腦的“推測”過程,并且與實驗數據結合,在省去大量人力勞動的同時,極大提高了組分鑒定的準確率。值得一提的是,這一方法不僅在內源富集的蛋白復合物結構研究中具有很好的應用前景,同時也適用于一些組分復雜且具有高度動態變化的大分子復合物研究中,例如在之前對剪接體(splicesosome)的研究,就從結構中發現了之前未鑒定的復合體組分。
參考文獻
1. Shi YG. A Glimpse of Structural Biology through X-Ray Crystallography. Cell. 2014;159(5):995-1014.
2. Cheng Y. Single-Particle Cryo-EM at Crystallographic Resolution. Cell. 2015;161(3):450-7.
3. Cheng Y, Glaeser RM, Nogales E. How Cryo-EM Became so Hot. Cell. 2017;171(6):1229-31.
4. Cao E, Liao M, Cheng Y, Julius D. TRPV1 structures in distinct conformations reveal activation mechanisms. Nature. 2013;504(7478):113-8.
5. Bai XC, Yan C, Yang G, Lu P, Ma D, Sun L, et al. An atomic structure of human gamma-secretase. Nature. 2015;525(7568):212-7.
6. Ho CM, Beck JR, Lai M, Cui YX, Goldberg DE, Egea PF, et al. Malaria parasite translocon structure and mechanism of effector export. Nature. 2018;561(7721):70-+.
7. Tian T, Li X, Liu Y, Wang C, Liu X, Bi G, et al. Molecular basis for CENP-N recognition of CENP-A nucleosome on the human kinetochore. Cell Res. 2018;28(3):374-8.
8. Zhang X, Zhan X, Yan C, Zhang W, Liu D, Lei J, et al. Structures of the human spliceosomes before and after release of the ligated exon. Cell Res. 2019;29(4):274-85.
9. Adams PD, Afonine PV, Bunkoczi G, Chen VB, Davis IW, Echols N, et al. PHENIX: a comprehensive Python-based system for macromolecular structure solution. Acta Crystallogr D. 2010;66:213-21.
10. Altschul SF, Gish, W., Miller, W., Myers, E.W. & Lipman, D.J. . Basic local alignment search tool. J Mol Biol. 1990;215:403-10.
-
焦點事件