Cell:研究復雜蛋白質組的新方法
上一篇 /
下一篇 2010-10-15 16:20:25/ 個人分類:proteomics
(轉自生物通)來自英國愛丁堡大學Wellcome Trust細胞生物學中心、牛津大學和日本國立遺傳學研究員的研究人員開發出一種方法,簡化了有絲分裂染色體組分的鑒定和功能分類。這種定性兼定量的實驗方案可應用于復雜的蛋白數據組,以鑒定出功能關系,并指導未來的蛋白質組學研究。文章發表在9月3日的《Cell》雜志上。
盡管研究了很多年,但有絲分裂染色體結構及組成仍然未能清楚地鑒定。蘇格蘭的William C. Earnshaw和Juri Rappsilber以及日本的Tatsuo Fukagawa聯合了他們三個實驗室的優勢和資源,創建出多分類組合蛋白質組學(multiclassifier combinatorial proteomics,MCCP)方法,這是一種分析蛋白質組功能關系的統計方法。利用Earnshaw實驗室在染色體研究上的豐富經驗,研究小組采用Rappsilber 實驗室使用的SILAC及質譜成像技術,通過與野生型和突變染色體的比較,收集了6個不同分類的數據,獲得了大約4000個有絲分裂染色體相關蛋白的清單。
通過一種機器學習方法-Random Forest(RF)整合這些分類,他們在完整染色體的背景下揭開了蛋白復合物之間的功能關系,并找到約560個未鑒定的蛋白,值得進一步研究。Random Forest分析將染色體蛋白與非染色體蛋白和目標蛋白分開。Earnshaw表示:“它能讓你在有缺失值的情況下繼續工作,這一點很關鍵。如果蛋白被一個或另一個分類漏掉—這種情況是可能的—計算不會中斷。”RF分析所產生的數據預測出新的目標蛋白,并充當未來染色體蛋白質組研究的路標。
實際上,在34個GFP標記的預測染色體蛋白中,30個是染色體的,包括13個與著絲粒相關。而在16個GFP標記的預測非染色體蛋白中,14個被證實是非染色體的。
這種方法的優勢在于,它能夠確定一個不能純化的復雜細胞器中的蛋白組成,并結合遺傳學和蛋白質組學來研究全部染色體中的復合物。機器學習的使用揭開了蛋白之間的功能關系。
盡管他們只研究了染色體蛋白,但Earnshaw強調這個MCCP方法很靈活,可用于研究任何的蛋白質。“你任何時候都能用,如果你有一個復雜的數據組,其中一些是真的,另一些可能是污染或不是真的,我們的方法能幫你分類。”
導入論壇收藏
分享給好友
推薦到圈子
管理
舉報
TAG: