介紹國外幾位生物信息學家(3)~~Gary Stormo
上一篇 /
下一篇 2011-05-23 23:27:01/ 個人分類:生物信息學家
Gary Stormo, 1950年生于美國South
Dakota州,現任Washington University in St.
Louis的遺傳學教授。Stormo進入Caltech開始學習物理學,但在低年級就轉向了生物學。雖然他的物理學只是大學水平,對物理科學和數學的堅實背景幫助他為將來的機會打下了準備。他獲得了位于Border的University
of
Colorado大學的分子生物學的博士,他主要研究興趣集中在基因調控分析上,最早利用計算機來得到調控結構單元(motif)和理解基因調控。
Stormo以研究生身份進入位于Border的University of Colorado大學,很快就對Larry
Gold實驗室中如何理解基因調控的問題產生了興趣。在他的研究生的時候,DNA的測序方法已經被發展起來,這樣他馬上就獲得了許多調控位點的大量例子,可以把它們相互比較,同時也可與他收集的突變位點進行比較。和Tom
Scheinder一起,他著手編寫了一個程序集,來對可能地數據進行各種各樣的分析。那個時代,算法和數學都用得不是很難,甚至是非常簡單的策略都是新的和有用的,他大膽地采用了一些人工智能的方法技巧來幫助理解,而最大的挑戰是在他們不得不自己做所有的事情。GenBank那時還沒有出現,所以他們不得不建立自己的數據庫,用來存儲他們的DNA序列和自己的注釋;他們甚至不得不自行輸入絕大部分的數據(這就花費了大量的錯誤檢查時間),因為在那個時代大量數據只是簡單發表在雜志上的。
作為Stormo博士論文一部分,他發展了序列譜(profile,又叫位置加權矩陣,position weight
matrix)作為比共有序列(Consensus)表征調控位點的一種更好的表示,發表了根據可用數據的不同類型和不同用途的一些相應的方法來得到序列譜。不僅如此,他還尋找了一類問題的解決方法:給定一些DNA序列的樣本,在其中的未知位置上具有一些調控位點,發現這些位點的序列譜矩陣的問題現在稱之為尋找序列譜問題(Motif
Finding Problem)。幾年以前,Michael
Waterman已經發表了一個從一群DNA序列的樣本中發現共有序列的算法,Stormo試圖用序列譜的方式重復同樣的事情。這個問題本來就有兩個方面:怎樣在沒有檢查所有的聯配時,找到正確的調控位點之間的匹配?怎樣評價在不同的匹配,選擇最好的?對于評價這一步,他用了Tom
Scheinder博士論文中基于熵的信息學方法進行度量,因為它具有很好的統計學特性,他們證明在一些簡化了的假設條件下,熵的方法可以直接對應于蛋白質在這些位點的綁定能量。這個回顧似乎毫無意義,可在那個時代,想出這個方法卻花費了他們相當大的努力,這個方法被用在貪婪法的CONSENSIS程序中。
Stormo相信這主意會起作用,如他所想,事實正是如此:只要問題不是太難,從背景中凸顯的模式就含有足量有效信息的內容。他知道這是一個非常有用的工具,雖然那時沒有人能預料DNA陣列將使得它更為有用(這種實驗可以更容易的推斷出共調控的基因以選擇好的樣本)。當然,真實的這樣的數據含有更大的噪聲,因此算法必須改得具有更大的魯棒性。
在Stormo得到了他的博士學位之后,與他的指導者在Universit of Oregon的Larry Gold 和Pete
von
Hippel在合作項目中的工作,使他獲得了最令人振奮的科研經驗。Gold的小組以前研究T4噬菌體的基因,名叫32(它參與基因復制、重組和修復),已證明了它參與調控自己的轉錄水平的合成。Von
Hippel的小組已經可以測量蛋白質綁定的參數,另一個小組剛剛測序了這個基因的序列和他的調控區域。通過整合序列分析和蛋白質的綁定參數,包括與其它序列進行比較,他們可以提供在基因調控中蛋白質活動的模型。一些年以后,Stormo開始幫助在兩個較近的噬菌體T2和T6中,通過比較調控區域填補了更為詳細模型的細節:研究顯示有一個保守的假節(pseudoknot)結構在成核作用位點對自發綁定起作用。Stomo說:
“這個結果非常令人滿意,這是由于該問題的多個不同的方面,從生物物理的度量到遺傳學,再到序列分析,集中到一起描述了一個真正有趣的基因調控的例子。”
科學發現可以從多種途徑得到,最重要的事要時時準備好。一些人將找到一類特殊的問題,并努力研究它,把所有的工具都用上,甚至發明新的工具來試圖解決它。另一種途徑是找到不同問題之間的聯系,或者把一個領域中的方法應用到另一個領域的問題中。Gary認為雖然集中地努力研究一個特定的問題也很重要,而這種跨學科間的策略在生物信息中特別有用。他的研究總是根據他的興趣很快從起始的問題焦點容易地轉到別的地方。他覺得如果他是沿著一條更連續的工作路線,可能會在某個特定的領域作出更大的貢獻,但是他非常喜歡廣泛的閱讀,為他可以作出貢獻的問題進行工作,即使這些問題不是他主要的研究領域。
“我認為雖然基因表達調控作為一個重要的問題有顯著性的進展已經做出了,但對它的研究將持續很長的時間,這由于在調控因子和被調控的基因間還有許多沒有探明的關系。加之大量的基因調控發生在轉錄后時期,在系統的道路上,我們僅僅開始了第一步。問題中主要的挑戰是以能真正理解整個的調控網絡為主要目標。我也認為進化生物學將成為一個發展的重要課題,可以來更深入理解地球上生物的多樣性。”
導入論壇收藏
分享給好友
推薦到圈子
管理
舉報
TAG: