扒一扒進口基因測序儀中的一朵“奇葩”
? ?本文由原創作者 矮小森?授權?分析測試百科網發表,從中我們可以聞到NGS戰場上的硝煙,感受到科學奇才們的大膽創意和持續的斗志。
? ?說起基因測序儀,很多人都會第一時間想起進口的品牌和產品。這沒辦法,因為目前能夠有自主知識產權和生產能力的國內制造廠家,僅有華大基因、華因康和真邁生物等不多的幾家;后兩家離大規模銷售也還有一段距離。從市場占有率來看,目前只有華大是能夠勉強正面和進口品牌抗衡,這就是現實的情況。
? ?進口品牌有這么多,從 illumina (原 SolexaTM,NGS 高通量測序技術)和?ThermoFisher(原 ion torrentTM,NGS 高通量測序技術,這里不是指 ABI 的毛細管電泳一代測序技術),到 Nanopore (第三代納米孔技術)和 Pacific biosciences(簡稱 Pacbio,三代單分子測序技術)等等,他們都牢牢占據了很多用戶心中的高大上的進口產品的地位。筆者認為其中有一朵“奇葩”,今天我們來帶大家好好扒一扒。
? ?說起這朵“奇葩”(詞典的原意是“奇特而美麗的花朵”),筆者在這里沒有一絲絲的貶義。因為它是在高通量基因測序儀新時代三國爭霸中的三強之一1;它最早源于 2010 年在美國商品化的 ion torrentTM 的產品,采用了電信號檢測原理,理論上靈敏度要優于基于熒光光學檢測的測序技術;而且其測序方法和另外兩家主流的 NGS 廠家也都不太一樣,理論上讀長也有更長的可能(因無熒光干擾)。
? ?說到這里,大家應該都能猜到,說的就是基于“半導體測序法”的高通量測序儀,目前是在ThermoFisher(賽默飛世爾)旗下。因為這是ThermoFisher在 2014 年收購?Life technology公司所獲得的產品,所以在下文中,筆者把這一類商品化測序儀,均統稱為“life 測序儀”。在售的型號包括 PGM (personal genome machine,2010 年發布),ion Proton(2012 年發布),ion S5 系列 (2015 年發布)以及最新的 Genexus 系統(2019 年發布)等。
那咱就從 life 測序儀的緣起說起。
? ?2005 年,羅氏 454 測序儀,一款基于“焦磷酸測序法”的高通量測序儀,開創了二代高通量測序儀的先河。但是由于各種原因造成這一技術在市場上慢慢邊緣化,沒有太多競爭力。
? ?2013 年10 月,羅氏宣布逐步淘汰該項業務2。而這一技術的創始人,喬納森·羅森博格(Jonathan Rothberg),其實是在 2007 年就把技術賣給了羅氏,華麗轉身、另立山頭,也是在 2007 年用自己的積蓄,開創了 ion torrent 的新天地(羅氏心里會不會...)。在 3 年后的 2010 年 2 月,羅大神就幫助 ion torrent 推出了世界上第一臺基于半導體測序法的測序儀,型號為 personal genome machine (PGM)。PGM 當時是世界上體積最小、檢測成本最低的上市產品。可能,這就是革自己的命吧......
網絡圖片: 羅森博格和 PGM
下面請看看半導體測序法的原理3:
? ?“利用 Ion Torrent?技術在半導體芯片上直接將化學編碼的信息 (A,C,G,T) 轉換為數字信息 (0,1)。此方法將簡單的化學試劑與ZL半導體技術相結合——就像沃森遇到摩爾。該測序技術較其它技術更簡單、快速、經濟高效且擴展性更佳。半導體已經改變了它所觸及的每一個行業。微處理器實現了臺式計算,半導體技術推動了測序大眾化,使任何實驗室或臨床都能夠使用。
? ?在自然界中,當聚合酶將一個核苷酸加入 DNA 鏈時,一個氫離子會作為副產物釋放。
? ?如果 DNA 鏈上有兩個相同的堿基,則電壓會加倍,芯片將記錄兩個相同的堿基。由于該過程是直接檢測(沒有掃描、沒有相機、沒有光線),因此每個核苷酸的摻入會在幾秒鐘內被記錄下來。
? ?以下是該技術檢測堿基的方法:如果將一個核苷酸(例如 C)添加至 DNA 模板中然后整合入 DNA 鏈,則將會釋放一個氫離子。來自該離子的電荷將改變溶液的 pH 值,這可通過我們專有的離子傳感器檢測到。
? ?我們的測序儀(基本上是世界上最小的固態 pH 計)則會檢測到該堿基,直接從化學信息轉化為數字信息。
? ?然后,Ion Personal Genome Machine? (PGM?) 測序儀令核苷酸逐個依次流過芯片。如果流過芯片的下一個核苷酸不匹配,則不會檢測到電壓變化,也就不會檢測到堿基。”
來個“說人話”的版本:
半導體測序法實際上檢測的就是電信號,即通過酶催化生化反應添加堿基后釋放的質子引起了電信號的變化。因為在添加不同種類的堿基或不數量的堿基時,釋放的質子所產生的電信號不同,所以可以通過識別電信號來識別堿基(base calling)。
? ?根據維基百科里面 “Ion semiconductor sequencing” 詞條的解釋,半導體測序法的優點包括:讀取堿基速度快(ion torrent 號稱一小時讀取 100-200 個堿基)、成本較低、無需光學測量系統等。而局限之處包括:
長重復堿基序列容易讀錯,比如對于 AAAAAAA 和 AAAAAAAA,那就不好區分;
讀長不夠長,實際上半導體測序法可做到 400 堿基/read,對比其他兩家 NGS 廠家,還算是可以的,只是比 Sanger 一代測序技術和三代測序技術差一些而已;
測試通量不夠高,目前其測試通量確實是低于另外兩家 NGS 廠家的測序儀平臺。
? ?另外,在筆者的傳統分析化學的認知世界里,同樣物質的量因電化學反應產生的電信號更容易被物理元器件所感知,相對于一般的光學信號來說(可以想想你實驗室里的 pH 電極和分光光度計)。所以筆者大膽猜測,理論上“life 測序儀”,它的靈敏度要好于基于熒光標記技術的 illumina 和華大的高通量測序儀。但事實是不是就是這樣呢?
? ?啪啪啪的打臉聲不絕于耳......筆者做了一番搜索,好像基于目前的文章和網絡信息看來,并沒有什么直接的證據可以證明,“life 測序儀”和其他 NGS 測序儀相比,在靈敏度這方面沒有優勢。而事實上,在某些比較關鍵的數據質量指標比較中,例如 Q30(可以簡單粗暴地理解為錯誤率在 0.1%的堿基占比)的比較,“life 測序儀”因長讀長的“天生”表現,確實要比另外兩家 NGS 廠家的數據要差。
? ?在下面2014年發表在期刊 Applied Environtal Microbiology 的 同 行 評 議 文 章“Performance Comparison of Illumina and Ion Torrent Next-Generation Sequencing Platforms for 16S rRNA-Based Bacterial Community Profiling”,作者比較了 illumina 的 MiSeq 和 ion torrent 的 PGM 兩個測序系統(當年兩家的主動機型),發現:
“Consistent with previous reports (7,–9), we found that the error rate of Ion Torrent sequencing (averages of 1.5 and 1.4 errors per 100 bases for read sequences from the forward and reverse directions, respectively) was higher than that for equivalent Illumina libraries (average of 0.9 errors per 100 bases).”。翻譯過來就是“(在當時的實驗條件下,)ion torrent 的測序數據錯誤率比 illumina 測序平臺的錯誤率要高”。
? ?這也就難怪,雖然兩者出現年代很接近,但同為進口測序儀品牌的 life 測序儀會目前遠遠落后 illumina 幾個身位了。
為何會出現這種市場結果,筆者嘗試從技術發展的角度分(nao)析(bu)一下可能的原因:
1 雖然兩者初始推出時期很接近,但 illumina 的 solexa 比 life 的 ion torrent 還是要早一些(2006 vs 2007)。更早的系統發布積累更多的用戶,加上很多早期的測序儀用戶是生物學家也比較熟悉熒光的系統,所以這半個身位的差距,在不斷發展過程中被逐漸放大。
2 從技術角度來講,長讀長的劣勢、數據質量、通量不夠高等問題,確實也讓 life 測序儀在目前 NGS 測序儀三國爭霸中慢慢往第三位靠近。前面提過長讀長和數據質量的問題,下面看看通量方面的數據。請看下面兩個圖,分別是用于 PGM,ion Proton 測序儀和 ion S5 系列測序儀的芯片參數。由下圖可知:
A. 對 PGM 測序儀,下機數據從 30Mb~2Gb;對于 ion Proton,下機數據為最大 10Gb;對于S5 來說,單次下機最大 25Gb。life 測序儀的整體是在向好的方向進步,但是有點“跟不上形勢”。有興趣的同志可以自行去了解一下 illumina 和華大目前臺式 NGS 測序儀的下機數據是什么一個情況。
B. 半導體測序的測序儀在單位時間產出也沒有很多優勢。畢竟半導體測序法主打的是快,那么我們算一下單位時間的數據產出吧。拿數據通量最大的 S5 來計算,可知每小時最多在2.5~3.0Gb/hour 的水平(假設就用 ion S5 prime 系統來做,如果是 ion proton,那就是2.5Gb/hour)。這個,看起來也不算很高。我們拿華大的兩個臺式 NGS 的數據來比一下,MGISEQ-200 和 MGISEQ-2000 分別可以達到 最高 3.0Gb/hour 和 6.0Gb/hour 的水平。如果我們把測序儀看作是“生命科學計算機”的話,那這個測序單位時間產出,就有點像“生命科學計算機的內存”參數了。所以...
C. 芯片上的最大 reads 數多在幾~幾十 millions 的范圍,這跟其余兩家 NGS 廠家來比,單芯片密度確實是要低一些,這也解釋了上面的“為什么半導體測序法單位時間產出優勢不足”。這可能是因為芯片制作工藝已經到了極限,無法進一步拓展(此點筆者無法確認,請知情人士交流一下,謝謝)。
3 從公司發展角度來講,NGS 新時代三國爭霸中,illumina 和華大都是傳統的基因公司,整個公司的資源和研發能力、人力物力都是在往測序業務這一塊 all-in 的。而收購了 ion torrent的 life technology,在 2015 年找了個好娘家 ThermoFisher,實力看起來更雄厚了呢。但后面life 測序儀的發展,也沒有給大家帶來很多亮眼的操作。這也可能是因為這是ThermoFisher的一貫的作風,請看看ThermoFisher近十幾二十年的基本操作:善于資本運作和收購的Thermo,先是“蛇吞象”地并購了Fisher,成為了 ThermoFisher;而后它吸收了眾多有名的牌子,如 Finnigan 的質譜、尼高力的紅外、戴安的離子色譜、FEI & 飛納的電鏡等(僅僅列舉部分有名的科學儀器,其他各種品牌數不勝數);到了最后用戶只知道有個賽默飛,而把原來的品牌給忘了。
? ?為了更進一步開拓中國市場,life 測序儀的商業團隊也在中國市場上尋找了一些小伙伴,如達安基因(型號 DA8600,國械注準 20143401961)、博奧生物(型號 BioelectronSeq4000,國械注準 20153400309)、重慶泛生子(型號 GENETRON S5:國械注準 20193220820)等,通過 ODM 的手段,進一步拓展 ion Proton 和 ion S5 在醫療領域中的市場。但根據 NMPA公開查詢的結果來看,達安和博奧的產品醫療器械注冊證已過了有效期而且并沒看到更新。
Ion PGM? and Ion Proton? System Chips
賽默飛 Ion Proton
達安基因 8600
博奧生物的 BioelectronSeq 4000 測序儀
賽默飛 Ion S5 & 泛生子 Getron S5
賽默飛 Ion Torrent Genexus System 測序儀系統
? ?而在 2019 年 11 月,賽默飛推了最新的 NGS 測序儀型號“Ion Torrent Genexus System”。主打的概念大家可以感受一下:“一天內自動完成從樣本到報告的工作流程”、“第一個一站式的高通量測序(NGS)解決方案”、“可自動執行從樣本到報告的工作流程,僅需兩步操作即可在一天之內提供結果”。
? ?從以下來自官網的介紹簡圖看,這 Genexus 系統是一整套綁定了“核酸提取、純化系統”、文庫制備、測序及分析軟件”的整體系統。因此確實是有希望提供 NGS 測序全流程的覆蓋。但目前能夠全流自動化的程覆蓋哪些應用,還不太清楚。筆者認為,這將會是臨床測序儀的一個大趨勢,即把 NGS 測序儀做成一個黑箱(black box),用戶只需要放血漿樣品進去,經過一定的時間,機器自動操作自動分析,即可獲得臨床報告的輸出結果。遺憾的是,目前該產品還是“僅供研究使用,不可應用于診斷程序”的狀態。
? ?無獨有偶的是,華大好像也已經搗鼓出來這種一體式自動化的測序系統,并已經在某醫院進行聯合測試4,并聲稱“(MGIFLP)作為全球首臺一站式高通量測序系統,MGIFLP 突破了以往建庫自動化和測序自動化分離的狀態,整合了全血處理和分離模塊,通過軌道自動連接,可支持微生物快速檢測,單菌快速鑒定以及耐藥基因和毒力基因鑒定,讓高通量測序以前所未有的高效和便捷在臨床端開展。”可見,NGS 測序儀的廠家都是想到一塊去了。
? ?回到 life 測序儀上,究竟是什么原因,life 測序儀沒有和達安基因、博奧等廠家繼續前面在臨床領域的合作,筆者不得而知。但是,從 life 測序儀在 2019 年又找到另一個合作伙伴以及推出一體化的 Genexus 系統這些事實來推斷,life 測序儀不會輕易放過中國臨床測序應用市場這一塊大蛋糕的。
? ?隨著國家層面的大健康政策制定和完善,衛健委也對基因測序這一前沿技術持越來越開放的態度。近年來不斷增加的測序相關的臨床認證試劑及儀器,就是很好的明證。筆者相信,未來 2-5 年臨床測序的測試需求會呈現快速爆發增長的趨勢。因此,擺在 life 測序儀以及其他 NGS 廠家面前將會是一個越來越大的蛋糕。但究竟在這一階段中,每個廠家能怎么發展,能分得多大的蛋糕,還是得看自己的內功。
? ?究竟是 ion torrent 這一國外“奇葩”測序技術老樹發新芽,還是走上 454 測序儀的老路(來自老羅的詛咒 -_-|||)?讓我們拭目以待。
參考資料:
1 《基因密碼 2》,“超級測序儀爭霸戰”章節,華大基因股份 CEO 尹燁注
2 《羅氏將關閉454測序業務》,生物通
3?ThermoFisher官網中關于“ion torrent 高通量測序技術”的頁面,鏈接:
4 《一個按鍵,一站包辦? | 全球首臺一站式測序工作站 MGIFLP 在珠江醫院開展聯合測試》,華大智造官網