實驗室分析儀器--氣相色譜質譜聯用儀數數據處理方法
氣相色譜儀檢測器輸出的信號非常快速(可以視為連續信號),信號強度非常低(小至10+A),同時信號是模擬電信號,因此色譜儀輸出電信號無法用簡單的方法進行定性、定量處理,首先要把模擬電信號用記錄儀記錄下來或把模擬信號轉換成數字信號儲存下來,然后根據不同分析要求再做處理,以獲得有關被分析組分的定性、定量結果或其他信息。氣相色譜的數據記錄處理方式一般可分為三種:臺式記錄儀、數據處理機和色譜工作站也是數據處理的不同發展階段。
早期色譜數據的記錄使用臺式記錄儀,采用差式電位計、同步電機、記錄紙對模擬信號進行顯示和記錄,然后通過手動進行保留時間和峰面積的計算,由于操作煩瑣,目前已完全被淘汰了。
色譜數據處理機是一種專門用于色譜數據分析的專用計算機,色譜處理機采用A/D轉換器(模數轉換器)將接收到的氣相色譜檢測器傳過來的信號轉換成數字信號存儲到專用計算機中,分析人員可以通過鍵盤輸入專用計算機指令來確定各種參數進行各種定量計算,進而打印出分析報告,但色譜譜圖存儲數量有限,結果也不是非常直觀,制約了色譜數據處理機的推廣和應用。
隨著計算機技術的發展,色譜工作站已成為色譜數據處理的主流,其在組成和工作原理與數據處理機基本相同,但不同的是它是計算機程序,可在計算機操作系統下工作,存儲和處理能力比數據處理機大得多,同時作為廠家專門配套的工作站,還可以實現氣相色譜運行情況同步顯示,并且具備氣相色譜參數的實時控制。
本節將著重介紹濾噪和色譜峰檢測等方法。
一、噪聲平滑處理
色譜數據處理系統接收到的數字信號(經過模數轉換的檢測器信號),包含兩部分信息部分是檢測器對色譜柱流出物響應產生的電信號,另一部分是色譜系統(包括進樣系統、分離系統、檢測系統、放大系統和模數轉換系統等)產生的一切與色譜流出物無關的信號,通常這類信號被稱為“系統噪聲”。系統噪聲疊加在樣品有關的真實信號之上,使色譜數據處理系統對色譜峰的檢測判別以及進一步的數據處理帶來了不利因素,所以有必要盡可能地將信號中含的噪聲部分排除掉,以便更好地進行譜圖數據處理。
應該注意的是譜圖中的系統噪聲與數據采集頻率密切相關,同一條件下,噪聲信號的大小正比于采集速率的1/2次方,隨著采集頻率的増加,噪聲的大小也隨之增加。因此適當降低數據采集頻率可以降低原始譜圖的噪聲信號,為保證峰面積積分準確,每個完整色譜峰信號采集點數不應小于20,否則可能導致積分結果的偏差
系統噪聲通常始終有高頻的、雜亂的信號,去除系統噪聲的方法一般為濾波或平滑。信號濾波技術可分為兩大類,一類是硬件濾波技術,如RC電路濾波,另一類為軟件濾波技術也稱為數字濾波。硬件濾波器存在動態范圍小、濾波效果不好、適應性差等問題。軟件濾波是用計算機程序對數字信號進行平滑、濾波處理,通過預定的規則進行運算或變換,從而達到去除噪聲的效果。軟件濾波可以根據不同的實際情況,改變算法中的各種參數,來達到最佳的濾波效果。
軟件數字濾波的應用廣泛,使用方便,算法容易實現,越來越得到廣泛的應用和重視。軟件數字濾波方法常用的有均值濾波器、 Savitzky-Golay濾波器。
1.均值濾波器( mean filter)
均值濾波器也叫移動平均法,首先確定一個固定的時間窗口(n),窗口內數據(Y1)的平均值替換窗口中心的原始數據點,達到數據平滑的作用:
均值濾波器可以有效地壓制信號抖動,尤其是脈沖式信號。通常采用的是三點中心或五點中心法,窗口設定越大,濾波效果越好,但譜圖的畸變也越大。通常而言窗口設定應小于典型峰寬1/10,在此條件下,峰的畸變不是非常大,當窗口大于典型峰寬15,峰高會被明顯變低,畸變嚴重,可能直接影響峰檢測和積分。采用四點中心對稱的移動平均法將會產生個“窗口”中心原先沒有的數據點,可以提高峰谷點的判斷精度。
2. Savitzky- Golay濾波器
Savitzky- Golay濾波器是1964年由 Savitzky和 Golay]提出的,根據其原理可稱為移動窗口最小二乘多項式平滑,也稱為最小二乘平滑,是分析化學中應用最廣泛的平滑算法。Savitzky- Golay濾波或稱 Savitzky- Golay平滑,利用中心點以及其前后m-1個數據點進行多項式的最小二乘擬合,定出多項式中的各項系數。然后,用多項式的值來代替實驗值以達到數據平滑的目的。原則上說,選取的多項式次數越高,數據組內的點數越多,所計算出的數據平滑性也就越好,但在應用中還需將此法對實際峰形畸變的影響因素加以考慮。應用五點二次法平滑和七點三次法平滑處理較為理想。
五點二次法平滑:yi=(-3xi-2+12xi+17xi+12xi+1-3xi+2)/35
七點三次法平滑:yi=[7xi+6(xi+1+xi-1)+3(xi+2+xi-2)-2(xi+3+xi-3)]/21
其中,x是原始數據,y是經過平滑處理后的數據。從本質上說,移動窗口多項式平滑就是利用窗口內部各個點之間的加權來計算平滑后的新值。
在平滑濾波過程中,應該注意的是:對信號濾波,或多或少地會對有效信號產生影響,一般來說,隨著信噪比的增加,峰形的畸變也會相應地增大,因此在選用各種濾波方法進行濾波時,應遵守這樣一個原則:在峰形畸變保持在一定允許范圍內,盡可能地提高信噪比。
色譜譜圖的濾波一直是科學研究的熱點問題,一些新的算法也被用于色請語圖的平滑,其中快速傳里葉變換和小波變換被認為是理想的濾波算法,無論是傅里葉變換還是小波變換,其實質都是一樣的,就是將信號在時間域和頻率域之間相互轉換,從看似復余的時間域的數據進行變換,將其轉化分解成不同頻率域的信號疊加,由于信號往往在頻率域有比在時間域更加簡單和直觀的特性,根據色譜數據處理的經驗,噪聲的頻率最高,色譜峰次之,基線的頻率最低,將噪聲所在的頻率域的信號進行平滑,然后通過進一步反變換到時間域上,完成對請圖的平滑,由于小波變換、傳里葉變換運算所需的數據量和運算量較大,在使用時一般不能直接完成,需要根據實際的噪聲情況進行必要的調整,因此沒有真正用于色譜工作站,但其良好的無歧視的濾波能力,尤其是針對微弱信號的獲取可具有較理想的效果,使它成為數據處理研究的重點。
二、色譜峰的檢測判別方法
峰檢測的目標是判斷色譜流出峰的起始點、最高點和結束點,它的準確性直接影響后續的定性、定量計算。隨著計算機技術的發展,色譜數據處理機和工作站廣泛應用于色譜的數據處理,基于軟件的峰檢測自動判定方法獲得快速的發展,已產生了各種不同的色譜峰處理方法,如幅值法、統計門限法、面積靈敏度法與基線靈敏度法、一階導數判別法、修正的一階導數判別法、二階導數判別法、增加斜率法等。
階導數法是目前工作站中最為常用的色譜峰檢測方法,主要是依據色譜峰信號的斜率變化(一階導數)進行峰起點、落點和峰頂點的判別。色譜峰信號的一階導數如圖1所示,由圖中可以看出在峰的起點處,其相應的一階導數由零變成正,在峰頂點處,相應的一階導數由正變成負,在峰結東處一階導數由負變成零。
?
圖1? 色譜峰及其相應的一階導數示意圖
通常情況下采樣頻率固定。為了計算方便,通常直接采用相鄰信號的差值作為斜率,由于噪聲的存在,基線處的一階導數并不為零,而是在零點附近上下波動,所以,在一階導數檢測時須確定一個閾值。當信號增加,一階導數值大于預定的閾值,確定峰的起點。當導數值由正變負時為峰頂點。當峰頂點確定后,若信號的一階導數值的絕對值小于閾值時為峰的結東點。閾值可以根據基線中噪聲偏差設定,通常設定值為基線噪聲的3倍。
傳統的一階導數的缺陷在于對于對稱峰形檢測較為準確,但對于拖尾峰而言,由于值的存在可能導致峰結束點的判定提前。另一方面,對于那些峰寬較大的小峰可能會出現漏檢的現象。為了改善信噪比較低的扁平峰的檢測,1982年J.L. Excoffier等提出了修正一階導數法用于色譜峰檢測。對于相同峰高的色譜峰而言,峰越寬,一階導數的值越小,由于值的限定,可能導致某些峰肉眼可見,但未獲得檢出。
由于噪聲的影響,相鄰信號差值的波動往往會大于色譜峰前沿的斜率,可能對判斷造成影響。修正一階導數法采用相隔幾個點的差值來代替相鄰兩點的差作為斜率。在此情況下斜率的最大值隨兩點間距的增大而增大,當兩點的距離為峰寬的一半時,數值達到最大振幅圖2為同一譜圖的一階導數和修正一階導數的結果,表明修正一階導數明顯優于一階導數。
?
?圖2? 色譜譜圖的一階導數和修正一階導數比較
A-原始譜圖;B-一階導數;C-修正一階導數
修正一階導數的峰檢測過程及判別依據與一階導數法相同,同樣需要根據噪聲情況來確定峰判斷的閾值,但從圖9-2可以看出相同的基線噪聲條件下,噪聲對修正一階導數干擾明顯小于一階導數,窗口越大干擾越小,其原理與采集頻率-噪聲相關性相同。
二階導數也可用于色譜峰的判別,從實際應用效果而言,用二階導數法的檢測靈敏度要高于一階導數法,甚至在基線出現線性漂移的情況下也不受影響。但基線噪聲對信號導數的影響隨導數階數的增加而增大,會對程序上的峰判斷產生不利影響,在實際工作站中較少使用。
E.?F.G. Woerlee等提出增加斜率檢素法(TS法),如圖3所示。
圖3 ITS法的起峰判斷
將起始點(B1)固定,與其后連續四個信號點(B2、B3、B4、B3)分別計算其斜率值。當四個斜率值連續上升,則確定起始點(B1)為峰起點。這些關系可用下列公式表示:
?
將上述關系式加以整理可轉換為:
B3-2B2+B1>0&&2B4-3B3+B1>0&&3B5-4B4+B1>0
我們可以看出,實際上這種檢測方法是二階導數的一種變形。當數據點滿足二階導數檢測法的條件時,也必能滿足ITS法,相反,能滿足ITS法的不一定能滿足二階導數法。ITS法對噪聲的敏感性要低于二階導數法,同時具有更高的檢測靈敏度。
傳統的一維氣相色譜通常的峰容量比較低(通常小于1000現實樣品中組分數則成千上萬,其分離能力遠不能滿足使樣本的峰獲得完全的分離,通常的色譜處理系統一般對肩峰的情況不予考慮,將肩峰并入主峰進行計算。這種處理方法將給定量結果帶來較大偏差。重疊峰分析也是色譜數據處理的研究重點,盧佩章教授等通過EMG模型進行全譜圖曲線擬合的方法解決了重疊峰的定量問題?。但擬合法的色譜峰的模型參數以及色譜參數隨保留時間的變化對擬合結果至關重要,而且運算復雜,同時缺乏質譜等其他信息進行軸助驗證,難以實現廣泛的使用,在通常的數據處理軟件(工作站)中較少使用。然而,從實際的數據出發采用二階導數可能實現重疊峰尤其是肩峰的拆分。圖9-4為一后肩峰譜圖及其一階導數和二階導數,理論上,后肩峰可根據以下條件進行判斷:有后肩峰時,從主峰頂點到峰結東點,信號的一階導數保持正號;而二階導數出現了正負變換,由此可判斷肩峰的存在。
圖4 后肩峰的色譜圖及其一階導數和二階導數
但如前文所述,信號的二階導數對系統噪聲十分敏感,直接采用上述方式進行判斷容易出現錯誤。為了減小二階導數的影響,可以采用查找一階導數極值的方法進行肩峰判斷,從圖9.4中可以看出存在三個拐點,即一階導數出現三個符號為負的極值點,兩個極小、一個極大。為避免由于噪聲的存在對肩峰判斷的影響,當三個極值點找到后,極大值和極小值之間的差值需大于一個預先給定的門限值。此門限值根據噪聲大小來確定,同時相鄰極值點間的時間間隔也需滿足一定條件,只有滿足以上的系列條件才能確定出肩峰。
三、峰基線的確定
峰高是峰尖至峰底(或基線)的距離,峰面積是色譜峰與峰底(或基線)所圍成的面積。峰高和峰面積是色譜定量的基本參數。前面論述了色譜峰的起點、終點的判定方法,只有色諧峰曲線與基線間的整個面積才表示該組分的總量,故峰面積的測量同時還取決于基線的判斷。因此,要準確地測量峰高和峰面積,另一關鍵是基線的確定。
圖9-5表示了不同情況下確定色譜基線的四種方法。
(1)水平基線校正法見圖5(a),將始點水平畫至最后一個色譜峰的始點,折上與該峰的終點相連的線,作為色譜的基線。此法用于基線基本平穩的情況。
(2)連帶法或膠帶法見圖5(b),由第一個色譜峰的始點與最后一個色譜峰的終點連一直線,色譜基線則由低于此直線的各峰谷相連而成。此法適用于基線波動不大的情況(3)峰谷法見圖5(c),把峰谷點之間的連線作為基線。此法適用于基線波動較大的情況。
(4)空白基線法見圖5(d),是在不進樣的情況下先作一次色譜分析,其譜圖稱為空白基線。然后在完全相同的色譜條件下進樣分析,此時譜圖與空白基線譜圖相減,稱為空白基線法。此方法主要用于程序升溫等基線漂移較為嚴重的情況,對儀器的重復性要求很嚴否則會產生很大誤差。
?
?圖5? 確定色譜基線的幾種方法
譜圖基線必須根據色譜圖的分離情況進行綜合考慮。在使用微處理機和計算機時可以將色譜圖調出,看譜圖上基線的判斷、峰的起落點和未分離峰的切割是否合理,若不合理,就必須重新設定參數,或通過手動的方式,再次處理數據直至滿意為止。
?
兩峰重合時,在數據處理中通常采用谷點作垂直線的方法進行切分。當谷點小于小峰的半峰高或者兩峰等高時,誤差不大。應當注意的是當谷點在小峰的半峰高以上時,小峰面積的測量誤差會隨大峰和小峰的峰高比值的增加而顯著增加。Proksch等建立了氣相色譜重合峰峰面積的校正系數表。通過重合峰的峰高比、分率等信息可在表中査到校正系數,用于面積折算。但其只有在峰形符合高斯分布、兩個峰之間存在峰谷、小峰在大峰之前流出等條件下才適用。
?