基于XRF和Vis-NIR數據融合的土壤重金屬濃度分區預測是否更佳?
文章信息
第一作者:石陶然
通訊作者:吳春發 教授,駱永明 研究員
通訊單位:南京信息工程大學,中國科學院南京土壤研究所
https://doi.org/10.1016/j.scitotenv.2023.168381
亮點
? 評估基于土壤重金屬污染程度分區模型的預測性能。
? 基于單一XRF數據的分區模型能更好地預測Cu和Pb濃度。
? 基于XRF和vis-NIR數據的全局模型能更好地預測Cu和Pb濃度。
? 提供了改進基于近端傳感器土壤重金屬濃度預測模型的新見解。
研究進展
土壤重金屬污染防治需要快速有效地診斷土壤污染狀況,精準刻畫污染范圍。與耗時、昂貴和環境不友好的實驗室化學分析方法相比,近端傳感器的協同應用具有互補性、時效性和經濟性等方面的優勢,顯示出了巨大的應用潛力。土壤污染狀況早期診斷需要大尺度和高密度的取樣、快速檢測并選擇適當的數據挖掘和建模方法。機器學習能夠充分有效地利用多種傳感器所提供的多源數據,通過構建協同融合模型預測土壤重金屬濃度。本研究在土壤重金屬濃度預測建模時,從降低數據的空間波動性和不平穩性對模型預測能力的影響角度出發,提出了一種分區建模的思路。根據影響因素將大的調查區域劃分為若干子區域,從而將數據集劃分為更均勻的子數據集以獲得更準確的結果。對于污染地塊土壤重金屬濃度的預測,分區模型是否比全局模型更可靠和準確尚需論證,而如何選擇合適的建模方法也是一個重大的挑戰。
本研究選擇甘肅省白銀市某空間變異程度較大的污染地塊土壤為研究對象,采集880個表層(0-20 cm)土壤樣品,在室內分別采用高精度便攜式X射線熒光光譜儀(XRF)和便攜式地物光譜儀(ASD FieldSpec 4)獲取土壤樣品Cu、Pb等重金屬濃度數據和可見光-近紅外高光譜(vis-NIR)數據,并在XRF快速檢測結果的基礎上綜合污染程度和空間分布,選擇166個土壤樣品進行實驗室化學分析測定。構建了單一XRF以及XRF與經不同的光譜預處理方法(SG和SGFD)預處理的vis-NIR光譜數據融合的隨機森林(RF)模型,分別對土壤中Cu和Pb濃度進行預測,以評價分區模型(基于地理分區)和全局模型的預測精度。
這項研究是第一次嘗試評估分區模型預測污染地塊土壤重金屬濃度的性能。基于單一HD-XRF數據的隨機森林模型,Cu(R2=0.961,RMSE=27.8,RPD=4.96)和Pb(0.981,79.6,7.38)的分區模型預測性能優于全局模型Cu(0.956,29.0,4.73)和Pb(0.981,81.0,7.24)。這證實了分區預測模型對土壤重金屬預測的魯棒性和準確性優于全局模型的假設。然而,基于HD-XRF和vis-NIR數據協同融合的隨機森林模型,分區預測模型沒有顯示出土壤Cu和Pb濃度的高預測精度,全局模型HD-XRF+vis-NIR(SGFD)、HD-XRF+vis-NIR(SG)分別對Cu、Pb 濃度的預測效果最好。一般來說,通過采用近端傳感器數據挖掘方法建立分區模型預測土壤重金屬含量,能提高土壤環境的精準調查,進而實施昂貴且耗時的土壤修復方案。根據建模目的、數據量大小、獨特的地理環境、模型運行環境等因素選擇合適的分區建模方法。本研究分區建模精度和效率的結論還需要進一步驗證。
圖1 基于整個研究區域和分區的土壤Cu(a)和Pb(b)的HD-XRF校正值(預測值)和實驗室分析濃度(實測值)的線性回歸模型的擬合優度對比。黑色虛線:理想的1:1線。
圖2 基于HD-XRF和vis-NIR數據的協同融合模型預測西大溝(X)土壤Cu(a、b)和Pb(c、d)濃度與實驗室分析值(實測值)的對比。
圖3 基于HD-XRF和vis-NIR數據的協同融合模型預測東大溝(D)土壤Cu(a、b)和Pb(c、d)濃度與實驗室分析值(實測值)的對比。
圖4 基于HD-XRF和vis-NIR數據的協同融合模型預測整個研究區域土壤Cu(a、b)和Pb(c、d)濃度與實驗室分析值(實測值)的對比。
-
綜述