高光譜成像儀作為精密的光學儀器,不僅可以獲得圖像上每個點的光譜數據,而且還可以獲得任一譜段的圖像信息。但由于其采集的光譜數據具有波段多、分辨率高、數據維度高、冗余性強等特點,因此需要對光譜數據進行預處理,以提升建模數據的準確性。本文對高光譜成像儀的原理及光譜數據的預處理方法做了介紹。
高光譜成像儀的工作原理:
高光譜成像技術是利用成像光譜儀對目標物體在光譜覆蓋范圍內的數十或數百條譜線進行連續掃描成像,在獲得目標物體外部特征圖像信息的同時,也能獲得反應其內部成分的光譜信息。典型的色散型成像光譜儀采用連續掃描的方式進行成像,其主要由光源、電控移動臺、色散元件、面陣探測器等幾部分組成,如下圖所示。
當光源照射在電控移動臺上的目標樣品時,樣品反射光經過成像鏡頭、狹縫,再經由光柵等光學器件后,按波長色散并成像于CCD像面。由于狹縫只允許很窄的樣品條帶圖像通過,因此當樣品在電動平臺的連續移動掃描下,能夠得到連續的一維影像及光譜信息。計算機上的圖像采集軟件對圖像進行采集和存儲,進行處理后可以得到樣品的三維高光譜圖像。通過對高光譜圖像進行特征提取、圖像融合等,可以得到樣品每個像素點的反射光譜(如下圖所示,X方向表示條帶的一列像元、Y方向表示連續成像的軌跡、入方向代表各像元在不同波長下的光譜信息)。由于樣品不同部位具有不同的特征光譜,據此可以分析和判斷目標的屬性。
高光譜成像儀光譜數據的預處理方法:
由于采集到的三維高光譜數據中的光譜信息除了含有有用的信息外,還含有其他大量的隨機噪聲和與樣本性質無關的信息(如儀器噪音、雜光散射和基線漂移等),這些因素都會對光譜信息產生一定的干擾,甚至會影響所建模型的性能和預測效果。因此,有效地消除光譜信息中的噪聲和無關信息是建立良好的分析預測模型的關鍵。
通過對光譜信息進行有效的預處理可以減弱甚至消除其他與樣本性質無關的信息對光譜信息的影響,為后續建立預測精度高、穩健性好的分類判別模型奠定基礎。目前,常用的預處理方法有變量標準化算法、多元散射校正算法、導數算法、基線校正、平滑算法和去趨勢法等。
1.變量標準化算法(SNV)
變量標準化(Standard Normalized Variate,簡稱SNV)主要是用來消除由光散射所引起的光譜誤差。SNV校正認為,在每一條光譜中各波長點的吸光度值應滿足一定的分布規律。在這一假設的前提下,SNV是在原始光譜減去該條光譜曲線的平均光譜值,然后除以該條光譜曲線的標準偏差,其實質是使原始光譜數據標準正態化處理。
2.附加散射校正算法(MSC)
附加散射校正(Multiplicative Scatter Correction,簡稱MSC)是由Geladi等人提出,其主要目的是通過消除因顆粒大小及顆粒分布不均勻產生的散射影響,增強與成分含量相關的光譜吸收信息,并獲得較“理想”的光譜。MSC方法認為,每一條光譜都應該與“理想”的光譜成線性關系,但真正“理想”的光譜是無法得到,所以一般用校正集的平均光譜來近似。即,每個樣品的任意波長點下的反射吸光度值與其平均光譜的相應吸光度的光譜是近似線性關系,而且可以通過光譜集線性回歸獲得該直線的截距和斜率,并用來校正每條光譜。截距大小可以用來反應樣品獨特反射作用,而斜率大小則用來反映樣品的均勻性。
3.平滑算法(Smoothing)
由光譜儀采集到的光譜信息中常常疊加著很多的隨機誤差,而平滑算法是常用來消除噪聲的方法。其基本思路是通過多次選取平滑點前后的特定點進行平均或擬合來降低噪聲,從而提高信噪比。常用的平滑方法有:Savitzky-Golay卷積平滑法、移動平均平滑法和指數平均平滑。
4.去趨勢法(De-trending)
去趨勢算法(De-Trending)一般可以用于消除經SNV處理后的光譜的基線漂移,也可以單獨使用。該算法比較直接,先按多項式將光譜xi的吸光度和波長擬合出一條趨勢線di,再從原始光譜中減掉趨勢線(xi-di)。經過去趨勢法處理后,其波峰和波谷的特征更加明顯。
5.基線校正(Baseline)
在光譜分析中,由于樣品自身的不均性、儀器背景或其他因素等影響,導致所測樣品的譜圖經常會出現傾斜或漂移現象,若不加處理,會影響校正模型的性能和對未知樣品預測結果的準確性。
高光譜圖像數據的特點:
1.光譜波段范圍較寬且分辨率較高
傳統R、G、B或黑白圖像的光譜范圍一般都在可見光,波段數在幾個至十幾個,而高光譜儀獲得圖像的光譜范圍可以從可見光、近紅外、甚至延伸到中紅外,波段數可達到幾十至數百個,從而形成一條連續而飽滿的光譜反射率曲線,連續性較強,分辨率在2nm-10nm之間。
2.高光譜圖譜數據信息較為豐富
由于高光譜圖像的光譜分辨率較高,波段較寬,由此產生了許多窄波段的光譜信息,這些光譜信息之間關聯性較強,為高光譜圖像數據帶來了大量、豐富的信息。
3.高光譜圖像有較為豐富的數學分類模型
高光譜圖像的復雜性致使它的數據模型較為豐富,如圖像分類模型、光譜差異模型、特征提取模型等,使得圖譜數據的處理、分析、提取等更加豐富和靈活。