清空記錄
歷史記錄
取消
清空記錄
歷史記錄
一、引 言
隨著光譜學(xué)的不斷發(fā)展,人們對(duì)地物光譜屬性、特征的認(rèn)知也在不斷深入,許多隱藏在狹窄光譜范圍內(nèi)的地物特性逐漸得以發(fā)現(xiàn)。高光譜數(shù)據(jù)具有光譜范圍廣、光譜分辨率高、數(shù)據(jù)量大等特點(diǎn),更容易獲取地物的局部精細(xì)信息,對(duì)光譜細(xì)節(jié)特征具有良好的表現(xiàn)能力。自從高光譜技術(shù)誕生以來(lái),已有大批學(xué)者在農(nóng)作物識(shí)別與分類(lèi)、土壤重金屬污染監(jiān)測(cè)、植被識(shí)別與分類(lèi)等高光譜分類(lèi)領(lǐng)域進(jìn)行廣泛研究。如何探究不同樣本間光譜特征差異以及提高分類(lèi)識(shí)別精度是當(dāng)前高光譜分類(lèi)領(lǐng)域需解決的重要問(wèn)題。
針對(duì)上述科學(xué)問(wèn)題,諸多學(xué)者分別開(kāi)展了基于對(duì)原始光譜數(shù)據(jù)進(jìn)行光譜變換、平滑等預(yù)處理技術(shù),然后通過(guò)主成分分析、支持向量機(jī)等傳統(tǒng)方法應(yīng)用于高光譜分類(lèi)識(shí)別研究。傳統(tǒng)方法可以應(yīng)用于高光譜分類(lèi)識(shí)別研究,但預(yù)處理方法有很多種,如何選擇和組合這些方法會(huì)對(duì)分類(lèi)結(jié)果產(chǎn)生很大影響,由此造成的耗時(shí)長(zhǎng)、分類(lèi)精度較低等問(wèn)題一直難以解決。
隨著數(shù)據(jù)集規(guī)模的增加和人工智能(AI)快速的發(fā)展,機(jī)器學(xué)習(xí)(ML)在各個(gè)科學(xué)領(lǐng)域的應(yīng)用越來(lái)越流行。深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)領(lǐng)域中一個(gè)新的研究方向,近年來(lái)也逐漸應(yīng)用于光譜分類(lèi)、光譜檢測(cè)等領(lǐng)域中。
隨著成像光譜儀器的廣泛應(yīng)用,利用光譜數(shù)據(jù)進(jìn)行物質(zhì)分類(lèi)與識(shí)別已經(jīng)成為一項(xiàng)重要的研究?jī)?nèi)容,研究不同分類(lèi)算法對(duì)最終的目標(biāo)識(shí)別準(zhǔn)確度具有重要意義。目前現(xiàn)有研究中主要分為傳統(tǒng)方法和深度學(xué)習(xí)方法,傳統(tǒng)方法存在耗時(shí)長(zhǎng)、分類(lèi)精度較低等問(wèn)題,深度學(xué)習(xí)方法能夠簡(jiǎn)化預(yù)處理步驟,取得較高精度,但大多數(shù)研究只進(jìn)行單次訓(xùn)練,并沒(méi)有針對(duì)錯(cuò)分樣本進(jìn)行精細(xì)研究,很難從光譜特征分析的角度解釋分類(lèi)結(jié)果。首先,利用連續(xù)投影算法(SPA)進(jìn)行基礎(chǔ)波段篩選,探究特征波段對(duì)原始光譜的信息承載能力,由此探究不同地物間光譜特征的差異。
二、實(shí)驗(yàn)數(shù)據(jù)與分析
2.1研究區(qū)域與樣本
本次實(shí)驗(yàn)所選區(qū)域?yàn)楹邶埥‰p鴨山市友誼農(nóng)場(chǎng),糧食作物有大豆、玉米、水稻等,經(jīng)濟(jì)作物有甜菜、葵花籽、白瓜籽、烤煙等。測(cè)量地物為玉米、大豆和水稻,其中5月由于播種時(shí)間較短,玉米、大豆在土壤中屬于剛出芽的狀態(tài),因此將5月的玉米和大豆樣本劃分為裸土類(lèi)別。共選取697個(gè)樣本,其中大豆204個(gè)樣本、玉米190個(gè)樣本、水稻40個(gè)樣本、裸土263個(gè)樣本。
2.2 儀器設(shè)備與采集方法
本次測(cè)量可使用萊森光學(xué)便攜式地物光譜儀,其光譜測(cè)量范圍覆蓋近紫外-可見(jiàn)光-近紅外波段。光譜測(cè)量在野外進(jìn)行,選擇地表覆蓋均勻且場(chǎng)地最短邊長(zhǎng)度不小于50m的人工或天然場(chǎng)地為本次反射率測(cè)量場(chǎng)地。對(duì)基本采樣單元采用十字五點(diǎn)采樣法進(jìn)行光譜采集。測(cè)量了大豆、玉米、水稻和裸土的反射率光譜并拍照記錄各類(lèi)地物表面狀態(tài),如圖1所示。測(cè)量時(shí),光譜儀探頭距離地物1m,因此采集到的大豆、玉米光譜為葉片和土壤的混合光譜,水稻光譜為葉片和水體的混合光譜。
圖1 4類(lèi)地物表面狀態(tài)。(a)大豆;(b)玉米;(c)水稻;(d)裸土
2.3 光譜預(yù)處理
對(duì)采集到的4類(lèi)地物原始光譜數(shù)據(jù)進(jìn)行分析,如圖2所示。波長(zhǎng)范圍在350~1800nm內(nèi),各個(gè)地物光譜曲線(xiàn)較為平滑,沒(méi)有明顯的光譜噪聲,在波長(zhǎng)為1800nm附近存在嚴(yán)重的噪聲,這是由于在波長(zhǎng)為1800nm處存在水汽吸收通道,與地物的含水量有關(guān)。此外,由于測(cè)量在野外進(jìn)行,天氣環(huán)境和操作的影響導(dǎo)致在波長(zhǎng)為1800nm之后的光譜信息有較大的波動(dòng)且含有噪聲數(shù)據(jù)。如果采用全波段光譜數(shù)據(jù)進(jìn)行后續(xù)分析處理,會(huì)對(duì)所建分類(lèi)模型的精度產(chǎn)生極大影響,導(dǎo)致模型不可靠。因此,選擇采用波長(zhǎng)范圍在350~1800nm的光譜數(shù)據(jù)進(jìn)行相關(guān)分析,為了簡(jiǎn)化傳統(tǒng)方法采用一些預(yù)處理步驟,不再對(duì)光譜數(shù)據(jù)進(jìn)行其他變換,直接利用截取后的光譜數(shù)據(jù)進(jìn)行后續(xù)分析處理。
圖2 350~2500 nm 四類(lèi)地物平均反射率光譜曲線(xiàn)
2.4 光譜特征分析
波長(zhǎng)范圍在350~1800nm的4類(lèi)地物光譜數(shù)據(jù),如圖3所示。由圖3可知,大豆、玉米和水稻等3種地圖2350~2500nm四類(lèi)地物平均反射率光譜曲線(xiàn)物的反射光譜曲線(xiàn)走勢(shì)一致,同其他綠色植被一樣,在波長(zhǎng)為670nm的紅光波段有一處吸收帶,其反射率較低;在波長(zhǎng)為550nm的綠光波段有一個(gè)明顯的反射峰;在波長(zhǎng)為700nm處反射率急速增高,至波長(zhǎng)為1100nm的近紅外波段反射率達(dá)到高峰,這是植被的獨(dú)有特征;在波長(zhǎng)為1300nm之后,因綠色植物含水量的影響,吸收率增大,反射率大大下降,在水的吸收帶形成低谷。在部分波段范圍內(nèi),3種地物的光譜曲線(xiàn)存在一些差異,例如波長(zhǎng)范圍在450~650nm內(nèi),水稻的光譜反射率最低,這是由于測(cè)量的水稻光譜為葉片和水體的混合光譜,水的反射率較低。大豆和玉米在整個(gè)波段范圍內(nèi)光譜反射率相近,二者難以區(qū)分。裸土的光譜曲線(xiàn)比較平滑,沒(méi)有明顯的峰值和谷值,但在整個(gè)波段范圍內(nèi),裸土的反射率與其他3種地物有較大部分的重合,容易出現(xiàn)混淆的現(xiàn)象。
圖3 350~1800nm四類(lèi)地物部分樣本光譜曲線(xiàn)(20條)。(a)大豆;(b)玉米;(c)水稻;(d)裸土
三、結(jié)果與討論
3.1 數(shù)據(jù)集劃分
本次實(shí)驗(yàn)將數(shù)據(jù)集按8∶2劃分為訓(xùn)練集和測(cè)試集,如表1所示,各個(gè)樣本隨機(jī)選樣。
表 1 數(shù)據(jù)集統(tǒng)計(jì)
3.2 特征波段選取
高光譜數(shù)據(jù)一些相鄰波段之間存在著較強(qiáng)的相關(guān)性,導(dǎo)致光譜數(shù)據(jù)包含大量的冗余信息,如果直接將原始光譜數(shù)據(jù)輸入到深度學(xué)習(xí)模型,可能會(huì)導(dǎo)致模型出現(xiàn)過(guò)擬合現(xiàn)象,嚴(yán)重影響模型的處理速度。因此,選擇使用SPA對(duì)原始光譜數(shù)據(jù)進(jìn)行特征波段篩選,通過(guò)篩選后的少量波段信息承載原始高維信息。
3.3 SPA原理
SPA是前向特征變量選擇方法。SPA利用向量的投影分析,通過(guò)將波長(zhǎng)投影到其他波長(zhǎng)上,比較投影向量大小,以投影向量最大的波長(zhǎng)為待選波長(zhǎng),然后基于矯正模型選擇最終的特征波長(zhǎng)。SPA選擇的是含有最少冗余信息及最小共線(xiàn)性的變量組合。該算法簡(jiǎn)要步驟如下:記初始迭代向量為xk()0,需提取的變量個(gè)數(shù)為N,光譜矩陣為J列。
1)任選光譜矩陣的1列(第j列),將建模集的第j列賦值給xj,記為xk()0。
2)將未選入的列向量位置的集合記為s:
3)分別計(jì)算xj對(duì)剩余列向量的投影:
4)提取最大投影向量的光譜波長(zhǎng):
5)令xj=Px,j∈s。6)n=n+1,若n 最后,提取出的變量為{xk( )n=0,1,?,N-1}。對(duì)應(yīng)每一次循環(huán)中的k(0)和N,其中最小的均方根誤差(RMSE)對(duì)應(yīng)的k(0)和N就是最優(yōu)值。一般SPA選擇的特征波長(zhǎng)分?jǐn)?shù)N不能很大。 3.4 特征波段集合 利用SPA,根據(jù)RMSE最小化原則,選出最能有效區(qū)分不同地物類(lèi)型的特征波段,如圖4所示。 圖4SPA特征波段選擇結(jié)果。(a)RMSE;(b)平均光譜反射率 共選擇8個(gè)波段,分別為410nm、542nm、714nm、734nm、856nm、1423nm、1475nm、1712nm。各類(lèi)地物樣本點(diǎn)在不同特征波段組合方式下的分布情況能夠反映出各類(lèi)地物在不同波段上的特征,可以初步判斷所篩選的特征波段能有效區(qū)分各類(lèi)地物。以4類(lèi)地物在410nm波段和其他波段相互組合為例,如圖5所示,4類(lèi)地物都表現(xiàn)出了不同特征:其中大豆和玉米的樣本點(diǎn)在各個(gè)波段上分布都較為分散,且出現(xiàn)大量交集,說(shuō)明這兩種地物的光譜特征相近,僅憑篩選特征波段無(wú)法實(shí)現(xiàn)有效區(qū)分;水稻和裸土的樣本點(diǎn)出現(xiàn)聚集現(xiàn)象,其中水稻的樣本點(diǎn)與玉米的樣本點(diǎn)有小部分重合,裸土的樣本點(diǎn)與大豆的樣本點(diǎn)有小部分重合,在分類(lèi)時(shí)容易混淆??傮w來(lái)看,篩選出的特征波段能夠有效代表4類(lèi)地物的特征信息,可以初步區(qū)分部分地物樣本,但效果并不理想,尤其是難以區(qū)分大豆和玉米。因此,需利用不同分類(lèi)識(shí)別方法開(kāi)展進(jìn)一步研究。 圖5地物樣本點(diǎn)分布。(a)410nm和542nm;(b)410nm和714nm;(c)410nm和856nm;(d)410nm和1423nm;(e)410nm和1475nm;(f)410nm和1712nm 推薦: 地物光譜儀iSpecField-HH/NIR/WNIR 地物光譜儀是萊森光學(xué)專(zhuān)門(mén)用于野外遙感測(cè)量、土壤環(huán)境、礦物地質(zhì)勘探等領(lǐng)域的最新明星產(chǎn)品,獨(dú)有的光路設(shè)計(jì),噪聲校準(zhǔn)技術(shù)、可以實(shí)時(shí)自動(dòng)校準(zhǔn)暗電流,采用了固定全息光柵一次性分光,測(cè)試速度快,最短積分時(shí)間最短可達(dá)20μs,操作靈活、便攜方便、光譜測(cè)試速度快、光譜數(shù)據(jù)準(zhǔn)確,廣泛應(yīng)用于遙感測(cè)量、農(nóng)作物監(jiān)測(cè)、森林研究、海洋學(xué)研究和礦物勘察等各領(lǐng)域。