清空記錄
歷史記錄
取消
清空記錄
歷史記錄
一、引言
煤質(zhì)分析對于促進煤炭資源的合理利用具有重要意義,其中煤炭的灰分、揮發(fā)分和熱值是影響燃煤電廠混煤入爐、爐膛燃燒等工作的關(guān)鍵信息。傳統(tǒng)的LIBS光譜檢測需要耗費很長時間從煤樣光譜中篩選元素的特征譜線。這種選擇特征譜線的方法費時費力,而且對于不同鍋爐的煤炭樣品,需要重新根據(jù)LIBS光譜數(shù)據(jù)來選擇特征譜線。為解決上述問題,本章基于原位LIBS技術(shù)利用煤炭全光譜波點與目標(biāo)校準(zhǔn)值之間的相關(guān)性對獨立變量進行重組,并分別建立了測定煤樣灰分、揮發(fā)分和熱值的定量模型。為了評估這種特征工程方法的合理性,又從物質(zhì)成分的角度對重組變量光譜進行了可解釋性實驗。
二、定量分析方法
本章采用主成分分析法來獲取LIBS全光譜中的特征信息作為獨立變量,然后通過普通最小二乘回歸法來構(gòu)建煤炭灰分、揮發(fā)分和熱值的定量模型。為解決獨立變量中的高階噪聲問題,提出一種基于變量重組的特征選擇方法來提取LIBS光譜中的關(guān)鍵信息,并通過波點載荷提取的元素特征譜線對這種特征選擇方法進行驗證。
1、主成分分析法
主成分分析(PCA)是一種常用的多元數(shù)據(jù)統(tǒng)計分析方法。主成分表示原始數(shù)據(jù)在正交方向上的分解,主成分分析可以在保留最大信息量的前提下消除共線性問題、同時降低輸入變量的維度。
2、基于變量重組的特征選擇方法
主成分分析是遵循解釋方差大小的順序?qū)χ鞒煞諴C進行排序,通常只選擇少數(shù)主成分來校準(zhǔn)模型,因為高階的主成分會存在較大噪音。傳統(tǒng)PCA只根據(jù)光譜數(shù)據(jù)無法保證所選擇的主成分與校準(zhǔn)值更相關(guān),而且隨著主成分幅度的減小,無法在循環(huán)中選擇原始主成分的最優(yōu)數(shù)量。因此,通過引入校準(zhǔn)值與每個主成分全譜波點解釋方差的相關(guān)性得分,并對輸入變量進行特定排序、篩選。使用這種重組方式可以選擇與校準(zhǔn)值更相關(guān)的主成分,實現(xiàn)最大化回歸指標(biāo),而不是僅限于選擇少數(shù)的原始主成分作為定量模型的輸入變量。
3、基于波點載荷提取元素特征譜線
主成分載荷是一種用于衡量每個變量對主成分貢獻(xiàn)程度的統(tǒng)計量,通過計算變量在主成分上的權(quán)重或系數(shù)來解釋兩者之間的關(guān)系。
4、普通最小二乘回歸法
普通最小二乘法(OLS)是一種用于估計線性回歸中未知參數(shù)的方法。線性回歸的目標(biāo)是找到最佳的參數(shù)向量,使得預(yù)測值和真實值之間的誤差最小化??梢赃x擇不同的損失函數(shù)來衡量誤差,并通過最小化損失函數(shù)求解最佳回歸參數(shù)。
本章的數(shù)據(jù)處理及定量分析過程可以分為4個部分:(1)根光譜預(yù)處理方法對采集到的LIBS煤炭光譜進行處理,包括背景光譜去除、多通道光譜歸一化、基于極小值點篩選法的基線校正、異常光譜處理以及元素特征光譜峰值的洛倫茲擬合。(2)劃分煤炭光譜數(shù)據(jù)集,并基于校準(zhǔn)值相關(guān)性和建模結(jié)果對主成分進行特定排序、篩選,從而實現(xiàn)變量重組。(3)變量重組后的普通最小二乘法建模以及定量分析。(4)基于全光譜變量重組后的載荷信息及相關(guān)性提取元素特征譜線。上述處理過程中的第(2)部分使用R2和RMSECV用于變量重組后定量模型的性能分析,第(3)部分使用R2、RMSECV和RMSEP來評估回歸模型的性能,第(4)部分使用NIST數(shù)據(jù)庫與元素特征譜線進行對比。
三、煤炭灰分、揮發(fā)分和熱值定量分析
本章使用135個煤樣作為訓(xùn)練集,用于構(gòu)建灰分、揮發(fā)分和熱值定量模型并完成十折交叉驗證,33個煤樣用于模型測試。其中,需要分別選擇不同數(shù)量未重組和重組后的主成分作為定量模型的獨立變量。然后,對訓(xùn)練集樣本進行10折交叉驗證,獲得R2和RMSECV的平均值。如圖1所示,當(dāng)選擇前40個未重組的主成分作為獨立變量時,獨立變量對全部光譜波點的累積解釋率達(dá)99.0321%。
圖1LIBS煤樣全光譜的主成分分析結(jié)果
對于不同的定量任務(wù),重組變量的數(shù)量需要根據(jù)獨特模型來選擇,灰分、揮發(fā)分和熱值定量模型所最終選擇的獨立變量個數(shù)如圖2所示。隨著獨立變量數(shù)量的增加,定量模型R2的總體趨勢先變大后變小,而RMSECV總體趨勢先變小后變大。值得注意的是,變量未重組和變量重組后的定量模型在交叉驗證曲線上存在巨大差異。這是因為,隨著未重組變量數(shù)量的增加,累積解釋率的方向不一定更好解釋校準(zhǔn)值的變化。而且,更高階的未重組變量會存在更多噪聲,這會降低回歸模型的性能,從而導(dǎo)致RMSECV增加。通過變量重組,可以選擇更多真實特征而不是噪聲作為獨立變量,得到更平坦的收斂曲線。在交叉驗證過程中,R2、RMSECV和N(獨立變量的個數(shù))同時考慮。當(dāng)R2最大、RMSECV最小時,此時所選擇的N對應(yīng)回歸模型的校準(zhǔn)效果越好。
圖2變量重組前后獨立變量個數(shù)的提取結(jié)果
變量重組前后,普通最小二乘定量模型分析煤質(zhì)參數(shù)的流程為:首先,對煤樣中的訓(xùn)練集樣本進行交叉驗證,得到R2和RMSECV。然后,使用訓(xùn)練模型對33個測試樣本進行分析,定量結(jié)果如圖3所示。其中,誤差棒是10次重復(fù)測量測試集RMSEP的結(jié)果。從圖3可以明顯看出,灰分、揮發(fā)分和熱值的預(yù)測結(jié)果都優(yōu)于定量模型在變量未重組時獲得的結(jié)果。對于變量重組后的灰分定量模型,訓(xùn)練集和測試集的R2、RMSECV、RMSEP分別為0.9701,0.9818,0.7153wt%,0.7037wt%。其中灰分的RMSECV下降59.91%,RMSEP下降60.23%。對于變量重組后的揮發(fā)分定量模型,訓(xùn)練集和測試集的R2、RMSECV、RMSEP分別為0.9458,0.9429,0.5678wt%,0.6628wt%。揮發(fā)分的RMSECV下降51.87%,RMSEP下降53.65%。對于變量重組后的熱值定量模型,訓(xùn)練集和測試集的R2、RMSECV、RMSEP分別為0.9858,0.9811,0.1518MJ/kg,0.1613MJ/kg。其中,RMSECV下降84.06%,RMSEP下降84.15%。表1為變量重組前后的定量模型評估指標(biāo),表中灰分和揮發(fā)分含量的單位為wt%,熱值的單位為MJ/kg。綜上所述,變量重組后灰分、揮發(fā)性物質(zhì)和熱值校準(zhǔn)模型的RMSEP降低53~84%,這意味著變量重組后的定量模型可以更好的預(yù)測煤質(zhì)工業(yè)指標(biāo)含量。
圖3變量重組前后的定量分析結(jié)果
表1變量重組前后OLS定量模型的評估指標(biāo)
四、特征工程的可解釋性實驗
為了驗證這種全光譜特征選擇方法對于LIBS煤炭原始光譜數(shù)據(jù)集的可解釋性,分別對灰分、揮發(fā)分和熱值校準(zhǔn)模型中獲取的重組變量進行相關(guān)性排序。并基于煤樣LIBS全光譜波點載荷的累積值,來提取三種煤質(zhì)指標(biāo)相關(guān)的原子或分子特征譜線。首先,對每個校準(zhǔn)模型重組變量的相關(guān)性進行排序,排序結(jié)果如圖4中的(a)、(c)和(e)所示。由圖可知,前20個重組變量與目標(biāo)校準(zhǔn)值的相關(guān)性較高。但是,隨著重組變量個數(shù)的增加,可以看到重組變量的相關(guān)性曲線并不平坦。這是因為解釋原始光譜方差的方向不一定與校準(zhǔn)值更相關(guān)。雖然,后續(xù)重組變量的相關(guān)性減弱,但是依舊包含與目標(biāo)校準(zhǔn)值相關(guān)的真實信息。經(jīng)過重組變量,從煤炭光譜數(shù)據(jù)中提取了更多的相關(guān)特征作為輸入變量。
圖4變量重組的相關(guān)性排序和全光譜波點的篩選結(jié)果
然后,計算每個校準(zhǔn)模型中重組變量在全光譜波點載荷上的累積相關(guān)值,并將每個波點載荷的累積相關(guān)值調(diào)整到區(qū)間[1,-1]。最后再分為以下四個步驟:(1)對LIBS全光譜進行尋峰,得到283個譜線。(2)選定[email protected]和[email protected]兩條連續(xù)元素特征譜線進行洛倫茲峰值擬合。(3)對累積相關(guān)值中絕對值較大的波點進行篩選。(4)根據(jù)NIST原子光譜數(shù)據(jù)庫對篩選后的波點進行判定,從而得到三種煤質(zhì)指標(biāo)相關(guān)的元素特征譜線?;谌庾V波點載荷篩選后的結(jié)果如圖4中的(b)、(d)和(f)所示,從灰分、揮發(fā)分和熱值定量模型的輸入變量中提取的元素特征譜線如表2所示。
表2從NIST數(shù)據(jù)庫中提取灰分、揮發(fā)分和熱值的特征譜線波長
煤中的灰分主要由金屬元素氧化物組成,包括CaO、MgO、K2O、Na2O、SiO2、TiO2、Al2O3、Fe2O3等。因此,Ca、Mg、K、Na、Si、Ti、Al、Fe和Zn等金屬元素可作為影響灰分含量的關(guān)鍵指標(biāo)。類似地,C、H、O、N、S等非金屬元素和Si、Fe、Ca、Mg和Ti等金屬元素決定了煤的揮發(fā)性成分和熱值。變量重組后,提取煤炭灰分、揮發(fā)分和熱值相關(guān)的元素特征譜線分別如圖5中的(a)、(b)和(c)所示。對于灰分含量,獲得了二十九條特征譜線,包括八種金屬元素(K、Ti、Fe、Zn、Na、Mg、Ca、Si)、三種非金屬元素(C、N、O)和一條CN雙分子譜線。其中,金屬元素對應(yīng)于灰分的主要成分,非金屬元素和[email protected]均與灰分呈負(fù)相關(guān)。對于揮發(fā)分,獲得了包括金屬和非金屬元素在內(nèi)的25條特征譜線。其中,有五種金屬元素(Ti、Fe、Ca、Si、Na),五種非金屬元素(C、H、O、N、S)和三種CN雙分子譜線。值得注意的是,[email protected]、[email protected]、[email protected]、[email protected]、[email protected]、[email protected]、[email protected]、[email protected]與揮發(fā)性物質(zhì)呈正相關(guān),[email protected]呈負(fù)相關(guān)。
圖5變量重組后元素特征譜線的提取結(jié)果
這是因為揮發(fā)分的組成成分主要包括碳?xì)浠衔?、氫氣和一氧化碳等物質(zhì)。而在高溫下,硫與碳會反應(yīng)形成硫化物,從而抑制煤中揮發(fā)性物質(zhì)的釋放。因此,隨著煤中硫含量的增加,煤中的揮發(fā)分會減少。[email protected]、[email protected]和[email protected]的負(fù)相關(guān)可能是揮發(fā)分測試集擬合系數(shù)僅為94.29%的主要原因。對于熱值,獲得了包括金屬元素、非金屬元素和CN雙分子譜線在內(nèi)的27條特征譜線。其中,有五種非金屬元素(C、H、O、N、S)和六種金屬元素(Fe、Mg、Ca、Si、Ti、Na)。C、H、O、N和CN的譜線與熱值呈正相關(guān),而[email protected]與熱值呈負(fù)相關(guān)。這是因為煤中的C、H、O、N是產(chǎn)生熱量的主要來源,硫化物的形成會導(dǎo)致煤的熱值下降。因此,降低煤中的硫含量可以增加其揮發(fā)分和熱值。而當(dāng)煤炭在正??諝夥諊逻M行LIBS實驗時,碳和氮反應(yīng)產(chǎn)生的CN雙分子線也會通過碳元素間接影響揮發(fā)分和熱值。
五、結(jié)論
對于煤炭的灰分、揮發(fā)分和熱值,利用LIBS技術(shù)并基于全譜點解釋方差與校準(zhǔn)值之間的相關(guān)性,對輸入變量進行了重組處理,分別建立了三種定量檢測模型。經(jīng)變量重組后,從原始光譜中提取了更多與目標(biāo)任務(wù)相關(guān)的元素特征譜線來預(yù)測灰分(從18到100)、揮發(fā)分(從7到99)和熱值(從18至113)。結(jié)果表明,變量重組后灰分、揮發(fā)分和熱值定量模型的R2分別為0.9818、0.9429和0.9811,RMSECV和RMSEP分別降低了51.87~84.06%和53.65~84.15%。為了證明變量重組對于煤炭LIBS光譜的可解釋性,本章又基于全光譜波點載荷和變量重組的相關(guān)性完成了進一步的可解釋性實驗。結(jié)果表明,八種金屬元素與灰分的主要成分相對應(yīng),三種非金屬元素與CN雙分子譜線均呈負(fù)相關(guān)。揮發(fā)分包括五種非金屬元素和五種金屬元素,其中氮和一些碳元素的負(fù)相關(guān)性降低了校準(zhǔn)模型的預(yù)測能力。熱值包括五種非金屬元素和六種金屬元素。揮發(fā)分和熱值與非金屬元素的正相關(guān)性符合其物質(zhì)組成成分。硫元素的負(fù)相關(guān)性是由于煤在燃燒過程中產(chǎn)生了硫酸鹽和含硫氧化物,而較高的硫元素水平會導(dǎo)致煤炭揮發(fā)量和熱值較低。上述定量分析過程證明了LIBS技術(shù)結(jié)合變量重組后的定量模型能夠準(zhǔn)確煤炭的灰分、揮發(fā)分和熱值。后續(xù)對于不同類型的煤樣,該方法還可以通過基體效應(yīng)校正進行優(yōu)化。此外,該方法還可以推廣到煤炭和其他物質(zhì)中主要元素的檢測。
推薦:
一體式LIBS激光誘導(dǎo)擊穿光譜系統(tǒng)
LlBS激光誘導(dǎo)光譜系統(tǒng)是該技術(shù)通過超短脈沖激光聚焦樣品表面形成等離子體,利用光譜儀對等離子體發(fā)射光譜進行分析,識別樣品中的元素組成成分,可以進行材料的識別、分類、定性以及定量分析。