清空記錄
歷史記錄
取消
清空記錄
歷史記錄
基于LIBS的山藥飲片產(chǎn)地溯源研究
一、引言
激光誘導(dǎo)擊穿光譜作為一種新興的基于原子發(fā)射光譜的元素分析技術(shù),憑借樣品前處理簡(jiǎn)單、微損甚至無(wú)損、在線原位檢測(cè)等優(yōu)點(diǎn),已被廣泛應(yīng)用于地質(zhì)勘探、工業(yè)監(jiān)測(cè)、醫(yī)學(xué)檢測(cè)等方面,是一種極具應(yīng)用前景的成分分析技術(shù)。近年來(lái),LIBS在中藥成分檢測(cè)領(lǐng)域逐漸興起。運(yùn)用LIBS信號(hào)強(qiáng)度變化率結(jié)合移動(dòng)窗標(biāo)準(zhǔn)差法快速評(píng)價(jià)朱砂和雄黃混合過(guò)程,結(jié)果證明了LIBS在監(jiān)測(cè)中藥制藥生產(chǎn)方面的潛力。采用LIBS技術(shù)測(cè)定了18種波蘭草藥中鈣、鉀和鎂等其他金屬元素(鈉、銅、鐵、錳、鋅等),并對(duì)其中的鈣、鉀和鎂進(jìn)行定量分析,結(jié)果與一致。將近紅外光譜與LIBS光譜相結(jié)合來(lái)區(qū)分國(guó)產(chǎn)和進(jìn)口黃芪,使用近紅外光譜的SVR系數(shù)與35個(gè)LIBS譜峰值進(jìn)行識(shí)別準(zhǔn)確率達(dá)95.8%,與單獨(dú)使用近紅外光譜(91.5%)相比,準(zhǔn)確率提高了4.3%。以上研究證明了LIBS技術(shù)在中藥成分檢測(cè)中的可行性。然而,基于LIBS技術(shù)的中藥產(chǎn)地溯源研究較少,仍處于起步階段,目前的研究都存在藥材產(chǎn)地?cái)?shù)量少,識(shí)別準(zhǔn)確率較低等問(wèn)題。因此,基于LIBS技術(shù)結(jié)合人工智能算法對(duì)不同產(chǎn)地的山藥進(jìn)行系統(tǒng)性研究。我們搭建LIBS試驗(yàn)系統(tǒng)并結(jié)合多元散射矯正-改進(jìn)遺傳算法-支持模型來(lái)識(shí)別8種不同產(chǎn)地的山藥飲片。八種產(chǎn)地的山藥飲片磨粉過(guò)篩后制成粉末壓片,通過(guò)采集山藥飲片的LIBS光譜,分別使用單一分類器與光譜預(yù)處理、特征提取及模式識(shí)別算法的模型對(duì)光譜的識(shí)別結(jié)果進(jìn)行對(duì)比。結(jié)果顯示,LIBS技術(shù)結(jié)合模型可以準(zhǔn)確且快速識(shí)別山藥產(chǎn)地。
2.實(shí)驗(yàn)部分
2.1 儀器
所用的LIBS實(shí)驗(yàn)裝置如圖1所示
2.2 樣品制備
用八類不同產(chǎn)地的山藥飲片,如表1所示,由于山藥飲片產(chǎn)地、炮制工藝以及價(jià)格各不相同,導(dǎo)致它們藥用價(jià)值存在差異。實(shí)驗(yàn)中樣本的處理流程如圖2所示。首先,使用研缽將飲片研磨成粉過(guò)100目篩。然后,使用電子天平稱量9g硼酸粉末和1g樣品粉末,在壓樣機(jī)30t壓力下將待測(cè)樣品壓制成直徑為40mm的圓餅狀壓片。每種產(chǎn)地的山藥飲片使用3個(gè)重復(fù)樣本,共制備24個(gè)壓片。
表1實(shí)驗(yàn)所用藥材飲片
3.結(jié)果與討論
3.1 光譜分析
各類藥材飲片(S1-S8)的平均光譜及典型峰值如圖3所示。各類藥材的平均光譜整體趨勢(shì)一致,所含譜峰基本相同,但峰強(qiáng)度各不相同,分析認(rèn)為不同產(chǎn)地的山藥富集能力存在差異,道地山藥對(duì)一些金屬元素的富集能力大于非道地產(chǎn)區(qū)山藥。圖中,譜峰代表的金屬元素有K,Na,Ca,Mg,Al等,非金屬元素有C,H,O及C-N鍵等。其中,K元素特征譜線(769.90nm)的峰值最強(qiáng),即山藥飲片中K元素含量最多,相關(guān)研究表明山藥根莖對(duì)K元素的富集能力最強(qiáng)。為剔除光譜中大量的冗余信息,觀察圖3并選擇峰值較為明顯的35條特征譜線作為特征提取的預(yù)選譜線,如表2所示。
圖2藥材飲片的平均光譜
表2所選特征譜線
3.2 單一分類器產(chǎn)地溯源
對(duì)八種產(chǎn)地山藥飲片24565維的原始光譜進(jìn)行產(chǎn)地溯源,使用SVM,KNN和EML三種模式識(shí)別方法的分類結(jié)果如圖4所示。圖中顯示,三種模型的交叉驗(yàn)證集和測(cè)試集準(zhǔn)確率均在90%以上,SVM模型的分類效果最好,交叉驗(yàn)證集準(zhǔn)確率為93.50%,測(cè)試集準(zhǔn)確率為96.43%。由于山藥飲片產(chǎn)地種類多、光譜維度高,原始信號(hào)數(shù)據(jù)量大且包含噪聲和冗余特征,致使分類耗時(shí)長(zhǎng)且分類準(zhǔn)確率低,因此有必要對(duì)原始光譜進(jìn)行數(shù)據(jù)預(yù)處理和特征提取。
圖4原信號(hào)產(chǎn)地溯源結(jié)果
3.3 模型改進(jìn)
首先,使用三種預(yù)處理方法對(duì)八種產(chǎn)地山藥飲片的原始光譜進(jìn)行處理。在SG卷積平滑法中,選用5,7,9和11的窗口寬度進(jìn)行參數(shù)優(yōu)化,通過(guò)比較識(shí)別準(zhǔn)確率,確定本研究中所用窗口寬度為5。在WT預(yù)處理過(guò)程中,小波函數(shù)采用常用的db2,db4,db8,sym2,sym5和sym8,分解層數(shù)采用1-9層,最終確定選用db2函數(shù)2層小波分解為WT的最優(yōu)參數(shù)。經(jīng)過(guò)預(yù)處理后,各類光譜的CV均值和標(biāo)準(zhǔn)差如圖5所示。圖5顯示,無(wú)預(yù)處理時(shí)光譜的波動(dòng)性最大,各類光譜的CV均值為12.54%,經(jīng)過(guò)三種預(yù)處理后CV均值明顯下降,光譜的穩(wěn)定性明顯提升。MSC和WT的CV均值較為接近且小于SG卷積平滑法的CV均值,表明MSC和WT對(duì)光譜穩(wěn)定性的提升效果好于SG卷積平滑法。WT的CV均值小于MSC,但WT各類光譜CV的標(biāo)準(zhǔn)差較大,即各類光譜的波動(dòng)差距較大,而MSC各類光譜的波動(dòng)差距較小,MSC在減小光譜波動(dòng)性方面整體表現(xiàn)較好。
圖5各產(chǎn)地山藥光譜CV均值和標(biāo)準(zhǔn)差
對(duì)預(yù)處理后的光譜數(shù)據(jù)進(jìn)行特征提取。按表2選出35條特征譜線后,分別使用PCA和IGA進(jìn)行特征提取。不同光譜預(yù)處理下PCA選擇的主成分?jǐn)?shù)量與累積貢獻(xiàn)率的關(guān)系如圖6所示。當(dāng)累積貢獻(xiàn)率達(dá)到99%以上時(shí),MSC、SG卷積平滑、WT三種預(yù)處理方式下各選擇6,5和5個(gè)主成分,其累積貢獻(xiàn)率分別為99.23%(黑線)、99.03%(紅線)、99.07%(藍(lán)線)。針對(duì)不同預(yù)處理和模式識(shí)別方法處理的光譜,使用IGA提取的特征數(shù)量如表3所示。
圖6成分累積貢獻(xiàn)
表3在各方法下IGA提取的特征數(shù)量
表4各模型分類結(jié)果排序
表4顯示,排名前十的模型中接近一半的模型使用了MSC預(yù)處理方法,接近一半的模型使用了SVM模式識(shí)別方法。結(jié)果表明,MSC預(yù)處理方法和SVM模式識(shí)別方法有助于準(zhǔn)確識(shí)別山藥飲片產(chǎn)地。測(cè)試集準(zhǔn)確率排名前五的模型均使用了IGA進(jìn)行特征提取,在識(shí)別種類多、識(shí)別難度大的情況下,IGA比PCA更能清楚辨別光譜中的非線性關(guān)系,同時(shí)受噪聲的影響更小。MSC-IGA-SVM模型的產(chǎn)地溯源效果最好。MSC-IGA-SVM模型的交叉驗(yàn)證集準(zhǔn)確率為96.9%,測(cè)試集的準(zhǔn)確率為97.32%,與直接使用原信號(hào)建立的最好模型SVM(96.43%)相比,測(cè)試集準(zhǔn)確率提高了0.87%。同時(shí),MSC-IGA-SVM模型將輸入變量的維度減少了99.93%。
MSC-IGA-SVM模型對(duì)八種山藥飲片產(chǎn)地溯源的混淆矩陣如圖7所示,除了S4和S7有錯(cuò)誤分類現(xiàn)象外,其他類別均能正確識(shí)別。S1和S2雖然產(chǎn)地相同,但兩批山藥飲片炮制工藝不同,價(jià)格相差較遠(yuǎn),因此品質(zhì)存在差異,能進(jìn)行精確分類。而對(duì)于S4和S7,兩種產(chǎn)地山藥產(chǎn)地雖然不同,但存在錯(cuò)分現(xiàn)象。10.7%的S4錯(cuò)分為S7,同時(shí)10.7%的S7錯(cuò)分為S10。
為進(jìn)一步探究錯(cuò)誤分類原因,對(duì)IGA選取的特征進(jìn)行三維成像,如圖8所示,S4與S7存在重疊區(qū)域,其數(shù)據(jù)存在相似性。S4為廣西南寧無(wú)硫高溫烘焙的價(jià)值為31元/500g的山藥飲片,S7為安徽池州無(wú)硫低溫烘焙的價(jià)值為18.5元/500g的山藥飲片。兩者產(chǎn)地相差較遠(yuǎn),且炮制工藝不同,難以辨別的原因推測(cè)是山藥種植品種、種植條件等方面存在共性。
圖7MSC-IGA-SVM模型分類結(jié)果的混淆矩陣
圖8MSC-IGA數(shù)據(jù)圖
(a):前三個(gè)特征;(b):次三個(gè)特征
四、總結(jié)
針對(duì)山藥飲片的產(chǎn)地溯源問(wèn)題,使用LIBS技術(shù)結(jié)合MSC-IGA-SVM模型對(duì)產(chǎn)地識(shí)別的準(zhǔn)確度進(jìn)行了改善。使用KNN、SVM和EML分類器對(duì)八類光譜直接使用原信號(hào)進(jìn)行分類,SVM模型具有較強(qiáng)魯棒性,效果最好,其準(zhǔn)確率為96.43%。使用預(yù)處理(MSC、SG卷積平滑、WT)、特征提取(PCA和IGA)的方法對(duì)模型改進(jìn),MSC-IGS-SCM模型的識(shí)別效果最好,其能有效降低光譜波動(dòng)性,同時(shí)輸入變量維度降低了99.93%,將測(cè)試集準(zhǔn)確率提升為97.30%。結(jié)果表明,LIBS技術(shù)結(jié)合MSC-IGA-SVM模型能夠準(zhǔn)確且快速對(duì)山藥飲片進(jìn)行產(chǎn)地溯源。
推薦:
激光誘導(dǎo)擊穿光譜技術(shù)在低碳鋼鐵冶金行業(yè)的應(yīng)用
LlBS激光誘導(dǎo)擊穿光譜系統(tǒng)是該技術(shù)通過(guò)超短脈沖激光聚焦樣品表面形成等離子體,利用光譜儀對(duì)等離子體發(fā)射光譜進(jìn)行分析,識(shí)別樣品中的元素組成成分,可以進(jìn)行材料的識(shí)別、分類、定性以及定量分析。