?

基于支持向量機的白酒上甑探汽方法研究

2020-03-06 04:54田萬春張貴宇庹先國吳昊翰
食品與機械 2020年1期
關鍵詞:超平面直方圖灰度

田萬春 張貴宇,3 庹先國 吳昊翰

(1. 四川輕化工大學人工智能四川省重點實驗室,四川 宜賓 644000;2. 四川輕化工大學自動化與信息工程學院,四川 宜賓 644000;3. 西南科技大學信息工程學院,四川 綿陽 621010)

中國白酒是世界六大蒸餾酒之一,其特有的固態發酵釀造工藝是中國勞動人民的智慧結晶,是依靠經驗的傳統手工釀造技藝?!吧憧堪l酵,提香靠蒸餾”是固態法白酒釀造經驗之一[1]?!吧憧堪l酵”是指酒體風味物質通過糧食發酵產生,受微生物種類、數量及當地氣候條件等諸多因素影響,發酵工藝造就了酒的香型?!疤嵯憧空麴s”是指酒體風味物質的提取主要靠蒸餾,蒸餾工藝直接影響白酒的產量與品質。上甑是蒸餾的最重要工藝之一,要求“探汽上甑,薄層加料”[2],即在酒蒸汽前鋒即將逸出酒醅表面時才鋪撒一層薄薄的冷料,從而創造最佳的溶酯條件[3],最大限度地提取風味物質。傳統釀造生產中,“探汽”全憑釀造師經驗把控,如果提前鋪料會導致酒蒸汽不能順利上升,造成“壓汽”現象,不能有效提取風味物質,從而影響白酒品質;延遲鋪料則會導致酒蒸汽逸出,造成“跑汽”現象,降低產量。

近年來,隨著白酒企業自動化轉型進程的推進,白酒自動化釀造技術取得了長足發展,同時也對“探汽上甑”提出了新的要求,大量的專家學者對“探汽”進行了深入研究。楊一帆等[4]通過圖像處理手段分離酒醅圖像中的前景和背景,再檢測蒸汽溢出區域確定鋪料區域,但該方法作用于“跑汽”之后,只能做到見汽鋪料,不能做到“探汽上甑”。張家雙等[5-6]將酒醅表面的紅外圖像進行二值化處理,通過閾值分割的方法提取鋪料區域。酒醅紅外圖像描述的是酒醅表面溫度分布情況,其灰度值與酒醅表面溫度值存在映射關系[7],灰度閾值分割方法本質上是設定溫度閾值分割出高溫區域。雖然該方法取得了一定成功,但從酒企應用情況來看效果不夠理想,容易造成跑汽、壓汽,影響出酒質量和產量。

支持向量機(SVM)是Vapnik等[8]提出的一種基于結構風險最小化原則的模式分類方法,在解決非線性、高維度的小樣本分類問題上表現出較好性能。其算法原理是在樣本空間中尋找一個分隔超平面將樣本集分為兩類,樣本間的間隔最大時為最優超平面。試驗擬提出一種基于灰度直方圖特征與支持向量機相結合的探汽方法,通過從紅外圖像灰度直方圖提取多個特征,并結合釀造師上甑經驗訓練SVM模型,獲得較高的探汽效率和準確率,為實現自動化探汽上甑技術提供理論依據。

1 材料與方法

1.1 材料與儀器

1.1.1 試驗材料

酒醅:宜賓市云天曲酒廠。

1.1.2 儀器與設備

紅外熱成像儀:FLIR A310型,美國菲力爾公司;

甑桶(見圖1):ZCLZJ200型,自主設計。

1. 甑篦 2. 紅外熱成像儀 3. 溫度傳感器 4. 內膽 5. 保溫材料 6. 外殼 7. 旋轉軸 8. 傳感器信息處理機構 9. 傳感器安裝槽圖1 甑桶結構圖Figure 1 Structure diagram of distilling pot

1.2 方法

1.2.1 圖像采集、標記 通過紅外熱成像儀采集上甑時甑桶內酒醅表面紅外圖像,對應釀造師的上甑操作將圖像標記為3類。

(1) 等待上甑:紅外圖像表現為無白熱區域,圖像整體呈灰暗狀態,表明酒蒸汽未到達表層酒醅。

(2) 補料操作:紅外圖像表現為有少量白熱區域,表明局部區域酒蒸汽上升較快,通過補料操作避免“跑汽”現象。

(3) 整層鋪料操作:紅外圖像表現為有大部分白熱區域,表明酒蒸汽已到達表層酒醅。

1.2.2 圖像預處理 采用中值濾波技術抑制噪聲。

1.2.3 灰度直方圖 將酒醅紅外圖像轉換為灰度直方圖,用橫坐標表示灰度級,縱坐標表示該灰度級上出現像素點的概率[9]。按式(1)計算概率。

(1)

式中:

i——第i級灰度級;

ni——第i級灰度級的像素數;

N——紅外圖像的總像素數;

L——紅外圖像灰度級。

FLIR A310紅外熱成像儀采集的圖像深度為8位,分辨率為640×480,即紅外圖像總像素為307 200,灰度級為256。

1.2.4 特征提取 為了進一步降低酒醅紅外圖像的數據維度及擬合度,減少探汽模型訓練時間、提高探汽準確度,需進一步對灰度直方圖進行特征提取,灰度直方圖統計特征如表1所示。

單一特征提取不能有效反映酒醅紅外圖像本質特征,因此,提取多個特征訓練模型提高探汽準確性。

1.2.5 分類器設計 一個超平面只能從樣本集中分隔出一類樣本,因此使用3個SVM分類器組合成探汽分類器,依次從樣本集中分隔出3類紅外圖像?;叶戎狈綀D特征構成的樣本集可表示為:

表1 灰度直方圖統計特征Table 1 Statistical features of grayscale histogram

D={(x1,y1),(xi,yi),…,(xn,yn)},

(2)

式中:

(xi,yi)——第i個樣本點;

xi——第i張紅外圖像的灰度直方圖特征構成的向量,i=1,2,…n;

yi——第i張紅外圖像的分類標簽,yi∈{1,2,3}。當yi=1時,表示圖像i為等待上甑類;當yi=2、 3時,分別表示圖像i為補料操作類和整層鋪料操作類。

在樣本空間中,超平面可描述為:

wTxi+b=0,

(3)

式中:

w——超平面法向量,w=(w1,w2,…,wn);

n——xi的維度;

b——位移項。

w決定了超平面的方向;b決定了超平面與原點之間的距離[10]。

對于線性可分的理想情況,假設存在超平面P能夠將某一類紅外圖像從訓練樣本集中分隔出來。令ti=+1表示該類紅外圖像,記為正例,ti=-1表示樣本集中剩余的兩類紅外圖像,記為負例,平行且通過離超平面最近的樣本點的平面P1、P2可定義為:

(4)

距離超平面P最近的訓練樣本點使得式(4)中等號成立,被稱為“支持向量”,平面P1、P2到超平面P的距離之和為:

(5)

γ被稱為“間隔”,如圖2所示。

圖2 支持向量與間隔Figure 2 Support vectors and intervals

圖2表示線性可分的理想狀態,通過試驗發現樣本集中少數酒醅紅外圖像不能被超平面正確分開,于是引入松弛變量ξi≥0,使函數間隔加上松弛變量≥1[11]。則約束條件為:

yi(wTxi+b)≥1-ξi。

(6)

若要使間隔γ取得最大值獲得最優超平面,則需使‖w‖-1最大化,等價于求取‖w‖2的最小值。對式(6)的松弛變量ξi增加代價函數[12],則目標函數為:

(7)

式中:

C——懲罰參數,C>0。

懲罰系數C代表對錯分樣本的懲罰力度,其值越大表示懲罰越重,模型泛化能力越低。聯立式(6)、(7)可得一個凸二次規劃問題,利用拉格朗日乘數法便可得到其對偶問題[13]:

(8)

式中:

αi——拉格朗日乘子向量,αi=(α1,α2,…,αn)T。

由于酒醅紅外圖像樣本呈非線性分布,因此,采用核函數將樣本點映射到一個更高維度的空間中,使其在高維空間中線性可分[14],以提高探汽準確性。支持向量機常用的核函數有[15]:

多項式核函數:

(9)

式中:

α——調節參數;

b——可選常數;

d——最高次項次數。

高斯核函數:

(10)

式中:

σ——帶寬,控制徑向作用范圍;

高斯核函數是特征向量xi,xj歐氏距離的單調函數。

Sigmoid核函數:

(11)

式中:

β——調節參數;

核函數及其參數的選取決定了支持向量機的分類性能,對各個核函數依次使用網格搜索選取合適的參數使其達到最佳探汽效果,如表2所示。

由表2可知,當懲罰參數C=90、σ=0.081時,高斯核函數分類效果最佳,正確率達96%,高于其他核函數分類準確率,耗時略長,但整體效果最好。因此試驗選擇高斯核函數,優選懲罰參數C=90、σ=0.081。

表2 不同核函數的分類效果Table 2 Classification effect of different kernel functions

2 結果與分析

2.1 紅外圖像分類

由圖3可知,不同的蒸汽上升情況在紅外圖像上體現出的白熱化程度不同,蒸汽離酒醅表面越近白熱化程度越高。白熱區域面積大小與上甑操作存在對應關系,面積越大,需鋪撒酒醅量越多。因此,可根據紅外圖像的白熱程度和白熱區域面積大小對紅外圖像進行分類,實現自動化探汽。

圖3 3類紅外圖像Figure 3 Three types of infrared images

2.2 中值濾波處理

由圖4可知,噪聲得到了有效抑制,避免了圖像特征模糊[16],較好地保留了圖像細節和減少了圖像邊界失真。

2.3 灰度直方圖處理

由圖5可知,3類紅外圖像體現出不同的形態特征[17]:灰度值分布范圍不同,等待上甑與補料操作的像素灰度值比較集中,整層操作的灰度值則較為分散,離散程度較大;最大概率的灰度值所處灰度級不同,等待上甑的最大概率灰度值所處灰度級最低,整層鋪料操作的最大概率灰度值所處灰度級最高;最大概率值不同,等待上甑的最大概率值最高,整層鋪料操作的最大概率值最低。

由圖5還可知,3類紅外圖像在形態上具有明顯差異,且在一定程度上降低了酒醅紅外圖像的數據維度,但仍不能有效反映酒醅紅外圖像的本質特征,直接使用灰度直方圖訓練探汽模型不能得到理想的探汽效果。

圖4 中值濾波效果圖Figure 4 Median filtering effect graph

圖5 灰度直方圖Figure 5 Grayscale level histogram

2.4 灰度直方圖特征提取

根據特征公式提取灰度直方圖特征,如表3所示。

由表3可知,蒸汽離酒醅表面越近,紅外圖像白熱化程度越高,其圖像整體越明亮、明暗更分明、紋理更復雜,平均灰度、標準偏差、信息熵越大;灰度直方圖越不對稱,偏斜度越大,像素值分布越離散,灰度范圍越大;不同類紅外圖像間的特征值差異較大,具有可區分性;同類紅外圖像間的特征值差異較小,具有可靠性。綜上,灰度直方圖特征能夠反映蒸汽上升情況,且維度較低,適合作為分類器的訓練特征。

3 實驗驗證

采用上述方法,共采集776張上甑紅外圖像樣本,依據釀造師的經驗將圖像分為3類:等待上甑圖像,共212張;補料操作圖像,共278張;整層鋪料圖像,共286張。將所有圖像轉換為灰度直方圖并提取特征,將67%樣本作為訓練集,剩余33%作為測試集,測試結果如表4所示。

表3 特征列表(部分)Table 3 Feature list (part)

表4 訓練與測試結果Table 4 Training and test results

由表4可知,SVM的平均分類正確率達96%,具有實用價值。其中等待上甑圖像與整層鋪料操作圖像分類準確率高,補料操作分類準確率較低,是由于不同的圖像存在有相同或相似的灰度直方圖。等待上甑圖像無白熱區域,無論是圖像視覺特征還是灰度直方圖統計特征都與其他圖像差異較大,因此分類正確率最高;補料操作與整層鋪料操作圖像都有白熱區域,某些圖像的白熱區域在視覺上表現為面積大小與分布位置不同,視覺效果差異明顯。因而釀造師將其判斷為不同類別,做出不同的上甑操作,而灰度直方圖的差異比較小,導致SVM的分類出現誤差。

由表5可知,支持向量機的探汽準確度遠高于邏輯回歸、線性判別分析等算法[18],因此支持向量機算法更適合白酒探汽工藝,有助于提高探汽準確性。

表5 分類模型對比Table 5 Classification model comparison

4 結論

試驗通過采集酒醅表層的紅外灰度圖像間接獲取溫度分布信息,將探汽問題抽象為圖像分類問題。為了避免前人閾值分割法存在的單一特征分類精度低的缺陷,采用多個特征作為分類依據,同時結合SVM算法引入人工探汽經驗,極大地提高了探汽準確性和實用性。使用測試數據對探汽模型進行測試,正確率為96%,達到“探汽上甑”工藝要求,能滿足生產需求,對白酒上甑工藝實現自動化具有積極促進作用。試驗通過灰度直方圖提取特征時,丟失了像素坐標信息,使探汽結果不能直接用于引導上甑機器人完成鋪料操作,鋪料區域坐標信息的提取將是后續研究的重點。

猜你喜歡
超平面直方圖灰度
符合差分隱私的流數據統計直方圖發布
采用改進導重法的拓撲結構灰度單元過濾技術
一種改進的多分類孿生支持向量機
基于非線性核的SVM模型可視化策略
有限維Banach空間中完備集的構造
Bp-MRI灰度直方圖在鑒別移行帶前列腺癌與良性前列腺增生中的應用價值
基于FPGA的直方圖均衡圖像增強算法設計及實現
Arduino小車巡線程序的灰度閾值優化方案
用直方圖控制畫面影調
中考頻數分布直方圖題型展示
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合