当前位置: 简表范文网 > 专题范文 > 公文范文 >

基于LS-SVM的烤烟烟叶产地判别

| 来源:网友投稿

摘要:为了探索一种快速有效的烤烟烟叶产地鉴别方法,利用近红外光谱技术结合最小二乘支持向量机(LS-SVM)对烤烟烟叶的产地进行了判别。选择云南、湖北、河南三地不同等级烤烟烟叶作为研究对象,对原始光谱数据进行平滑和附加散射校正(MSC)预处理后再进行主成分分析,选择4~12个主成分作为输入变量进行LS-SVM建模。结果显示,该LS-SVM模型预测效果较好,预测相关系数rp≥0.990 7,预测标准误差(SEP)和预测均方根误差(RMSEP)分别为1.755 1和1.737 3,优于偏最小二乘回归(PLS)的预测结果,基于LS-SVM的近红外光谱技术能够很好地对烟叶产地进行判别。

关键词:烟叶;产地判别;近红外光谱;最小二乘支持向量机

中图分类号:TN219 文献标识码:A 文章编号:0439-8114(2012)03-0583-03

Identification of Producing Area of Tobacco Leaf Based on LS-SVM

ZHANG Ying1a,1b,HE Li-yuan1b,YE Ying-ze1c,WU Zhao-hui2

(a. College of Science; b. College of Resources and Environment; c. Network Center, 1.Huazhong Agricultural University, Wuhan 430070, China; 2. Tobacco Research Center of Henan Academy of Agricultural Sciences, Xuchang 461000, Henan, China)

Abstract: In order to explore a fast and efficient method which determines the producing area of tobacco leaf, near-infrared reflectance spectroscopy with least squares-support vector machines (LS-SVM) was applied to determine producing area of tobacco leaf. Three producing areas including Yunnan, Hubei and Henan were selected as the research objects. As the pretreatments of the optimal smoothing way, moving average with three segments and multiplication scatter correction (MSC) were applied to reduce the noise of the spectra. After the principle component analysis, 4 to 12 principal components (PCs) were chosen as the inputs of LS-SVM models. The Results show that the prediction performance of the LS-SVM model with 12 PCs is better than partial least square(PLS) model. Its correlation coefficient of prediction set (rp) is 0.990 7, standard error of prediction (SEP) is 1.755 1, and root mean square error of prediction (RMSEP) is 1.737 3. It is concluded that NIR spectroscopy with LS-SVM is a feasible method to determine the producing area of tobacco leaf.

Key words: tobacco leaf; origin discriminant; NIR spectroscopy; least squares-support vector machines (LS-SVM)

烟草是我国重要的经济作物,烟叶的品质与遗传因素、栽培措施、调制技术和产地环境等密切相关。其中,产地环境(海拔、温湿度、气候条件等)对烟叶品质的影响极为明显,也是构成不同品牌卷烟特有风格的基础,但不同产地的烟叶特征迄今难以量化描述。目前,对烤烟烟叶产地的判别除依赖感官评定外,需要对其化学成分进行分析,判别过程费时、费力。因此,研究一种能够快速、准确地对烤烟烟叶产地进行判别的方法非常必要。

Maha等[1]采用神经元网络方法对美国本土及国外1 000多个烟叶样品的近红外光谱(NIRs)信息进行分析,对本国烟叶取得了很好的模式识别结果。国内研究人员曾采用NIR法预测了烟草根、茎、叶中的蛋白质、总糖、总氮、总植物碱等[2,3],采用主成分分析的马氏距离法判别烟叶产地归属,获得了较佳的识别准确率[4]。但上述研究均需要对烟叶进行切丝过筛,属于有损检测且费时费力。用NIR法专门针对收购环节进行完整烟叶品质分析预测烟叶产地尚无研究报道。试验采用近红外波段(867~258 9 nm)进行光谱扫描,应用最小二乘支持向量机(LS-SVM),建立了LS-SVM判别分析组合模型,实现了烤烟烟叶产地的快速准确判别。

材料与方法

1.1 仪器及参数

试验使用光谱检测设备是Ocean Optics公司的NIR256-2.5光纤光谱仪,配套的QBIF600-VIS-BX白金级Y形分叉光导纤维探头,仪器光谱采样间隔6 nm,测定波长867~2 589 nm,光纤探测器与样品垂直,暗室温度18~22 ℃,相对湿度22%~25%,以14.5 V、50W卤素灯为惟一光源,光源与样品夹角45°。开机预热1 h后进行光谱扫描,采样方式是漫反射,采样软件是机器自带的Spectra Suite。分析软件采用ASD View Spec Pro、Unscramble V9和DPS(Data Procession System for Practical Statistics)。积分时间设置为250 mm,平滑度设置为9,平均次数为3,即对每个样品自动扫描3次取平均值。

1.2 样本制备

收集了2010年10月云南、河南、湖北三省的烟草公司提供的已由专家人工定级的烟叶。为保证试验结果的代表性,每个产地烟叶按7个分组每组1~4个等级随机选择90个样本。根据文献[5]报道,直接将烟叶样品平铺置于载物台上,采用漫反射模式采集近红外光谱,光谱扫描稳定后进行数据采集。保存3条光谱曲线,以其平均光谱作为最终的反射光谱。从全部270个样本中,每个产地随机选择30个共90个样本作为预测集,剩余的180个样本作为建模集。

1.3 光谱数据预处理

首先采用Savitzky-Golay平滑法,平滑点数取5,用以去除光谱曲线中的高频成分,保留有用低频信息,然后进行附加散射校正(Multiplication Scatter Correction, MSC)处理,以降低烟叶样本表面不均质的散射对光谱数据造成的影响。为了消除光谱数据在首尾两端产生的较大噪音,只取1 101~2 395 nm波段的数据进行分析,以提高测量数据的信噪比[5]。

2 结果与分析

2.1 光谱图分析

图1为不同产地烟叶样本的光谱图。从图1可以看出,不同产地烟叶的光谱交错重叠。由于近红外光谱包含了噪声、环境、仪器响应、人为操作误差等各种干扰因素,再加上烟叶样本表面不均质特性,这些都对光的漫反射有一定影响。要消除这些因素的影响,需要结合化学计量学方法对所得的光谱数据进行处理,从而建立起烟叶不同产地的鉴别模型。

2.2 主成分分析结果

在1 101~2 395 nm光谱范围内一共有193个输入变量。虽然这些输入变量能够作为输入值进行LS-SVM建模,但是为了提高模型建立的运算速度,减少其中的运算量,试验采用主成分分析法[6,7]先提取光谱的主成分。主成分分析中主成分数的选择非常重要,如果建立模型使用主成分数过少,则不能反映未知样本被测组分产生的测量数据变化,其模型的预测能力就会降低;如果选择的主成分数过多,就会将一些代表噪声的主成分加入到模型中,同样会使模型的预测能力下降。

利用主成分分析法将经过平滑和附加散射校正预处理后的光谱数据输入变量进行降维,得到的前12个主成分的累积贡献率如表1所示。从表1可知,前12个主成分的累积可信度已达到99.84%以上,说明其能够很好地代表原始输入变量的信息,所以每个样本的光谱数据可以用前12个主成分代替。

选取前3个主成分得到3个不同产地烟叶光谱数据的主成分分析三维聚类图(图2)。从图2可以看出,3个不同产地烟叶样本之间的界限比较模糊,无法直接从图中加以区别。此外,前3个主成分的聚类图只能在3个维度范围内进行直观、定性地分析,难以定量地精确区分及预测。因此采用LS-SVM对光谱数据在主成分分析基础之上进一步分析。

2.3 LS-SVM建模及预测

分别用4~12个主成分进行LS-SVM建模,通过比较基于不同主成分数建立的预测模型的精度,最终确定最优主成分数,模型参数和精度比较结果如表2所示。由表2可知,以12个主成分数作为输入变量建立的LS-SVM模型预测效果最好,其预测相关系数rp达到0.990 7,且预测标准误差(Standard Error of Prediction,SEP)和预测均方根误差(Root Mean Square Error of Prediction,RMSEP)均较小,分别为1.755 1和1.737 3。

同时选用偏最小二乘法(PLS)建立的模型对烟叶产地进行预测,比较结果见表3,可以看到LS-SVM模型的预测效果好于PLS模型。说明LS-SVM模型能够更好地提取光谱中的有用信息,从而更加精确地预测烟叶产地。

3 小结

基于收购环节的烤烟烟叶质量评价及产地分析一直是烟草行业备受关注的问题,近红外无损检测过程比常见的化学方法简单、操作性强。试验进行了基于近红外光谱技术无损鉴别烤烟烟叶产地的研究,采用近红外光谱技术对不同产地的烤烟烟叶进行了检测。选择4~12个主成分数分别作为输入变量建立了LS-SVM模型,通过比较模型参数确定当输入变量为前12个主成分时,LS-SVM模型预测效果最好,预测相关系数可以达到0.990 7,且预测结果优于PLS模型。结果表明,运用基于LS-SVM的近红外光谱技术可以快速、无损地检测烤烟烟叶的产地,为今后进一步研究光谱技术应用于烤烟烟叶收购质量的检测提供了新的途径。

参考文献:

[1] MAHA H, MCCLURE W F. Applying artificial neural networks. II. Using near infrared data to classify tobacco types and identify native grown tobacco[J]. J Near Infrared Spectra,1997(5):19-25.

[2] 邓发达,朱立军,戴 亚,等. 近红外技术测定成品卷烟中总糖和还原糖及绿原酸的含量[J].安徽农业科学, 2010, 38(12):6181-6182,6188.

[3] 覃 鑫. 在线近红外光谱(NIR)快速测定烟草化学成分[J].西昌学院学报(自然科学版), 2010,24(1):52-54,79.

[4] 束茹欣,王国东,张建平,等. 国产烤烟烟叶的NIRS模式识别[J].烟草科技,2006(8):12-15,20.

[5] 章 英,贺立源. 基于近红外光谱的烤烟烟叶自动分组方法[J].农业工程学报,2011,27(4):350-354.

[6] 王徽蓉,李卫军,刘扬阳,等. 基于遗传算法与线性鉴别的近红外光谱玉米品种鉴别研究[J].光谱学与光谱分析,2011,31(3):669-672.

[7] 赵 磊,李继海,朱大洲,等. 5种鹿茸营养成分的主成分分析[J].光谱学与光谱分析,2010(9):2571-2575.

(责任编辑 王晓芳)

收稿日期:2011-08-08

基金项目:国家科技支撑计划项目(2006BAD10A1304);云南省烟草烟叶公司攻关项目(2009YN010)

作者简介:章 英(1978-),女,湖北枝江人,讲师,在职博士研究生,从事数字图像处理技术和农业信息化的研究工作,(电话)15307115201

(电子信箱)zy@mail.hzau.edu.cn;通讯作者,贺立源,男,河南巩县人,教授,从事农业信息化的研究工作,(电话)13971622358

(电子信箱)heliyuan@mail.hzau.edu.cn。

相关推荐

热门文章

关于珍爱生命作文800字高中【精选推荐】

范文参**网最近发表了一篇名为《2022关于珍爱生命的作文800字高中【】》的范文,感觉写的不错,希望对您有帮助,重新整理了一下发到这里。在平日的学习、工作和生活里,大家都不可避免地要接触到作文吧。下面小编为大家整理了2022关于的作文800字高中【5

2022清明网上祭英烈活动心得感悟经典范本10篇600字

本页是最新发布的《清明网上祭英烈活动心得感悟经典范文10篇600字》的详细范文参考文章,觉得有用就收藏了,希望大家能有所收获。清明祭心得感悟经典范文10篇600字说到清明节这个大家熟悉的节日,大家一定都是去祭拜祖先!但是可曾想过在清明节这天来祭奠我们的英烈们呢?下面是小编为您推荐

共青团成立100周年作文600字(完整)

本页是最新发布的《2022共青团成立100周年作文600字【精选】》的详细范文参考文章,好的范文应该跟大家分享,这里给大家转摘到。共青团员是中国共产党的后备力量,也是党的生命力的源,理论上的成熟是****上成熟的基础,****上的清醒来源于理论上的坚定。下面是小编为大家带来的

2022祖国在我心中演讲稿最新10篇(范文推荐)

最近发表了一篇名为《祖国在我心中演讲稿最新10篇》的范文,感觉很有用处,希望大家能有所收获。演讲是一门艺术。好的演讲自有一种激发听众情绪、赢得好感的鼓动性。要做到这一点,首先要依靠演讲稿思想内容的丰富、深刻,见解精辟,有独到之处,发人深思,语言表达要形象、生动,富有感染力。下面小编给大家带

2022全国中小学生安全教育日心得体会三篇

最近发表了一篇名为《2022全国中小学生安全教育日心得体会三篇》的范文,感觉写的不错,希望对您有帮助,重新编辑了一下发到。2022全国中小学生日心得体会三篇为贯彻落实珍爱,安全第一为主题的中小学安全日教育活动,我校领导高度重视,紧紧围绕安全日安全教育这一主线,在师生中开展了丰富多

2022年度关于端正态度作文初三(精选文档)

《2022关于端正态度的作文初三【精选】》是一篇好的范文,觉得有用就收藏了,看完如果觉得有帮助请记得(CTRL+D)收藏本页。在生活、工作和中,大家都不可避免地要接触到作文吧,作文是通过文字来表达一个主题意义的记叙方法。下面小编为大家整理了2022关于端正的作文初三【精选】的相关内容,以供参

草房子第一章秃鹤心得感悟合集【精选推荐】

《草房子第一章秃鹤的心得感悟》是一篇好的范文,觉得有用就收藏了,这里给大家转摘到。草讲述了发生在20世纪60年代初江南水乡动人动情的童年故事。读完了草房子小说,你有着怎样的草房子读书?你是否在找正准备撰写“草房子第一章秃鹤的心得感悟”,下面小编收集了相关的素材,供大家写文参考!草房子第

2022年大学生档案自我鉴定300字10篇

2022年普通大学生个人社会实践实习报告精选服务社会做好思想准备和业务准备,公司内部电脑系统都是统一英文系统,就要求自己以职场……[详细]2022年党员思想汇报例文两篇【完整版】所以在以后的学习和生活中,经历过苦难的中国,工作以及生活中,特别是通过学习党章党纪……[详细]企业员工服务意识培训心得体会

2022年爱细节作文600字初中范本

《2022爱的细节作文600字初中范文【】》是一篇好的范文,觉得应该跟大家分享,希望对网友有用。爱是冬日的一缕阳光,使饥寒交迫的人感到人间的温暖;爱是一场洒落在久旱的土地上的甘霖,使濒临绝境的人重新看到生活的希望;爱是一首飘落在夜空里的歌谣,使孤苦无依的人获得心灵的慰藉。下面小编为大家整理了20

2022年争先创优演讲稿最新10篇(完整文档)

《争先创优演讲稿最新10篇》是一篇好的范文,觉得有用就收藏了,这里给大家转摘到。演讲稿具有宣传、鼓动、教育和欣赏等作用,它可以把演讲者的观点、主张与思想感情传达给听众以及读者,使他们信服并在思想感情上产生共鸣。下面小编给大家带来关于争先创优演讲稿,希望会对大家的与有所帮助。争先创优演讲稿1

2022百年奋斗谋复兴勇毅前行兴伟业学习心得体会范本合集

《2022百年奋斗谋复兴勇毅前行兴伟业学习心得体会范文》是一篇好的范文,觉得有用就收藏了,希望对网友有用。2022百年奋斗谋复兴勇毅前行兴伟业学习心得体会范文了不起的红色精神,值得永远待播与发扬下去!相信祖国将会更加强大,更加繁荣富强。下面是小编为您推荐2022百年奋斗谋复兴勇毅前

2022年度《公民节约用水行为规范》倡议书范本

最近发表了一篇名为《2022《公民节约用水行为规范》倡议书范文【五篇】》的范文,感觉很有用处,看完如果觉得有帮助请记得(CTRL+D)收藏本页。虽然人类已浪费了许多,但是人类们已经感觉到水的可贵而开始保护起来。在此大家一起杜绝浪费水之源,保护水资源吧。下面小编在这里为大家精心整理了几篇20