自适应蚁群优化算法的近红外光谱特征波长选择方法

郭志明等
1引言
近红外光谱区是指波长在780~2526 nm范围内的电磁波,是分子振动光谱倍频和合频吸收谱,具有丰富的结构和组成信息,可用于碳氢有机物质的组成与性质的测量。与传统分析技术相比,近红外光谱具有无损检测、分析效率高、成本低、重现性好、样品测量一般不需预处理、适合于现场检测和在线分析等优势。随着近红外光谱分析技术、化学计量学和近红外光谱仪器的快速发展,近红外光谱分析技术已在许多领域得到广泛应用。借助先进的近红外光谱仪,研究者可快速获取大量光谱数据。但物质在该谱区的倍频和合频吸收信号弱,谱带重叠,解析复杂;且由于仪器所采集的数据除样品的自身信息外,还包含了其它无关信息和噪音,如电噪音、样品背景等,这些信息在预处理中很难全部消除;其次有些光谱区域样品的信息很弱,与样品的组成或性质间相关程度不高;另外,同一样本的光谱数据内部存在共线性关系,易产生数据冗余[1,2]。如果将这些数据都参与建模,不但计算量大、模型复杂,而且精度也受到影响。因此,光谱特征变量优选方法成为提高建模质量的关键环节。
目前,近红外光谱的特征变量选择方面的大量研究主要集中在特征波段的选择、特征波长的优选及波段和波长选择相结合的筛选方法。在特征波段的选择上主要有区间偏最小二乘法(iPLS)[3,4]、移动窗偏最小二乘法(MWPLS)、向前区间偏最小二乘法(FiPLS)、向后区间偏最小二乘法(BiPLS)和联合区间偏最小二乘法(SiPLS)[5,6]等;在特征波长的选择上主要有遗传算法(GA)、无信息变量消除(UVE)、连续投影算法(SPA)[7]、模拟退火算法(SAA)[8]和粒子群优化算法(PSO)等[4,9]。近红外光谱校正模型建立方法以偏最小二乘法(PLS)最为经典,且PLS应用广泛,一般认为其具有较强的抗干扰能力,对非海量数据建模稳定性较好。蚁群优化算法(Ant colony optimization, ACO)由Dorigo等于20世纪90年代初提出, 是人工智能或群体智能的新发展,具有分布计算、信息正反馈和启发式搜索的特征,已较好的解决旅行商、通讯、网络路由和定量构效关系等组合优化问题[10~12]。目前已有学者采用ACO算法进行光谱变量的选择[13~15],但信息素初始权值的分配有待进一步的研究。蚁群优化算法结合偏最小二乘法(ACOPLS)用于近红外光谱的特征波长选择,可实现光谱变量的全局搜索,建立精度高稳定性强的多元校正模型。
苹果可溶性固形物含量的近红外光谱检测研究多选取同一产地同批次或多个批次的苹果样本[16~18]。同一品种不同产区,因土壤、海拔、光照、水量、昼夜温差等气候差异, 苹果的外观特征和风味不同。另外,可溶性固形物主要是可溶性糖类,包括单糖、双糖,多糖等,难以直接确定其对应的特征波长,故需采用优化组合算法寻找光谱中最相关的信息。鉴于此,本研究利用蚁群算法启发式全局搜索的特点,结合蒙特卡罗轮盘赌随机选择机制,选择苹果可溶性固形物含量的近红外光谱特征波长,然后用偏最小二乘法建立不同产地苹果可溶性固形物含量混合分析模型,以提高近红外光谱预测模型的稳健性和适用性。
2实验部分
2.1实验材料
选用的富士苹果为我国苹果主产区山东、陕西和特产区新疆,选择无缺陷、损伤或污染物的苹果共207个,随机挑选138个(40个陕西、48个山东、50个新疆)作为校正集,其余的69个(20个陕西、24个山东、25个新疆)作为预测集,将它们分别编号后置于4 ℃冰柜中贮藏。实验前,将苹果从冰柜取出置于实验室中12 h,以使苹果样本整体温度与环境温度一致,试验过程保持实验室温湿度基本不变。
2.2光谱采集与标准值测定
2.3.3目标函数选取在优化过程中,目标函数表明了个体生存能力和群体的优化程度。建立一个好的目标函数,可加快收敛速度,提高计算精度。近红外光谱多元校正模型建立过程中,常采用交互验证法来评价模型的预测能力,即采用预测残差平方和、交互验证均方根误差、预测均方根误差和待测组分预测值与实测值间的相关系数等作为目标函数。本研究以均方根误差RMSE为评价指标,公式(4)中yi为样本SSC的实测值,t为预测值。均方根误差的值越小,对应校正模型的预测能力越好;并设置显著性因子Q,Q为常数,用于调整目标函数的收敛效度。
2.3.4算法流程蚁群优化算法是一种迭代算法。首先初始化信息素向量等相关参数,设置最大变量数、最大迭代次数、最大循环次数、蚂蚁群体大小,其中初始信息素向量值均置为1,即每个变量具有相同的被选择概率;其次,启动所有蚂蚁,采用蒙特卡洛轮盘转法随机从变量集中选择一个变量,直到变量数达到最大变量数,阶段性完成变量选择后建立偏最小二乘模型,输出均方根误差;再次,未达到最大迭代次数时,更新信息素向量,继续进行变量选择并建立偏最小二乘模型;最后,比较各次循环次数获得的偏最小二乘模型结果,输出最优解。
4结论
利用蚁群优化算法选择苹果可溶性固形物含量的近红外光谱特征波长,建立稳健精细的偏最小二乘分析模型。与全光谱偏最小二乘模型和遗传偏最小二乘模型相比,蚁群优化算法选择的波长数最少,且模型预测能力最强,其校正集相关系数Rc和均方根误差RMSEC分别为0.9830和0.4615,预测集相关系数Rp和预测均方根误差RMSEP分别为0.9708和0.5144。研究选用3个富士苹果主产地的样本,建立不同产地苹果可溶性固形物含量混合分析模型,最优模型具有较高的预测精度,应用近红外光谱可以建立多产地苹果品质混合分析模型,具有较好的稳健性和适用性。研究结果表明,自适应蚁群优化算法可以有效选择近红外光谱特征波长,简化模型,提高计算效率,增强模型的稳健性。
References
1YANG HaoMin, LU QiPeng, HUANG FuRong. J. Infrared Millim. Waves, 2011, 30(6): 522-525
2JIN Ye, YANG Kai, WU YongJiang, LIU XueSong, CHEN Yong. Chinese J. Anal. Chem., 2012, 40(6): 925-931
3ZHANG DeQuan, CHEN XiaoNa, SUN SuQin, LI ChunHong, ZHANG BaiLin, LI Yong, LI ShuRong, LI QingPeng, ZHOU HongJie. Spectroscopy and Spectral Analysis, 2008, 28(11): 2550-2553
4WANG JiaHua, LI PengFei, CAO NanNing, HAN DongHai. J. Infrared Millim. Waves, 2009, 28(5): 386-391
5Zou X, Zhao J,Malcolm J W, Mel H, Mao H. Anal. Chim. Acta, 2010, 667(1): 14-32
6CHEN YongMing, LIN Ping, He Yong. Spectroscopy and Spectral Analysis, 2009, 29(3): 671-674
7CHEN Bin, MENG XiangLong, WANG Hao. Journal of Instrumental Analysis, 2007, 26(1): 66-69
8PAN Tao, WU ZhenTao, CHEN HuaZhou. Chinese J. Anal. Chem., 2012, 40(6): 920-924
9Sorol N, Arancibia E, Bortolato S A, Olivieri A. Chemometr. Intell. Lab., 2010, 102(2): 100-109
10Dorigo M, Maniezzo V, Colorni A. IEEE Trans. Syst. Man Cybern. B, 1996, 6: 29-41
11Bonabeau E, Dorigo M, Theraulaz G. Nature, 2000, 406: 39-42
12Shen Q, Jiang J H, Tao J C,Shen G, Yu R. J. Chem. Inf. Model., 2005, 45: 1024-1029
13WANG YuTian, LI YanChun. Chinese Journal of Sensors and Actuators, 2006, 19(2): 508-510
14GUO Liang, JI HaiYan. Spectrosc. Spect. Anal., 2007, 127(19): 1703-1705
15Franco A, Olivieri A C. Anal. Chim. Acta, 2011, 699(1): 18-25
16Ventura M, Jager A, Putter H, Roelofs F. Postharvest Biol. Tec., 1998, 14(1): 21-27
17Peng Y K, Lu R F. J. Food Eng., 2007, 82(2): 142-152
18Nicolai B M, Beullens K, Bobelyn E, Peirs A, Saeys W, Theron K, Lammertyn J. Postharvest Biol. Tec., 2007, 46(2): 99-118
2JIN Ye, YANG Kai, WU YongJiang, LIU XueSong, CHEN Yong. Chinese J. Anal. Chem., 2012, 40(6): 925-931
3ZHANG DeQuan, CHEN XiaoNa, SUN SuQin, LI ChunHong, ZHANG BaiLin, LI Yong, LI ShuRong, LI QingPeng, ZHOU HongJie. Spectroscopy and Spectral Analysis, 2008, 28(11): 2550-2553
4WANG JiaHua, LI PengFei, CAO NanNing, HAN DongHai. J. Infrared Millim. Waves, 2009, 28(5): 386-391
5Zou X, Zhao J,Malcolm J W, Mel H, Mao H. Anal. Chim. Acta, 2010, 667(1): 14-32
6CHEN YongMing, LIN Ping, He Yong. Spectroscopy and Spectral Analysis, 2009, 29(3): 671-674
7CHEN Bin, MENG XiangLong, WANG Hao. Journal of Instrumental Analysis, 2007, 26(1): 66-69
8PAN Tao, WU ZhenTao, CHEN HuaZhou. Chinese J. Anal. Chem., 2012, 40(6): 920-924
9Sorol N, Arancibia E, Bortolato S A, Olivieri A. Chemometr. Intell. Lab., 2010, 102(2): 100-109
10Dorigo M, Maniezzo V, Colorni A. IEEE Trans. Syst. Man Cybern. B, 1996, 6: 29-41
11Bonabeau E, Dorigo M, Theraulaz G. Nature, 2000, 406: 39-42
12Shen Q, Jiang J H, Tao J C,Shen G, Yu R. J. Chem. Inf. Model., 2005, 45: 1024-1029
13WANG YuTian, LI YanChun. Chinese Journal of Sensors and Actuators, 2006, 19(2): 508-510
14GUO Liang, JI HaiYan. Spectrosc. Spect. Anal., 2007, 127(19): 1703-1705
15Franco A, Olivieri A C. Anal. Chim. Acta, 2011, 699(1): 18-25
16Ventura M, Jager A, Putter H, Roelofs F. Postharvest Biol. Tec., 1998, 14(1): 21-27
17Peng Y K, Lu R F. J. Food Eng., 2007, 82(2): 142-152
18Nicolai B M, Beullens K, Bobelyn E, Peirs A, Saeys W, Theron K, Lammertyn J. Postharvest Biol. Tec., 2007, 46(2): 99-118
2JIN Ye, YANG Kai, WU YongJiang, LIU XueSong, CHEN Yong. Chinese J. Anal. Chem., 2012, 40(6): 925-931
3ZHANG DeQuan, CHEN XiaoNa, SUN SuQin, LI ChunHong, ZHANG BaiLin, LI Yong, LI ShuRong, LI QingPeng, ZHOU HongJie. Spectroscopy and Spectral Analysis, 2008, 28(11): 2550-2553
4WANG JiaHua, LI PengFei, CAO NanNing, HAN DongHai. J. Infrared Millim. Waves, 2009, 28(5): 386-391
5Zou X, Zhao J,Malcolm J W, Mel H, Mao H. Anal. Chim. Acta, 2010, 667(1): 14-32
6CHEN YongMing, LIN Ping, He Yong. Spectroscopy and Spectral Analysis, 2009, 29(3): 671-674
7CHEN Bin, MENG XiangLong, WANG Hao. Journal of Instrumental Analysis, 2007, 26(1): 66-69
8PAN Tao, WU ZhenTao, CHEN HuaZhou. Chinese J. Anal. Chem., 2012, 40(6): 920-924
9Sorol N, Arancibia E, Bortolato S A, Olivieri A. Chemometr. Intell. Lab., 2010, 102(2): 100-109
10Dorigo M, Maniezzo V, Colorni A. IEEE Trans. Syst. Man Cybern. B, 1996, 6: 29-41
11Bonabeau E, Dorigo M, Theraulaz G. Nature, 2000, 406: 39-42
12Shen Q, Jiang J H, Tao J C,Shen G, Yu R. J. Chem. Inf. Model., 2005, 45: 1024-1029
13WANG YuTian, LI YanChun. Chinese Journal of Sensors and Actuators, 2006, 19(2): 508-510
14GUO Liang, JI HaiYan. Spectrosc. Spect. Anal., 2007, 127(19): 1703-1705
15Franco A, Olivieri A C. Anal. Chim. Acta, 2011, 699(1): 18-25
16Ventura M, Jager A, Putter H, Roelofs F. Postharvest Biol. Tec., 1998, 14(1): 21-27
17Peng Y K, Lu R F. J. Food Eng., 2007, 82(2): 142-152
18Nicolai B M, Beullens K, Bobelyn E, Peirs A, Saeys W, Theron K, Lammertyn J. Postharvest Biol. Tec., 2007, 46(2): 99-118
相关文章!
  • 改进演示实验,提高演示实验教

    曹雪梅众所周知,化学是以实验为基础的学科.实验是化学的灵魂,也是提高学生学习兴趣的主要因素.教学实践证明,化学实验教学可以让学生

  • 素质教育在中职教育中的重要性

    杨天摘要:进入21世纪之后,素质教育已经成为全社会非常关注的一个重要话题。而在职业教育中,许多学生和家长错误的认为职业教育的本质就

  • 质谱法测定水中溶解氙的含量及

    李军杰+刘汉彬 张佳+韩娟+金贵善+张建锋<br />
    <br />
    <br />
    <br />
    摘要 利用设计的一套水样中提取并分离Xe的装置,与稀有气体质谱