基于光学性质的多组分液体混合物定量分析

    张宁 胡鑫浩 王秋实

    

    

    

    摘 ?????要:为了对多组分液体混合物进行定量分析,建立了窗片-待测液-窗片三层光学腔双光程光学常数反演模型。以乙醇和蒸馏水的混合物为研究对象,利用双光程模型对各混合物样本的光学常数进行反演;引入牛顿混合规则,以0.01的混合梯度对乙醇-蒸馏水混合物样本的折射率进行预测;联合混合物折射双光程反演值和混合规则预测值组成定量分析模型折射率数据集,利用Savitzky-Golay法对折射率数据集进行预处理;基于折射率预处理光谱利用区间偏最小二乘法建立液体混合物定量分析模型。结果表明:最佳区间划分方式为30等分,最佳子区间为第21区间,最佳建模波段为0.428~0.448 μm,此时预测集样本预测值的相对误差分别为7.15%和4.93%,表明定量分析模型具有较高的预测精度,能准确预测液体混合物各组分的含量。

    关 ?键 ?词:折射率;多组分液体混合物;区间偏最小二乘法;定量分析模型

    中图分类号:O657 ??????文献标识码: A ??????文章编号: 1671-0460(2019)06-1362-07

    Abstract: In order to quantitatively analyze multicomponent liquid mixtures, a double optical path inversion model of three-layer optical cavity with window-liquid-window was established. Taking the mixture of ethanol and distilled water as the research object, the optical constants of different mixture samples were inverted by using the double optical path inversion model; The refractive index of ethanol-distilled water mixture was predicted by introducing Newton mixing rule with the using mixing gradient of 0.01; The refractive index data sets of the quantitative analysis model was composed of the double optical path inversion value of mixture and the predicted value of mixing rule; The Savitzky-Golay method was used to preprocess the refractive index data sets, and the interval partial least squares method was used to establish the quantitative analysis model of liquid mixtures based on the refractive index pretreatment spectra. The results showed that the optimum interval dividing method was 30 equal parts, the optimum sub-interval was interval 21, and the optimum modeling band was 0.428~0.448 μm. The relative errors of the predicted values of the predicted samples were 7.15% and 4.93%, respectively, which indicated that the quantitative analysis model has high prediction accuracy and can accurately predict the content of each component of multicomponent liquid mixtures.

    Key words: Refractive index; Multicomponent liquid mixtures; IPLS method; Quantitative analysis model

    定量分析是在统计数据的基础上建立数学模型,用数学模型计算各种指标和数值的一种方法。液体混合物中的组分含量与其相应的光学性质有一定的关系,如透射率或反射率,这是液体混合物定量分析的关鍵。

    许多方法可以用于多组分液体混合物的定量分析,如质谱法[1]、气相色谱法[2]和分光光度法[3]。气相色谱法选择性高并且可以进行痕量测量,质谱法分析速度快且样本用量少。从实际应用的角度看,由于操作繁琐且仪器昂贵,气相色谱法和质谱法只能在实验室完成,不能满足实时在线检测的要求。

    与其他两种检测方法相比,分光光度法具有灵敏度高、适用范围广、实验操作简单等优点。它广泛应用于工业、医疗、食品等方面的分析与检测[4,5]。分光光度法包括紫外分光光度法[6]、红外分光光度法[7]和荧光光度法[8]。它们的共同特点是样品被特定波长的光照射,在一定的波长范围内样品的吸光度或者发光度是不一样的。分光光度法正是利用这一点来实现对多组分液体混合物的鉴别与分析,这种非接触式的检测方法是实现多组分液体混合物实时快速定量分析的关键[9,10]。分光光度法是一种间接测量方法,为了得到准确的分析结果,必须采用一定的数据处理技术。化学计量学是应用信息学解决化学问题,揭示化学信息本质和内在联系的学科。化学计量学与光谱分析相结合是多组分液体混合物定量分析的新趋势。

    多元校正方法是化学计量学的一个重要分支,通常用于预测样品的组成和性质。多元校正方法包括多元线性回归(MLR)、主成分回归(PCR)和偏最小二乘回归(PLS)。多元线性回归不考虑光谱矩阵的噪声,往往导致模型拟合过度,降低了模型的预测能力。主成分回归能够充分利用光谱信息,剔除次要成分,建立原始的全谱数据模型,克服变量间的共线性问题,但其计算速度较慢,且主成分的选择直接影响模型的预测能力。偏最小二乘回归(PLS)是最常用的化学计量学定量分析方法。与上述两种方法相比,偏最小二乘回归能更有效地获取光谱信息,提取的主成分对自变量和因变量都有很强的解释力[11]。Cozzolion等[12]基于可见光谱和近红外光谱,采用偏最小二乘法研究澳大利亚葡萄酒中各元素的浓度。N?rgaard等[13]首先提出了区间偏最小二乘回归(iPLS)。区间偏最小二乘回归方法将全谱分为等间隔子区间,选择最佳子区间建立分析模型,有效地消除了不相关谱信息的干扰,提高了模型的预测精度[14,15]。

    光谱采集是利用分光光度法进行定量分析的重要步骤。分析模型通常是基于透射、反射或吸收光谱。Armenta等[16]通过对近红外透射光谱采集并优化,成功建立了农药制剂的定量分析模型。马那甫等[17]利用偏最小二乘法(PLS)结合紫外分光光度法, 实现了不经分离同时测定邻苯二酚 、间苯二酚、邻苯三酚和间苯三酚等四组分的含量。光学常数是反映物质光学性质的重要参数,大多数物质的浓度与其光学常数有一定的关系[18,19]。因此,我们考虑建立基于混合物光学常数谱的定量分析模型。

    综合考虑以往的研究,采用多元校正方法提取光学常数谱的主成分,建立液体混合物定量和定性分析模型是可行的。对于物质光学常数的求解,双厚度法的应用最为普遍[20]。本文基于粒子群优化算法(PSO),建立了液体混合物光学常数反演模型。以乙醇-蒸馏水、煤油-柴油两种液体混合系统为研究对象,联合折射率混合规则[21]和双厚度反演模型建立了混合物定量分析模。

    1 ?液体混合物光学常数反演模型

    1.1 ?窗片-待测液-窗片三层光学腔双光程反演模型

    利用紫外分光光度计测量液体样本的透射光谱时,液体样本需封装在如图1(a)所示的石英比色皿中。比色皿与其封装的液体样本构成窗片-待测液-窗片三层光学腔,其结构如图1(b)所示。

    (a)光学腔 ??????????(b) 光学腔三层结构

    其中: ng和nl分别为石英玻璃和液体样本的折射率,L和l分别为封装液体和两侧石英玻璃的厚度,Rg和Rl分别为空气-石英玻璃界面和石英玻璃-液体界面的反射率。

    与单层介质相比,三层光学腔考虑了玻璃窗口对入射光线的反射和吸收,由入射光到透射光将有一部分光能被石英玻璃反射和吸收,即光学腔的总透射比相对于单层介质存在一定的偏差,这也将导致单层介质双光程法对于封装于光学腔内液体介质光学常数的求解存在一定的误差,因此需要对光学腔的总透射比进行校正,以更精确地反演待测液光学常数。

    1.2 ?石英窗片的光学校正

    将窗片-待测液-窗片三层光学腔结构拆分成单层石英玻璃和单层待测液样本结构,如图2所示。

    2.2 ?无水乙醇和蒸馏水混合物透射光谱的测量

    用TU-1900双光束紫外可见分光光度计测量无水乙醇-蒸馏水混合物样本,测量范围是0.19~0.9 μm,光谱带宽为2 nm,光程为5、10、15 mm,测量结果为封装混合物样本光学腔透射比,测量结果为三次平均值,实验过程在室温(24 ℃)下进行。

    无水乙醇-蒸馏水混合物样本透射光谱如图6所示。从图6 (a)、图6 (b)以及图6 (c)可知,在0.19~0.9 μm波段范围内,不同蒸馏水含量的样本在三种光程下具有相似的透射光谱形状,0.19~0.300 μm为强吸收区,0.4~0.9 μm为高透区。在强吸收区,混合物样本透射比随波长的增加先快速增加后缓慢增加,且不同蒸馏水含量混合物样本之间区别明显,其透射比随蒸馏水含量的增加而增加。在高透区,混合物样本的透射比随波长的增加基本保持平稳,不同蒸馏水含量的混合物样本的透射光谱间非常接近,其透射比随蒸馏水含量的变化无明显规律。

    2.3 ?无水乙醇-蒸馏水混合物光学常数的求解

    基于2.2节中不同光程下无水乙醇-蒸馏水混合物样本透射光谱,在0.230~0.900 μm波段范围内利用第2节中双光程反演模型计算无水乙醇、蒸馏水以及1-9号混合物样本的折射率n,计算结果如图7所示。

    图7为折射率与各样本蒸馏水含量关系图。由图可知,在全波段范围内折射率与样本蒸馏水含量没有明显的关系,且随着波长的增加各样本折射率均出现较大幅度波動。

    3 ?基于牛顿混合规则乙醇溶液折射率的求解

    牛顿混合规则计算式如下:

    基于2.3节中纯乙醇和纯蒸馏水折射率的求解值(0.230~0.900 μm),在蒸馏水体积分数为0~100%的范围内,取混合梯度为0.01,利用牛顿混合规则预测乙醇-蒸馏水二组分液体混合物的折射率,结果如图8所示。

    4 ?多组分液体混合物定量分析模型

    4.1 ?区间偏最小二乘法

    建模的波段越宽,折射率谱中所包含的有用信息就越丰富,与此同时无关信息的干扰也随之增加。考虑到传统PLS模型容易受到不相关信息的干扰,采用区间偏最小二乘法(iPLS)来削弱不相关信息的干扰。Norgaard等于2000年提出了iPLS算法,其原理是将整个建模的波段划分成若干等宽度的子区间,然后在每个子区间上进行偏最小二乘回归,即建立了若干局部回归模型。分别比较各局部模型的精度,以一定的模型评价参数为指标确定最佳的建模区间。偏最小二乘法的样本结构如图9所示。

    以蒸餾水和乙醇的混合物为研究对象,将蒸馏水的体积分数作为观察指标。混合物样本在选定波长范围内的折射率作为自变量,样本的蒸馏水体积分数作为因变量。X(i×j)和Y(i×j)分别是自变量矩阵和因变量矩阵。对于X矩阵,i与样品的数量有关,j与样本的折射率有关。对于Y矩阵,k与蒸馏水的体积分数有关。将X矩阵和Y矩阵中的数据划分为校正集数据和预测集数据,它们分别用于建立校正集模型和预测集模型。

    4.2 ?模型评价参数

    iPLS模型的可靠性主要取决于相关系数 (R)、校正均方根误差 (RMSECV)和预测均方根误差 (RMSEP)。RMSEP和RMSECV用来评价模型的预测能力,其中RMSEP值越小说明预测能力越好,RMSECV值越小则说明校正集对模型训练校正效果越好。

    这里n和m是校正集和预测集样本数目,yi和yj分别是校正集和预测集观察指标的原始值,yi,pred和yj,pred分别是校正集和预测集观察指标的预测值。N是校准集或预测集的样本数目,yK是校准集或预测集观察指标的真实值,yK,pred是校准集或预测集观察指标的预测值,是校准集或预测集观察指标的平均值。

    4.3 ?iPLS算法流程

    iPLS算法步骤如下:

    (1)首先提取样本的原始光谱或者采用中心化等预处理方法对原始光谱进行预处理;

    (2)确定光谱在全波段范围内建模的最佳主成分数;

    (3)利用iPLS算法将整个波段范围划分为n个等宽子区间;

    (4)在每个子区间上进行PLS回归,建立n个局部回归模型;

    (5)以RMSECV为各模型的精度评价标准,分别比较全波段模型和各局部模型的精度,选取精度最高的局部模型的子区间为最佳建模区间;

    (6)对光谱进行重新分区,重复(3)、(4)、(5)的步骤,比较不同区间划分方式的建模效果,进而确定最佳建模区间;

    (7)在最佳区间进行PLS回归,进而建立最优预测模型。

    4.4 ?多组分液体混合物定量分析模型

    在混合梯度为0.01的基础上,多组分液体混合物定量分析模型的校正集和预测集样本分别如表2和表3所示,编号1-96的样本为混合数据样本,编号为97-99的样本为实验数据样本。

    5 ?结 论

    联合混合物折射双光程反演值和混合规则预测值组成定量分析模型折射率数据集,利用Savitzky-Golay法对折射率数据集进行预处理,基于折射率预处理光谱利用iPLS法建立液体混合物定量分析模型,结果表明:

    (1)模型是可行的。

    (2)定量分析模型具有较高的预测精度,能准确预测液体混合物各组分的含量。

    (3)最佳区间划分方式为将全波段30等分,且最佳子区间为第21区间,最佳主成分数为2,最佳建模波段为0.428~0.448 μm。

    参考文献:

    [1]A.S.P. Moreira, F.M. Nunes, C. Sim?es. Data on coffee composition and mass spectrometry analysis of mixtures of coffee related carbohydrates[J]. Phenolic compounds and peptides, Data Brief, 2017, 13:145-161.

    [2]Y. Nolvachai, C. Kulsing, P.J. Marriott. Multidimensional gas chromatography in food analysis[J]. Trac Trends in Analytical Chemistry, 2017, 96:124-137.

    [3]孙小云,胡仰栋,卢彦越.多组分分析的连续波长紫外分光光度法[J].化学通报, 2006, 7:555-558.

    [4]P. Lambert, M. Goldthorp, B. Fieldhouse, et al. Field fluorometers as dispersed oil-in-water monitors[J]. Journal of Hazardous Materials, 2003, 102:57-79.

    [5] 刘开敏, 陈金民. PDV分光光度法检测饮料中过氧化氢含量[J]. 当代化工, 2016, 45(08):2044-2046.

    [6]李亚新, 赵晨红. 紫外分光光度法测定焦化废水的主要污染物[J]. 中国给水排水, 2001, 1:54-56.

    [7] 程鑫桥, 王云发, 黎海洋, 等. 红外光谱法定量分析羊毛/腈纶混合物纤维含量[J]. 毛纺科技, 2016, 44(03):19-23.

    [8]顾佳丽, 伊鲁东, 李东玲, 等. 变色酸荧光光度法测定自来水中痕量Al(Ⅲ)[J]. 分析科学学报, 2018, 34(05):664-668.

    [9]C.J. Cui, W.S. Cai, X.G. Shao. Near-infrared diffuse reflectance spectroscopy with sample spots and chemometrics for fast determination of bovine serum albumin in micro-volume samples[J]. Chin. Chem. Lett, 2013, 24:67-69.

    [10]Y.M. Xiong, X.Z. Song, C.Z. Chen, et al. The establishment and evaluation of near infrared universal model to determinate the effective ingredient content in pesticide rapidly[J]. Chin. Chem. Lett, 2012, 23:1047-1050.

    [11]B. Debus, D.O. Kirsanov, V.V. Panchuk, et al. Three-point multivariate calibration models by correlation constrained, MCR-ALS: A feasibility study for quantitative analysis of complex mixtures[J]. Talanta, 2017, 163:39-47.

    [12]D. Cozzolion, M.J. Kwiatkowski, R.G. Dambergs, et al. Analysis of elements in wine using near infrared spectroscopy and partial least squares regression[J]. Talanta, 2008, 74:711-716.

    [13]L. N?rgaard, S. Saudland, J. Wagner, et al. Interval partial least-squares regression (iPLS): a comparative chemometric study with an example from near-infrared spectroscopy[J]. Applied Spectroscopy, 2000, 54:413-419.

    [14]趙芳, 彭彦昆. 区间偏最小二乘法结合拉曼光谱测定猪肉皮下脂肪的碘值[J]. 中国激光, 2017, 44(11):249-255.

    [15] A. Rahman, N. Kondo, Y. Ogawa, et al. Determination of K value for fish flesh with ultravioletevisible spectroscopy and interval partial least squares (iPLS) regression method[J]. Science Direct, 2016, 141:12-18.

    [16]S. Armenta, S. Garrigues, M. de la Guardia. Optimization of transmission near infrared spectrometry procedures for quality control of pesticide formulation[J]. Anal Chim Acta, 2006, 571:288-297.

    [17]加列西·马那甫, 米拉吉古丽, 阿依夏木姑丽·司马依力. 偏最小二乘-紫外分光光度法同时测定水中酚类化合物[J]. 新疆农业科学, 2010, 47(10):2097-2100.

    [18]J. Wang, Q. Ye, Z.C. Deng, et al. Application of matching liquid on the refractive index measurementof biotissue: A theoretical and experimental study[J]. Optics Communications, 2014, 319:36-41.

    [19]J.J. Cano-Gómez, G.A. Iglesias-Silva, V. Rico-Ramírez, et al. A new correlation for the prediction of refractive index and liquid densities of 1-alcohols[J]. Fluid Phase Equilibria, 2015, 387:117-120.

    [20]A. Tuntomo, C.L. Tien, S.H. Park. Optical constants of liquid hydrocarbon fuels[J]. Combustion Science and Technology, 1992, 84:133-140.

    [21]S. Akbar. Analytical study for mixing rules for refractive index and data analysis for some binary liquid mixtures[J]. International Journal of advance research and innovative ideas in education, 2017, 3:3326-3332.

相关文章!
  • 双目标控制选择Rayleigh阻尼系

    王淮峰 楼梦麟 张如林摘要: 合理选择确定Rayleigh阻尼矩阵比例阻尼系数的振型频率对于准确计算场地地震响应有重要影响。提出以土层表

  • 准双曲线角齿轮加工参数的三维

    王慧文 王恩泽 孙晓娟摘 要:本文提出利用三维坐标测量仪测量准双曲线角齿轮切削加工参数的方法。首先建立准双曲线角齿轮齿面的数学表

  • 浅谈互联网时代下管理体系信息

    蔡文超摘要:随着计算机、互联网的发展,各行各业的生产管理都试图进行信息化和网络化升级,通过互联网技术实现信息共享和数据分析以提高