新陈粮鉴别应用(三) | 风味组学结合机器学习在北方玉米储存年份鉴别中的应用
风味物质是衡量粮食作物食用品质与营养价值的重要指标。小麦、玉米等谷类作物在储藏过程中的品质劣变与其风味物质含量密切相关。本研究采用固相微萃取-气相色谱-三重四极杆质谱联用技术(SPME-GC-MS/MS)分析玉米中挥发性风味物质的种类与含量,发现玉米挥发性风味物质与储藏时间存在显著相关性,并通过风味组学成功区分了不同储存年份的玉米,建立了一种能够准确区分新陈玉米的机器学习预测模型,为玉米品质的动态监测提供了有效技术支撑。研究成果以“Flavoromics of maize from major maize production regions of northern China during storage”为题,已发表在《Talanta》期刊。

【研究背景】
粮食在贮藏期间会受到温度、湿度、微生物等环境因素影响,其食用品质和营养价值也会随着储藏时间延长而发生改变。玉米是我国主要粮食作物之一,也是我国储备粮的重要组成。由于玉米原始水分含量相对较高,同时内部富含脂肪,相较于其他粮食品种储藏稳定性较差,易发生品质劣变,进而影响其种用、食用和加工品质。因此在玉米收购入仓和轮换出库前对其储藏品质进行评估十分必要,引起了研究人员的广泛关注。
挥发性风味物质是影响玉米食用和加工的主要因素之一,风味物质的类型、含量以及它们之间的相互作用共同决定着玉米的风味。玉米储藏过程中风味物质含量变化间接反映其品质改变,因此越来越多的研究人员通过测定玉米中典型挥发性风味物质对其进行品质鉴别。已有多项研究发现玉米挥发性风味物质的种类和含量受不同储藏条件的影响,但尚未阐明不同储藏时间玉米的特征差异物质。
【研究内容】
本研究以玉米为研究对象,采用固相微萃取-气相色谱-三重四极杆质谱联用技术对 2019 年至 2023 年中国北方七个主要生产省份收获的285份玉米中的主要挥发性风味化合物进行分析,鉴定出 99 种挥发性风味化合物。结合多元统计进行数据分析,阐明不同储藏年份玉米的特征差异物,实现不同储藏年份玉米的区别及鉴别,并基于机器学习建立了新陈玉米的预测模型。

玉米样品检测到的99种风味化合物被划分为8大类:24 种醛类、16种醇类、14种酮类、13种杂环化合物、12种酯类、10种酸类、7种酚类以及3种其他化合物。其中醛类化合物在玉米风味成分中占比最高,达到24.2 %。
为明确风味物质含量与玉米储藏年份之间的关系,对不同储藏年份玉米中的挥发性风味物质进行PLS-DA分析。从图1可以看出,以主产省份进行地域划分时,不同省份的储藏玉米呈现与收获年份相关的聚类趋势,不同储藏年份玉米呈一定的聚类趋势。

图1. 不同省份的玉米挥发性成分的PLS-DA分析结果。(A)黑龙江;(B)内蒙古;(C)辽宁;(D)山东;(E)河南;(F)吉林
进一步直观体现不同储藏年份玉米的风味物质特征,分析结果如图2所示。利用5倍交叉验证对PLS-DA模型的预测精确度和拟合度进行验证,使用五个组分时,模型的R2=0.967,Q2 =0.952,表明模型拟合效果优异(图2B)。进一步采用100次置换检验验证监督模型,分布结果表明最优模型对样本组风味化合物的预测能力显著性达到p<0.01(图2C)。此外,如图2D所示,分析结果明确显示有12种挥发性风味化合物的VIP值超过1.5。代表性风味化合物主要包括:2-乙酰呋喃、苯并噻唑、糠醛、乙酸、对甲酚、(E)-2-壬烯醛、5-甲基糠醛、戊内酯、 丁基苯甲酸酯、糠醇、异戊酸、(E)-2-辛烯-1-醇。

图2. (A)2019至2023年玉米的PLS-DA得分图分析结果;(B)交叉验证;(C)置换检验;(D) VIP得分图
【基于机器学习的新陈玉米分类模型】
通过GC-MS获取2019年至2023年不同储藏年限的玉米样品风味物质含量数据(新鲜玉米采收于2023年,陈玉米采集于2019至2022年间),结合机器学习建立了新陈玉米分类器。在分类模型对比实验中,随机选取29个样本作为测试集,其余样本按8:2的比例划分为训练集和验证集。采用10倍交叉验证评估分类器的稳定性,训练后分类器的优化结果如表1所示。三种分类器的验证集准确率均超过96.5%,充分证明了分类模型的可靠性。
表1. 训练后分类器的准确率、精确率、交叉验证准确率与预测准确率

【扩展应用:基于深度机器学习的不同储藏年份玉米的预测模型】
区别于传统的机器学习,如支持向量机(SVM)、随机森林(RF)以及集成学习方法如高斯过程分类(GPC)、梯度提升机(GBC)等,深度神经网络模型不需要对数据进行大规模的前处理,根据数据特点,优化模型深度和结构,从而实现准确的预测。因此在本研究的基础上,我们从来自2018年至2024年的475个玉米样本中,随机从不同储藏年份样品中抽取91个样本作为考核盲样(测试集与训练集和验证集均不重合)。测试集的混淆矩阵如图3所示,盲样考核数据的预测准确率可以达到95.6%。

图3. 深度神经网络模型训练时的损失值(a)和准确率(b),测试集(91个样本)的混淆矩阵
【小结与展望】
本研究基于GC-MS的风味组学研究策略,对2019至2023年收获北方地区玉米样品中挥发性风味物质进行检测,采用PLS-DA方法成功实现了不同储藏年份玉米的鉴别,并筛选出在不同年份的玉米间具有显著性差异的化合物。以风味物质为特征,采用python开源API建立了玉米不同存储年份的机器学习预测模型。并在此基础上,优化开发了深度神经网络模型,预测准确率可以达到95.6%,为玉米储藏品质的动态监测提供技术手段,更好地指导储备玉米科学储存与适时更新轮换。未来随着深度机器学习的兴起,可通过高效的算法优化处理风味组学数据,挖掘复杂痕量风味成分与样品和感官特性的关联,通过GC-MS与深度学习模型实现痕量风味物质的精准预测。
本文内容非商业广告,仅供专业人士参考。
参考文献:
[1] WANG S, CHEN H, SUN B. Recent progress in food flavor analysis using gas chromatography–ion mobility spectrometry (GC–IMS) [J]. Food Chemistry, 2020, 15(315): 126158.
[2] 徐瑞, 李洪军, 贺稚非. 玉米冻藏过程中挥发性成分变化及主成分分析[J]. 食品与发酵工业, 2019, 45(1): 210-218. XUN R, LI H J, HE Z F. Changes and principal component analysis of volatile compounds in corn ears during frozen storage[J]. Food and Fermentation Industries, 2019, 45(1): 210-218.
[3] 李云峰, 范競升, 陈冰琳,等. 3个甜玉米品种在不同储藏条件下可溶性固形物含量及挥发性风味成分变化[J]. 华南农业大学学报, 2021, 42(03): 33-44. LI Y F, FAN J S, CHEN B L, et al. Changes of soluble solid contents and volatile flavor components of three sweet corn cultivars under different storage conditions[J]. Journal of South China Agricultural University, 2021, 42(03): 33-44.
[4] 郭瑞, 李盼盼, 张晓莉, 等. SPME-GC-MS/MS 结合多元统计分析研究不同储藏年份玉米风味物质差异[J]. 粮油食品科技, 2024, 32(3): 179-186. GUO R, LI P P, ZHANG X L, et al. Diversity analysis of volatile flavor compounds of corn with various storage years based on SPME-GCMS/MS and multivariate statistical analysis[J]. Science and Technology of Cereals, Oils and Foods, 2024, 32(3): 179-186.
[5] Li, P., Guo, R., Zhang, X., et al. Flavoromics of maize from major maize production regions of northern China during storage. Talanta, 2026, 296, 128374.