摘要:新疆原棉品质存在显著的区域性差异,温、光等气候因素与其密切相关且影响较大,为明确气象因子与原棉品质的关系及科学预测原棉品质变化趋势和区域分布,本文开展基于机器学习算法的新疆原棉品质预测模型研究,寻求适宜原棉品质指标与气象因子的最优预测模型,对新疆棉花生产管理和品质提升具有重要意义。本研究利用2015—2022年新疆各植棉县(市)原棉品质公证检验数据和气象数据,通过大数据分析气象因素对纤维品质的相对贡献率及其关系;采用随机森林(Random Forest,RF)、支持向量回归算法(Support Vactor Regression,SVR)2种机器学习算法构建气象因子与纤维品质的预测模型。结果表明,棉花生育期气象特征变量与原棉品质存在多重共线性,使用随机森林算法计算不同气象特征变量组合对原棉品质指标的方差解释率,选择方差解释率较高的气象特征变量组合作为模型输入变量,得到相应的原棉品质指标预测结果。与支持向量机模型相比,随机森林模型能准确地预测原棉纤维长度、断裂比强度、马克隆值和整齐度指数,预测精度均在88.59%以上,均方根误差(RMSE)为0.082 6~0.319 2。因此,随机森林算法能更好的随机选择最优样本训练集,在解决自变量多重共线性方面有较大的优势;随机森林算法对自变量进行特征选择会明显提高模型的准确性,用以预测原棉纤维长度、断裂比强度和整齐度指数的性能更好。
引用:陆永迪,李培松,郭郁,等.基于机器学习的新疆原棉品质预测模型研究[J].石河子大学学报(自然科学版),2025,43(01):55-67.DOI:10.13880/j.cnki.65-1174/n.2025.23.001.