摘要:当前对于航班延误预测通常集中在提升模型预测精度方面,却忽视了预测模型的可解释性方面的研究。对此,首先对航班历史数据、天气数据进行融合,在融合数据的基础上进行异常值处理并利用递归特征消除方法进行特征选择。其次,构造航班延误时长预测模型,利用遗传算法进行参数调优,并与Random Forest、lightGBM、GBDT进行对比。实验结果表明,模型预测结果的平均绝对误差(MAE)与GDBT、随机森林、lightGBM算法进行对比分别下降了4.88min、2.77min、0.60min;实例证明了XGBost模型在航班延误时长预测的优势。最后,在航班延误时长预测的基础上结合SHAP模型,从可解释性的角度分析总体特征和特征间的相互关系。增强了模型的可解释性,并为从不同方面降低航班延误时长提供参考意见。