摘要:为了解决单一交通数据缺失值插补模型不能全面的考虑交通数据多源异构、数据量复杂等问题,提出一种基于信息熵来确定自适应权重的多分类器插值模型。首先选择了表示“混乱度”的信息熵来衡量预测结果的优劣进而确定多分类器的权重;其次设计了动态的自适应权重设定方法来解决设备差异性引起的不同样本适应的分类器不同的问题;最后在公共数据集与自采数据集上进行了验证。结果表明:本文提出的基于信息熵的自适应多分类器交通数据插值模型相较于其他插值模型在检测效果上取得了显著的提升,并在公开数据集州际公路交通流量数据集上进行实验也取得了较高精度,F1分数达到0.778,RMSE提升10%,具有较强的泛化性。本文算法在使用信息熵确定权重模型的基础上,使权重跟随数据流自适应变化,具有较快的检测速度和更高的准确度,对交通数据清洗中插缺失值填补模型的建立提供了技术参考。