此文章的方法来源于论文《Causal Analysis of Customer Churn Using Deep Learning》
Ensemble on Simple base Models
投票集成(或“多数投票集成”)是一种集成机器学习模型,它结合了多个其他模型的预测。
它是一种可用于提高模型性能的技术,理想情况下可以获得比集成中使用的任何单个模型更好的性能。
投票集成通过组合来自多个模型的预测来工作。它可以用于分类或回归。对于回归来说,这涉及计算模型预测的平均值。在分类的情况下,对每个标签的预测结果求和,并预测投票结果最多的标签。
-
硬投票:从模型中预测得票总和最大的类别
在硬投票(hard voting,也称为多数投票)中,每个分类器都为某个类别投票,结果是多数分类器胜出。从统计学角度来说,集成的预测目标标签是单个预测标签的分布模式。
-
软投票:从模型中预测具有最大概率和的类别。
在软投票中,每个分类器提供一个特定数据点属于特定目标类别的概率值。预测结果根据分类器的重要性加权并进行汇总。然后加权概率之和最大的目标标签赢得投票。