Naive Bayes
Last updated
Last updated
不同的朴素贝叶斯分类器的主要区别在于他们对分布的假设
。
尽管他们显然过于简化的假设,朴素贝叶斯分类器已经在许多现实世界的情况下工作得很好,着名的文档分类和垃圾邮件过滤。他们需要少量的训练数据来估计必要的参数。(由于理论上的原因,为什么朴素贝叶斯工作得很好,以及它所做的数据类型,请参阅下面的参考资料。)
与更复杂的方法相比,朴素贝叶斯学习者和分类器可以是非常快的。类别条件特征分布的解耦意味着每个分布可以被独立地估计为一维分布。这反过来有助于减轻由维度的诅咒引起的问题。
另一方面,尽管朴素贝叶斯(Bayes)被认为是一个不错的分类器,但它是一个不好的估计器,所以从这个概率输出predict_proba
中不会被认真考虑。