sklearn 总结

卡方检验

卡方检验是以χ2分布为基础的一种常用假设检验方法

‘’根据假设,我们可以先算出一个文本出现”洪秀全”的概率,然后用中国近代史的文本个数乘以这个概率就得到了理论值,很好理解的普通概率问题。(想一想,这一起是不是建立在我们的假设的基础上。如果假设是二者不相关,那么理论值应该怎么算?你会发现根本不知道怎么算)’’第一篇参考文献中的例子解释为什么假设相关。
因为假设不相关,概率无法计算。
文本分类学习 (四) 特征选择之卡方检验
结合日常生活的例子,了解什么是卡方检验

特征选择

坚持原创技术分享,您的支持将鼓励我继续创作!