scikit learn.predict()默认阈值

我正在研究一个不平衡类的分类问题(5%1)。我想预测课程,而不是概率

在二进制分类问题中,scikit的分类器.predict()默认使用0.5
如果没有,默认的方法是什么?如果是,我该如何更改它

在scikit中,一些分类器具有class\u weight='auto'选项,但并非所有分类器都具有该选项。使用class\u weight='auto',是否将.predict()使用实际人口比例作为阈值

在像多项式nb这样的不支持类权重的分类器中,该怎么做?除了使用predict_proba()然后自己计算类之外

可以使用clf.predict\u proba()设置阈值

例如:

来自sklearn.tree导入决策树分类程序的


clf=DecisionTreeClassifier(随机状态=2)
clf.fit(X_系列、y_系列)
#y_pred=clf.predict(X_测试)#默认阈值为0.5
y_pred=(clf.predict_proba(X_test)[:,1]>=0.3)。aType(bool)#将阈值设置为0.3

发表评论