sklearn中predict()与predict_proba()返回值意义

本文详细介绍了Logistic回归模型的predict和predict_proba方法,展示了如何获取预测标签和样本属于不同类别的概率。通过实例演示了如何使用sklearn库进行训练和预测,并解释了预测结果的含义。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

predict:训练后返回预测结果,显示标签值

predict_proba:返回一个 n 行 k 列的数组, 第 i 行 第 j 列上的数值是模型预测 第 i 个预测样本为某个标签的概率,并且每一行的概率和为1。

具体见下面示例:

from sklearn.linear_model import LogisticRegression
import numpy as np

# 训练数据:x_train
x_train = np.array([[1,2,3],
                    [1,3,4],
                    [2,1,2],
                    [4,5,6],
                    [3,5,3],
                    [1,7,2]])
# 训练标签:y_train
y_train = np.array([0, 0, 0, 1, 1, 1])

# 测试数据:x_test
x_test = np.array([[2,2,2],
                   [3,2,6],
                   [1,7,4]])
# 定义并训练LR模型
clf = LogisticRegression()
clf.fit(x_train, y_train)
# 返回预测标签
clf.predict(x_test)
# array([1, 0, 1])

predict 直接获得唯一的预测结果,对于上述数据:

  • 预测[2,2,2]的标签是1
  • 预测[3,2,6]的标签是0
  • 预测[1,7,4]的标签是1
# 返回预测属于某标签的概率
clf.predict_proba(x_test)
# array([[ 0.43348191, 0.56651809],
#        [ 0.84401838, 0.15598162],
#        [ 0.13147498, 0.86852502]])

可以看出,predict_proba 的预测结果有三行两列,每行对应一条预测数据,两列分别对应 对于0、1的预测概率。

  • 预测[2,2,2]的标签是0的概率为0.43348191,1的概率为0.56651809
  • 预测[3,2,6]的标签是0的概率为0.84401838,1的概率为0.15598162
  • 预测[1,7,4]的标签是0的概率为0.13147498,1的概率为0.86852502
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值