机器学习模型评估指标

精确度（特异度）\(Precision=\frac{TP}{TP+FP}\)

真阳性率/召回率（敏感度）\(TPR/Recall=\frac{TP}{TP+FN}\)

假阳性率\(FPR=\frac{FP}{FP+TN}\)

\(F1-Score=2 \times \frac{Precision \times Recall}{Precision + Recall}\)

准确率\(Accuracy=\frac{TP+TN}{TP+TN+FP+FN}\)

ROC曲线

模型能否在“少误杀”的同时“多抓对”？

不同模型之间，谁的总体区分能力更强？

想象你在筛选垃圾邮件：

阈值（Threshold）：你设定的判断标准（比如“邮件中包含‘免费’一词就判为垃圾”）。
调整阈值：
- 标准严格（阈值=0.9）：只有非常确定的垃圾邮件才被过滤 → 漏掉很多垃圾（FN↑），但几乎不错杀正常邮件（FP↓）。
- 标准宽松（阈值=0.1）：稍有嫌疑就判为垃圾 → 抓住更多垃圾（TP↑），但误杀很多正常邮件（FP↑）。

ROC曲线就是展示所有可能阈值下，模型在“抓对”（TPR）和“误杀”（FPR）之间的权衡。

假设有5个样本，模型输出的正类概率和真实标签如下：

Step1: 按概率从高到低排序

A(0.9) → B(0.8) → C(0.6) → D(0.4) → E(0.3)

Step 2：动态调整阈值，计算TPR和FPR

Step 3：连接所有点形成ROC曲线

发送评论编辑评论