当前位置：首页 > news >正文

评估指标（Metric）（一）

news 来源：原创 2024/11/17 0:47:28

机器学习的评价指标有精度、精确率、召回率、P-R曲线、F1 值、TPR、FPR、ROC、AUC等指标，还有在生物领域常用的敏感性、特异性等指标。

在分类任务中，各指标的计算基础都来自于对正负样本的分类结果，用混淆矩阵表示：

在这里插入图片描述
其中，精度（accuracy）表示所有分类正确的样本占全部样本的比例。精确率（precision）表示预测是正例的结果中，确实是正例的比例；召回率（recall）表示所有正例的样本中，被找出的比例；真正例率（tp rate，TPR），与召回率相同；假正例率（fp rate，FPR）表示所有正例的样本中，假例被找出的比例。

另外，F-measure也是一种统计量，F-measure又称为F-score，F-measure是precision和recall加权调和平均，是IR（信息检索）领域的常用的一个评价标准，常用于评价分类模型的好坏。在f-measure函数中，当参数为1时，就是最常见的F1-measure。F1综合了P和R的结果，当F1较高时则能说明试验方法比较有效。F1 也可以写成 $\displaystyle \frac {2*P*R} {P+R}$ 。

P-R曲线（PRC）根据预测结果将预测样本排序，最有可能为正样本的在前，最不可能的在后，依次将样本预测为正样本，分别计算当前的精确率和召回率，绘制P-R曲线。AUC（Area Under ROC Curve）为ROC曲线下的面积。

ROC，受试者工作特征。根据预测结果将预测样本排序，最有可能为正样本的在前，最不可能的在后，依次将样本预测为正样本，分别计算当前的TPR和FPR，绘制ROC曲线。
在这里插入图片描述
敏感性或者灵敏度（Sensitivity，也称为真阳性率）是指实际为阳性的样本中，判断为阳性的比例（例如真正有生病的人中，被医院判断为有生病者的比例），计算方式是真阳性除以真阳性+假阴性（实际为阳性，但判断为阴性）的比值（能将实际患病的病例正确地判断为患病的能力，即患者被判为阳性的概率）。即有病（阳性）人群中，检测出阳性的几率。（检测出确实有病的能力）

$sensitivity=\displaystyle \frac {TP} {TP+FN}$

最后，特异性或特异度（Specificity，也称为真阴性率）是指实际为阴性的样本中，判断为阴性的比例（例如真正未生病的人中，被医院判断为未生病者的比例），计算方式是真阴性除以真阴性+假阳性（实际为阴性，但判断为阳性）的比值（能正确判断实际未患病的病例的能力，即试验结果为阴性的比例）。即无病（阴性）人群中，检测出阴性的几率。（检测出确实没病的能力）

$sensitivity=\displaystyle \frac {TN} {TN+FP}$