物体検出モデルの評価指標

物体検出を評価する際の指標をよく忘れるのでまとめておきます。

最初に画像をTP・TN・FP・FNの4つの領域に分けます。

	予測が正	予測が負
正解が正	TP	FN
正解が負	FP	TN

図で表すと以下のようになります。 f:id:neginegitoro:20191225185353j:plain TP・TN・FP・FNの面積に基づいてどの程度検出できているかを評価していきます。

正解率とも呼ばれます。画像全体に対して正しく判断できていた領域の割合をあらわします。

$Accuracy = \frac{TP + TN}{TP + TN + FP + FN}$

ただし、例えば、画像中の5％を占める物体があり、画像中の物体を全く認識しなかった場合でもAccuracyは95%となります。
このように物体を全く認識しないモデルでも非常に高いと値となることがあるので、Accuracyだけを用いるのは危険です。

精度とも呼ばれます。物体があると判断した領域のうち、実際に物体がある領域の割合を表します。

$Precision = \frac{TP}{TP + FP}$

実際の物体のほんの一部しか検出していなくてもPrecision100%となってしまうので注意が必要です。

再現率とも呼ばれます。実際に物体が存在する領域のうち、物体が存在すると判断できた領域の割合をあらわします。

$Recall = \frac{TP}{TP + FN}$

ただし、画像全体を物体として認識していた場合にもRecall100%となるので注意です。

F値とも呼ばれます。トレードオフの関係にあるPrecisionとRecallの調和平均です。

$F-measure = \frac{2PR}{P + R}$

（P、RはそれぞれPrecision、Recall）

実際に物体が存在する領域と、モデルが物体が存在すると判断した領域のうち、実際に物体が存在する領域の割合を表します。

$IoU = \frac{TP}{TP + FP + FN }$

オーバーラップ率と覚えたほうが理解しやすいかも。
けっこう厳しい指標です。

いろいろな指標を組み合わせて評価することが大事なようです。精度95%！！とか言われても大したことないときもあるし。

ねぎとろ放浪記