介紹 confusion Matrix?
Basic confusion Matrix
confusion matrix 為一個用以紀錄真實狀況與預測狀況的 table, 以高度視野縱觀兩者交互情況。
說明
今天我們有一個用來預測流感的演算法, 以及真的有哪些病人得病的真實資料, 我們將兩者會對上的情況放在 confusion matrix 一起來看, 上方就是病人真的有或是沒有 A 型流感, 左方則是我們的演算法的預測結果。
當病人真的有 A 型流感且演算法預測出該病人有A 型流感時, 稱之為 True positive; 反之, 病人真沒有A 型流感且演算法也預測說該病人沒有 A 型流感時, 稱之為 True Negative。
表達中,前者的 True 表演算法預測結果正確, 後者的 Positive 跟 Negative 表演算法結果。
同理可證, 若演算法預測出說該病人沒有 流感, 但實際上病人真的有流感時, 就代表 演算法預測錯誤/失敗, 所以這情況就是 False Negative 。重申一次, positive 與 Negative 為演算法預測結果。True/False 為真實情況與預測情況的結果, 如果事情屬實為 True, 例如真的沒有且預測也沒有表 True。
如此一來, 我們就可以使用該 confusion matrix 來表達各種演算法的預測結果了喔, 例如 KNN, Random Forest 等
Complicated Matrix
當我們把欄位空增時會如何呢?方才, 我們只問有跟沒有而已。如果現在是給定三民區的餐廳評價喜歡或不喜歡, 我的演算法可不可以用來預測 客人對即將在三民區新開的餐廳接受度呢?這時候, 我們可以理解到只有斜對角部分是演算法預測成功, 也就是運作正確的地方, 其他地方就是演算法搞砸的結果。
結論
confusion Matrix 告訴你演算法做對或是做錯
參考資料:
Machine Learning Fundamentals: The Confusion Matrix-https://www.youtube.com/watch?v=Kdsp6soqA7o