人對於 Spam 的判斷能力
SpamOrHam.org 是一個建立 Spam 與 Ham (Non-Spam) 樣本的計畫。2005 年時他們拿 TREC 2005 Public Spam Corpus 當作樣本,這份樣本裡的九萬兩千多封信件是以多種 Spam Filtering 軟體判斷歸類出來的,而 SpamOrHam.org 的計畫就是希望以人工的方式審視資料,找出錯誤的判斷。
然而,今天在 Slashdot 上看到網站的發起人認為這個計畫並不成功:People Suck at Spotting Phishing,原文在 There’s one born every minute: spam and phishing。
在文章中他就舉了幾個例子,包括明明看起來只是一個簡單的回信,但使用者卻回報為 Spam。而 Phishing 的信件更糟,Spam Filtering Software 已經正確判斷為 Spam 類,但使用者卻說他不是 Spam…
看起來發起人相當無奈… :P