Gea-Suan Lin's BLOG: 人對於 Spam 的判斷能力

SpamOrHam.org 是一個建立 Spam 與 Ham (Non-Spam) 樣本的計畫。2005 年時他們拿 TREC 2005 Public Spam Corpus 當作樣本，這份樣本裡的九萬兩千多封信件是以多種 Spam Filtering 軟體判斷歸類出來的，而 SpamOrHam.org 的計畫就是希望以人工的方式審視資料，找出錯誤的判斷。

然而，今天在 Slashdot 上看到網站的發起人認為這個計畫並不成功：People Suck at Spotting Phishing，原文在 There’s one born every minute: spam and phishing。

在文章中他就舉了幾個例子，包括明明看起來只是一個簡單的回信，但使用者卻回報為 Spam。而 Phishing 的信件更糟，Spam Filtering Software 已經正確判斷為 Spam 類，但使用者卻說他不是 Spam…

看起來發起人相當無奈… :P

Gea-Suan Lin's BLOG

Tuesday, May 16, 2006

人對於 Spam 的判斷能力

About

About Me

Previous