SpamAssassin(配合mailscanner)
作者:cschen33.tw@yahoo.com.tw
最後更新時間:2004/05/15

垃圾郵件太多了,怎麼辦?裝個反垃 圾郵件的軟體吧!spamassassin聽說是一個不錯的免費軟體,正確率也十分高大約8成左右,另外也有學習的功能

原理:
反垃圾郵件的原理,是根據郵件的內容(檔頭及本文)的一些規則而產生,可以是主旨,關鍵字,或是html_tag或是夾帶檔的類型,或是黑名單的方式,或 以正規表示法的方式 加以過濾,然後加以評分,達到某一個分數才識為垃圾郵件,因此我們主要的就是以設定評分的分數,在SpamAssassin,有一個評分表,會根據檔頭及 本文來評分,而檔頭的話,因為許多軟體會使用自定的標頭,因此可以用來辨識,而如果它的收信者沒有指明的話也會給比較高的分數。

特性:
郵件檔頭分析:
內容分析
黑名單
Razor:



分數表的定義請參考
http://www.spamassassin.org/tests.html
你可以修改你自己的設定檔
~/.spamassassin/user_prefs
例如加入一行其中NAME_OF_TEST是相對於該網頁,表格中的欄位,而分數放在最後
 score NAME_OF_TEST 0
由於MailScanner也會在檔頭加入資料我在上述網頁沒有看到資料,在/usr/share/spamassassin中的 20_head_tests.cf也沒有找到因此MailScanner 並不會影響評分,但是預設MailScanner

專有名詞
spam
一般來說,任何郵件在出件者所不要的.較精確的說:未經主動要求的大郵 件;郵件你沒有要求,且是經由自動的送給很多人.這個定義排除了病毒
ham 相對於ham;不是必須的郵件但是你要求的mail
Bayesian
一種統計分析,是由Paul Graham's在"Plan for Spam"文中所提出的,可以抓取所有類型的過濾
false negative spam不正確被識為ham.縮寫為"fn"或"FN".
false positive ham不正確被識為spam.縮寫為"fp"或"FP".
corpu 在郵件的本文使用一個訓練資料庫(plural is corpora).


學習功能:
所謂學習功能是指使用sa-learn 這個程式,你可以將某些信放在檔案或目錄中使用
sa-learn -D --spam  目的
sa-learn -D --ham   目的
其中-D代表顯示除錯的訊息
而--spam 及-ham請參考上述的說明,在學習後它會在使用中的目錄建立一個.spamassassin的目錄,且建立兩個檔bayes_seen及 bayes_toks
至於如何將信放在指定的目錄呢? 如果你是使用imap的話可以在outlook express建立目錄例spam,或ham,另外排程來讀取該檔
其它的方式是否可以建立一個帳號來收該檔呢?因郵件被更改無法執行,或是使用目錄分享(網路芳鄰),由一專人來過濾,全自動是;使用imap,次等方法是 將誤判的檔案以

MailScanner 如何使用spamassassin呢?
首先在/etc/MailScanner/MailScanner.conf中設定
在SpamAssassin 一節內
use SpamAssassin = yes
Max SpamAssassin Size = 30000
Required SpamAssassin Score = 6
High SpamAssassin Score = 10
SpamAssassin Auto Whitelist = no
SpamAssassin Prefs File = %etc-dir%/spam.assassin.prefs.conf
SpamAssassin Timeout = 120
Max SpamAssassin Timeouts = 10
SpamAssassin Timeouts History = 30
Check SpamAssassin If On Spam List = no
Spam Score = yes
Rebuild Bayes Every = 1800
Wait During Bayes Rebuild = no
其中第一項是在MailScanner中啟動spamassassin的使用
其設定檔在/etc/MailScanner/spam.assassin.prefs.conf