SecuriTeam Blogs ? Revenge of the Captcha! (Reverse Captcha, Ransom Notes and Image Spam)
這篇是由securiteam那看來的,早在幾個月前securityfocus就有一篇文章提到spammer漸漸在使用圖型方式寄送spam.我們常用的技術大部分仍在text下處理, spamassassin就是..遇到圖型SPAM呢?以目前的情況來說是不行. 有用gmail的人,對gmail的spam判斷能力一定讚譽有佳,但圖型spam呢? 同樣淪陷.我訂閱了一個maillist是寄到gmail去的,就發現好幾封. 加入OCR來判斷,或許會有人這麼提。
Captcah相信有不少人知道,就是產生一個應只有人類才能判斷的圖型(扭曲或加花點等等於圖上),防止bot去猜,在網站,論壇及blog都普遍使用這方法。但這個技術現在也拿來發SPAM了.還漸漸成為潮流.. ORZ… 從上面連結文章裡,有個圖,圖中的字還給你來個大小不同顏色不同,未來加點花,扭一下..
光學字元辨識,一定要夠聰明,不然就死定囉..尤其負荷重的伺服器能少裝外掛就少裝,只是圖型SPAM會愈來愈多,不處理又不行。
最近在網路上得知,Spamassassin中可以加裝 FuzzyOcr ((去年10月開始計劃,由OcrPlugin 修改而來)),系統還沒有加裝上去,這套外掛目前網路上的評價還不錯,加上以下參數可以防止前述的圖型Spam:
ocrad -s 5 -i
從我管理郵件主機開始,處埋垃圾信件就是日常的一部分,自從Maia Mailguard安裝後,我是清閒好一陣子,只是這場魔道之爭是無時無刻地相互較力,現今圖型SPAM開始成為趨勢,我只能參與這場無盡的競爭,直到我退休不管及不用郵件那天~~
小小的看法
有關Image spam 如果對抗其災害方向還是以”內容過濾”的方法著手 (用OCR也是迷失在內容過濾的誤導)….那會更迷失在spammer引發的垃郵戰ㄛ~
重點是:
『垃圾郵件與正常郵件最大的分野在”行為”不在”內容”,其關鍵是”造假”』
Spammer的技術發展,就是針對藉著『愚弄』內容過濾(Contents Filter)式的Antispam 的為方法, 因為其最大的問題是抵擋Spam的技術是用『內容』來過濾,從上例我們可以簡單發現若以”內容”過濾為主要核心技術來抵擋Spam的話,只要將內容扭曲變型 – 將內容『我變,我變,我變變變』,無論你的contents filter加入千百條rule都無法抵檔spammer的內容扭曲變型!
隨著技術的進步,所謂道高一尺,魔高一丈,spammer也在思考如何避開過濾成功滲透(其實多為閃躲內容過濾),聰明的spammer發現內容過濾的盲點,於是乎用『以子之矛,攻子之盾』的方法,乾脆把所有內容把文字改成圖像吧,看看你怎麼濾? 於是乎圖片式垃圾郵件產生。
因為郵件的廣告內容全部做成圖片,這樣一來就能避開那些使用內容過濾文本內容的防堵軟體的偵測,這也算是一種視破吧?! (內容過濾的罩門被視穿因此就破功了…)
於是乎使用內容過濾技術的防堵軟體廠商,紛紛出來為自家的產品解套,為內容過濾找尋一個讓人可以接受的出路-OCR, 廠商宣稱可以將圖片內容使用OCR(光學辨識技術)將圖片內的文字圖形轉換成文字,再進一步加以過濾。這個理論並沒有錯,但實質上只是製造話題來誤導了大眾,當垃圾郵件內容改以圖片表示時,筆者相信圖片裡的文字並不會”規規矩矩”的放在圖片裡,讓OCR很精準的辨識出文字,多加幾個簡單的步驟,比如將影影像扭曲、傾斜、交錯、對比、切割、位移、比例、色彩或是特效,就能讓OCR的辨識效果大為下降,這些步驟並不難,影像處理軟體幾個命令就解決了。
看看這篇文章就會有進一步的了解…
詳文參考:
http://tw.myblog.yahoo.com/jw!VwoDla2BGw7J5VsLorS0aTXs/article?mid=2&pk=antispam
>