
維普資訊
第8卷第13期2008年7月
科學技術與工程
Vo1.8 No.13 July 2008
1671-1819(2008)13-3504-05
Science Technology and Engineering
@2008 Sci.Tech.Engng.
基于貝葉斯網絡的郵件過濾系統的設計
黃詮 楊盛 陳治平¨
(1湖南大學計通院,長沙410082;2湖南人文科技學院計算機科學與技術系,婁底417000)
摘要電子郵件作為網絡應用的一個重要方面已成為現代通信中不可缺少的一部分,但是垃圾郵件的蔓延給用戶帶來了
嚴重的損失,如何防范垃圾郵件具有重要的實用意義。在分析了垃圾郵件特點的基礎上,構建貝葉斯分類模型,利用貝葉斯
分類模型設計了一種郵件過濾系統。實驗結果表明,設計的郵件過濾系統對垃圾郵件的過濾具有比較明顯的效果。
關鍵詞垃圾郵件 貝葉斯 文本分類
文獻標志碼A 中圖法分類號TP309.5;
隨著互聯網的迅猛發展,網絡應用已經深入到
成和發送的垃圾郵件對于發件人、收件人、郵件主
人們日常生活的方方面面,電子郵件作為網絡應用
的一個重要方面,給人們帶來了極大的便利。但 前應用范圍日趨狹窄。
題甚至郵件內容都是隨機生成的,使得該種技術目
是,各種垃圾郵件的日益泛濫,也給人們帶來了極
大的不便和危害。一些非法組織和個人,利用網絡
郵件服務存在的漏洞,大量發送垃圾郵件,造成正
常的郵件業務無法提供服務,尤其是國外的一些組
3)基于統計分析的貝葉斯算法技術。基于統
計的原則,采用標記權重的方式,根據對用戶認為
的垃圾郵件和非垃圾郵件進行統計計算,生成過濾
規則,具有學習漸進的功能,可以逐漸取得好的
效果。
織和個人利用我國部分擁有郵件服務器的單位對
郵件服務器的管理不嚴,借道轉發他們的垃圾郵
件,在國際上造成了不良影響。如何準確地從大量
郵件中尋找到所需的有用郵件,已成為和網絡服務
供應商和電子郵件用戶關心的一大問題,這就是所
4)基于連接頻率的動態規則方式。由于一個
正常用戶發送郵件的數量和頻率遠遠低于垃圾郵
件發送者,因此可以根據垃圾郵件發送具有一定時
間內郵件數量和郵件連接頻率都非常大的情況,從
謂的郵件過濾問題。
針對垃圾郵件泛濫的情況,到現在為止,國際
上主要反垃圾郵件技術有如下6種:
頻率和數量對垃圾發送者的連接行為進行控制。
5)電子郵票方案。因為垃圾郵件發送具有大
規模發送成本很小的行為特征,微軟公司提出了對
發送郵件進行收費的解決方案。不過這種方式對
廣大的正常郵件發送者而言帶來了新的負擔,還需
考慮。
1)IP地址、域名、郵件地址黑白名單方式。這
種技術手段是最傳統的方式,它通過黑名單技術對
垃圾郵件屏蔽,通過白名單技術對允許的郵件放行。
2)基于信頭、信體、附件的內容過濾方式。該
項技術目前尚不成熟,因為現在的群發程序自動生
2008年3月l8 Et收到
第一作者簡介:黃詮(1977一),男,湖南漣源人,湖南人文科技學
院計算機系助理講師,湖南大學碩士生,研究方向:機器學習。
6)Challenge.Response方式。挑戰.應答模式是
從增加垃圾郵件發送者時間成本上入手,要求每發
送一封郵件,就要求發件人回答一些問題,利用這
種方式來增加發送時間。
現在的電子郵件過濾系統一般采用基于文本
分類的過濾方法。文本分類(Automatic Text Catego-
通信作者簡介:陳治平(197l一),男,湖南大學計算機與通信學院
副教授。博士。碩士生導生,研究方向:機器學習。
rization)就是利用計算機對文本集(或其它實體或

本文發布于:2023-11-18 17:26:18,感謝您對本站的認可!
本文鏈接:http://www.newhan.cn/zhishi/a/170029957832372.html
版權聲明:本站內容均來自互聯網,僅供演示用,請勿用于商業和其他非法用途。如果侵犯了您的權益請與我們聯系,我們將在24小時內刪除。
本文word下載地址:基于貝葉斯網絡的郵件過濾系統的設計.doc
本文 PDF 下載地址:基于貝葉斯網絡的郵件過濾系統的設計.pdf
| 留言與評論(共有 0 條評論) |