数据结构与算法-如何过滤垃圾短信-朴素贝叶斯算法

有一下3中过滤方式

基于黑名单规律

可以制作手机号码的黑名单:

  1. 利用bloomfiter来过滤手机黑名单,可能会有误判的可能
  2. 将黑名单方法服务器,利用时间换空间

基于规则过滤

可以将垃圾短信的样本中出现的词进行整理,计算他们是垃圾短信的概率和不是垃圾短信的概率如果一个单词是垃圾短信的概率远远大于非垃圾短信的概率说明它是垃圾短信的词语。

基于概率过滤

利用朴素贝叶斯算法,计算词语和垃圾短信的关系