Neo's Blog

不抽象就无法深入思考
不还原就看不到本来面目!

0%

常见系统设计题系列-垃圾短信

  • 基于名单库

hash、布隆过滤器等

  • 基于规则

人为找出规则-包含哪些词的是垃圾|需要有样本数据,然后进行机器学习-基于出现频次

  • 基于概率统计(朴素贝叶斯)

如果一条短信包含了A,B,C等N个词,那么这条短信是垃圾短信的概率是多少呢

你的支持是我坚持的最大动力!