主流的垃圾网页辨别技术其实都忽视了网民的力量。其实网民的数目这么庞大,假如能充分发挥他们的力量,对其行为进行剖析记录总是可以加以借助。 近年来有部分文献研究尝试借助用户行为来辨别垃圾网页,不过多数集中在被动行为上。被动行为主如果基于用户在访问正常网页与垃圾网页时不自觉的表现出来的访问行为上的差异。 比如用户在页面上停留的时间、点击网页上链接的数目、与页面的交互次数等。