行业资讯

关于网站垃圾内容的识别以及处理方法

发布时间:2013年08月03日    点击数:

关于网站垃圾内容的识别以及处理方法

  毋庸置疑,对于网站内部优化来说,垃圾内容是严重影响seo的因素,但是在百度等搜索引擎中,去没有对垃圾内容进行具体详尽的解说,对此,这就好比每个家长都对自己的孩子说,你们要考第一,但是怎么考第一?具体如何实施,却没有给出明确的答复,那么,我们想要让网站更加利于seo,就有必要好好研究一下,对于搜索引擎来讲,什么是垃圾内容,以及这些垃圾内容应该如何处理。

  如何识别网站垃圾内容

  观点一:抄袭的文章就是垃圾内容

  还是拿最大牌的搜索引擎百度来说吧,2013着实是一个与众不同的年份,无论是绿萝,还是石榴,都让很多站长的排名深受影响,绿萝算法说白了就是针对链接作弊,当然,这其中肯定会有些是属于误伤,除此之外,在去年年底的时候,百度还推出了了一个所谓的星火计划,主要就是支持原创性站点,这样一来,不少朋友,都会不由自主的觉得,抄袭的内容就是垃圾内容。

  观点二:浏览时间短的文章是垃圾内容

  第一种是表面的判断,是否是抄袭,只要搜索一下,立马就能判断,第二种观点,是看页面的访问时间,有的朋友觉得,对于网友有价值的内容,网友就会停留更长的时间,所以,浏览时间短的内容,肯定就是垃圾内容。

  关于上面所提及到的低一点和第二点,我并不完全赞同,首先说,自从搜索引擎推出了“支持原创”的说法之后,有多少人开始进行所谓的“原创”工作?不得不说,对于很多人来讲,“原创”和“伪原创”已经混淆,甚至有人说高质量的伪原创就是原创!或许从字面上来看,颠倒且替换之后的语言的确不同,但是对于网友来说,看到的是一篇基本无价值的“废话”。而且有的时候,网站编辑对于一些不甚熟悉的名字,还会自作主张的替换或者更改,甚至为了凑字数而减少一部分文章,这样让人读起来更加的晦涩难懂,甚至会将网友引导到一条错误的道路上,如此一来,原创还不如直接抄袭更对读者有价值。

  第二种观点,相对比与第一种,的确有了层面上的提升,不再从表面看事情,能够深入一些,不过我还是觉得不过全面,为什么这么说呢?比如说想要寻找某个汉字怎么读,或者想知道列车到站时间,我只要搜索一下,答案尽在眼前,我找到了我需要的答案,难道好要在留下来?难道有一大堆文字,我找半天才找到启动时间的页面会比一个直接展示出时间的页面更利用用户体验?

  显然,抄袭的内容不能够说是垃圾内容,浏览时间长的内容也不能说是有价值内容。那么,如何找到网站的垃圾内容呢?

  小编以为,访问次数是判断垃圾内容的最关键因素。

  我们的网站肯定都会有数据统计软件,使用这些软件,我们就能够很好的识别出,那些链接点击比较多,点击率高的,就是用户关心的内容,点击率少的,说句难听的,就是站着茅坑不拉屎,白白浪费网站权重,但是却没有对用户产生价值。

网站站长如何应对网站垃圾内容

A、删除垃圾内容,并将这些页面设置为404页面后,及时通过百度站长平台的死链工具提交死链列表。不仅令百度对站点的自我清理行为及时响应,更方便站点主动控制网站内容在搜索引擎的呈现情况。

B、提高注册用户门槛,限制机器注册
1)群发软件通常使用自动的程序探测论坛默认的注册文件名、发帖文件名。管理员可以不定期的修改注册用户文件名、发帖文件名;注册、发帖按钮使用图片;与程序默认的不同,可以防止被自动程序搜索到。

2)发帖机通常是机器注册,行为模式单一。管理员可添加一些需要人工操作的步骤,有助于限制机器注册。 如:使用验证码;限制同一邮箱注册ID的数量,同时启用邮箱验证;使用更为复杂的验证机制;经常更换注册问答。

C、严控机器发帖行为,如使用验证码、限制短时间内连续发帖等。

D、建立黑名单机制,将群发常用词、广告电话和网址等加入黑名单,对含有黑名单内容的帖子进行限制或清除。黑名单应该不断维护,以堵截原有垃圾词汇发生变形和新生垃圾词汇。

E、对站内的异常进行监控,防止网站被黑。发现注册量、帖子数,甚至站点流量爆增后,及时发现和查找原因。

F、对站点内用户的行为进行监控
1)部分异常用户的ID结构有别于普通用户,如使用无意义的字母数字、或几个单个汉字的无序组合;如使用商业词作为ID

2)发布内容间隔过短

3)发布的内容绝大部分非常类似

4)发布的大部分内容里含有类似的特征,如某个网址、电话、QQ号码等联系方式的

G、不允许发布带有可执行代码的内容,避免弹窗、跳转等严重影响用户体验的情况发生。

H、对部分web2.0位置提及的链接,使用“nofollow”进行标记,如:bbs签名内的链接、BLOG回复ID自置的链接

I、论坛中的广告、灌水版块,建议加上权限限制,或者使用robots.txtx文件禁止搜索引擎收录。

J、关注建站程序的安全更新,及时安装补丁程序。保障用户账号安全,避免发生盗用正常用户账号或历史沉寂用户账号发布垃圾内容的情况发生。

信息来源:百度优化

上一篇:东莞SEO公司电子商务网站数据分析
下一篇:SEO和SEM的区别及优劣势介绍