百度搜索算法之排名的公平性,百度如何保证排名公平

点击: 分类:百度算法

4.1 惊雷算法2.0 ——针对恶意刷点击问题

为了保证搜索用户体验,促进搜索生态良性发展,2017年11月,百度搜索发布惊雷算法,严厉打击刷网站点击的作弊行为。2018年5月,惊雷算法升级至2.0版本。

当前,惊雷算法2.0主要针对“恶意制造作弊超链”和“恶意刷点击”的作弊行为。针对作弊的网站,将会受到限制搜索展现、清洗作弊链接、清洗点击的处理,并会将站点作弊行为计入站点历史,严重者将永久封禁。

关于惊雷算法2.0的更多信息请参考:
2017.11.20 百度搜索推出惊雷算法 严厉打击刷点击作弊行为
2018.5.23 百度搜索将推出惊雷算法2.0

4.2 烽火算法3.0

一直以来,百度搜索对于危害用户隐私、恶意劫持站点的行为态度坚定,一经发现一律严惩。2017年2月,百度搜索发出针对恶意劫持行为的公告:《打击劫持 百度移动搜索推出烽火计划》,严惩恶意劫持的行为。2018年5月,百度搜索上线烽火算法2.0,严惩“窃取用户数据”和“恶意劫持”的行为。2019年3月,烽火算法升级至3.0版本。

烽火算法打击的网站劫持有以下两种表现形式:

跳转劫持:用户点击目标网页后,页面直接跳转至另一页面;

后退劫持:用户完成对某网页的浏览,点击“后退”按钮时出现以下几种情况
(1)无法后退,点击后退时页面无反应,内容无变化;
(2)后退到“假百度页面”,搜索结果出现霸屏现象;
(3)后退到用户之前没有访问过的垃圾、作弊等低质网页。

为了能够更好的执行烽火算法,规定算法观察期如下:

1.站点首次被烽火算法覆盖,百度会通过站内信等方式发出站点问题说明及整改期限要求,未在规定时间内完成整改,将会限制站点在搜索结果中的展现,减少对用户的伤害。站点整改之后,经过算法观察期才可解除搜索展现的限制。
解除限制展现的申请条件:按照要求完成所有劫持问题的整改。
算法观察期:一个月

2.第二次发现站点存在劫持问题,百度将限制搜索结果展现,并同步通知到站点。
解除限制展现的申请条件:按照要求完成所有劫持问题的整改。
算法观察期:三个月

3.第三次及以上发现站点存在劫持问题,永久限制站点展现。

关于烽火算法2.0的更多信息请参考:
2019.3.14 百度烽火算法升级,持续打击网络劫持问题
2018.5.17 严厉打击恶意劫持 百度移动搜索推出烽火算法2.0
2018.2.5 HTTPS改造全解析
2017.2.23 打击劫持 百度移动搜索推出烽火计划

4.3 被黑相关——针对被黑问题

2018年3月,为了保证搜索生态安全,保障用户权益,百度搜索发布《网站被黑操作指南》,引导站点排查被黑情况。

网站被黑,通常表现为网站中出现大量非本网站发布的类似博彩内容,或网站页面直接跳转到博彩页面。

以下是几种网站被黑后可能出现的页面:

● 内容非网站发布,内容中含大量博彩网站指向:

图片

● 网站页面直接跳转到博彩网站:

图片

网站被黑表明网站安全存在严重问题或漏洞。

如何防范网站被黑,请参考以下内容:

首先,自查站点是否被黑

1.通过百度搜索资源平台的“网站体检工具”,可以对网站各项指标进行安全检测,排查网站的安全隐患。

2.被黑网站在数据上有一个特点,即索引量和从搜索引擎带来的流量在短时间内数据异常。所以,站长可以利用百度搜索资源平台的索引量工具,观察站点索引量是否有异常;如果发现数据异常,再通过流量与关键词工具查看获得流量的关键词是否与网站有关、是否涉及博彩和色情;

3.通过Site语法查询站点,结合一些常见的色情、博彩类关键词效果更佳,有可能发现不属于站点的非法页面;

4.由于百度流量巨大,有些被黑行为仅针对百度带来的流量予以跳转,站长很难发现,所以在查看自己站点是否被黑时,一定要从百度搜索结果中点击站点页面,查看是否跳转到了其他站点;

5.站点内容在百度搜索结果中被提示存在风险;

6.后续可以请网站技术人员通过后台数据和程序进一步确认网站是否被黑。

其次,被黑之后如何处理

确认网站被黑后,网站运营人员除了要推动技术人员快速修正外,还需要做一些善后和预防的工作;

1.清理已发现的被黑内容,将被黑页面设置为404死链,并通过百度搜索资源平台的死链提交工具进行提交(我们发现有些站点采用了将被黑页面跳转至首页的做法,非常不可取);

2.网站如有变更页面,建议使用链接提交工具向百度提交变更页面数据;

3.立即停止网站服务,避免用户继续受影响以及影响其他站点;

4.排查出可能的被黑时间,和服务器上的文件修改时间相比对,处理掉黑客上传、修改过的文件;除此之外,技术人员还需要检查服务器中的用户管理设置,确认是否存在异常的变化。注:可以从访问日志中,确定可能的被黑时间。不过黑客可能也修改服务器的访问日志。

5.更改服务器的用户访问密码。

6.做好安全工作,排查网站存在的漏洞,防止再次被黑。

最后,给大家一些网站自我防护的建议:

1.多种安全防护同步进行:适合中小型资讯网站

网站程序勤打补丁:现在很多资讯类网站用的系统使用了内容管理系统(CMS),作为比较常见的内容管理系统(CMS),有一个问题,那就是漏洞比较大众化,因为源码是公开的,所以很容易被研究出漏洞,需要对网站程序及时进行漏洞修复。

2.对服务器进行常规的安全防护

(1)在上班时间之外,对服务器上的网站权限做设置,禁止文件修改,后台文件隐藏或迁移到根目录之外。

(2)参考一些网站的安全设置,非限定的IP不能写入到数据库。

3.不使用开源程序默认的robots文件

下图是一个地级市的资讯类站点的robots文件,从robots文件中可以看出,该网站用的是织梦后台,那黑客就可以通过各种针对织梦攻击的软件进行操作,也可以针对织梦网站的常见漏洞进行扫描和针对性攻击。

图片

4.进行HTTPS改造,强化网站安全

HTTPS主要由有两部分组成:HTTP+ SSL / TLS,也就是在HTTP上又加了一层处理加密信息的模块。服务端和客户端的信息传输都会通过TLS进行加密,所以传输的数据都是加密后的数据。HTTS复杂的加密机制有效的加大了网站的安全性,加密机制与认证机制可以减少网站被劫持和假冒的风险,建议站长们可以通过做HTTPS改造来强化网站安全。

关于网站被黑的更多信息请参考:
2018.3.21 网站被黑应该怎么做 — 网站被黑操作指南
2018.2.5 HTTPS改造全解析

本文版权归本站所有,未经允许,禁止转载本站内容。

相关内容

  1. 百度算法公布之后会打击所有触犯算法的网站吗
  2. 百度绿萝算法2.0及算法解读-针对软文发布及交易的算法
  3. 百度都上线了哪些算法
  4. 百度冰桶算法打击恶意广告
  5. 用户体验算法冰桶算法
  6. 百度闪电算法解读,网站速度及服务器稳定性对排名的影响
  7. 百度极光算法网站时间因子的重要性
  8. 飓风3.0同品牌多网站可能被打击
  9. 细雨算法打击低质量内容及恶劣采集
  10. 劲风算法打击题文不符及跨领域和恶劣聚合页面
  11. 百度直播公开课搜索算法全解读
  12. 百度搜索算法之友好的用户体验
  13. 百度搜索算法之排名的公平性,百度如何保证排名公平
  14. 百度搜索内容质量白皮书
  15. 百度搜索算法之网页质量
  16. 百度搜索算法之用户需求的满足
  17. 针对网站安全的搜索算法
  18. 落地页体验问题的搜索算法
  19. 石榴算法提升网页质量

上一篇: 百度搜索算法之友好的用户体验

下一篇: 百度搜索内容质量白皮书