怎样完全禁止百度谷歌等搜索引擎收录?

飘逸的风4年前 (2022-07-27)经验700
建设网站的目的大部分是为了优化搜索引擎排名,实现互联网营销,但特殊情况下,仍会遇到“不希望搜索引擎收录”的需求,这里给出终极、有效的禁止百度等搜索引擎收录的解决方案。

一、Robots.txt只能禁止抓取,无法禁止收录

很多人认为rohots.txt也已禁止百度收录,这是严重的误解,robots.txt文件可以告诉搜索引擎哪些目录和文件可以抓取,哪些不可以。经过实践发现,即使禁止搜索引擎抓取根目录,robots文件也并不能实现禁止百度等搜索引擎收录。如果一个网站的外链较多,基本上无法通过正常手段禁止百度收录,淘宝便是一个典型的案例(淘宝的robots.txt设置为禁止抓取根目录,但首页依然被收录)。

二、通过Nginx判断user_agent禁止百度等搜索引擎访问,实现禁止收录

既然不能直接禁止抓取,那就干脆禁止百度蜘蛛等搜索引擎访问,思路是:判断user_agent,如果是百度蜘蛛、谷歌机器人等搜索引擎的user_agent,就返回403或者404,这样百度等搜索引擎就会认为这个网站无法打开或者不存在,自然也就不会收录了。

Nginx的配置代码如下:


if ($http_user_agent ~* "qihoobot|Baiduspider|Googlebot|Googlebot-Mobile|Googlebot-Image|Mediapartners-Google|Adsbot-Google|Feedfetcher-Google|Yahoo! Slurp|Yahoo! Slurp China|YoudaoBot|Sosospider|Sogou spider|Sogou web spider|MSNBot|ia_archiver|Tomato Bot")
{
   return 403;
}
通过curl模拟搜索引擎抓取,测试以上代码有效,实现了彻底禁止百度收录!


更多参考:《Apache/Nginx/PHP 屏蔽垃圾 UA 爬虫的方法》


文章来源:https://www.likecs.com/show-307369.html

相关文章

网兜网优惠券折扣网项目开发经验

网兜网优惠券折扣网项目开发经验

项目名称:网兜网 项目网址:https://www.51dodo.net/ 项目介绍:网兜折扣优惠券运营平台(www.51dodo.net),是专业从事折扣优惠券信息运营服务、互联网信息发布、户外...

让flv和mp4格式的视频可以在服务器上播放,即向服务器添加http头的方法

也许你会在纳闷,为什么我上传了flv或MP4文件到服务器,可输入正确地址通过http协议来访问总是出现“无法找到该页”的404错误呢?这就表明mp4格式文件是服务器无法识别的,其实,这是没有在iis中...

PHP 不支持CURL的解决方法

最近为了给openkee.com博客的域名备案,把网站程序临时转到et53.com上面,由于博客采用的是emlog内核,而且使用了云插件,结果导致提交日志时报500错误。服务器采用的是PHP+IIS,...

IIS设置支持flv,f4v,mp4,ogv,webm

IIS设置支持flv,f4v,mp4,ogv,webm

以配置支持flv格式为例 在iis的Internet信息服务(2003)点击右键 或指定的网站上(高版本的iis)右键选择“属性”,在弹出的窗口中选择“HTTP头”选项卡,然后点击“MIME类型”,...

Windows+Apache 访问速度慢的解决办法

1、首先在hosts文件中添加: C:\Windows\System32\drivers\etc 127.0.0.1       loca...

阿里云盘公测限时可以最多免费领取3倍存储容量啦!

阿里云盘公测限时可以最多免费领取3倍存储容量啦!

阿里云盘即将进行公测,现在开始到3月17日18点,可以在阿里云盘官网提前预约公测,可以免费领取最高3被存储容量,也就是说,最多可以领取阿里云盘3T容量,已经在使用的...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。