怎样完全禁止百度谷歌等搜索引擎收录?

飘逸的风3年前 (2022-07-27)经验588
建设网站的目的大部分是为了优化搜索引擎排名,实现互联网营销,但特殊情况下,仍会遇到“不希望搜索引擎收录”的需求,这里给出终极、有效的禁止百度等搜索引擎收录的解决方案。

一、Robots.txt只能禁止抓取,无法禁止收录

很多人认为rohots.txt也已禁止百度收录,这是严重的误解,robots.txt文件可以告诉搜索引擎哪些目录和文件可以抓取,哪些不可以。经过实践发现,即使禁止搜索引擎抓取根目录,robots文件也并不能实现禁止百度等搜索引擎收录。如果一个网站的外链较多,基本上无法通过正常手段禁止百度收录,淘宝便是一个典型的案例(淘宝的robots.txt设置为禁止抓取根目录,但首页依然被收录)。

二、通过Nginx判断user_agent禁止百度等搜索引擎访问,实现禁止收录

既然不能直接禁止抓取,那就干脆禁止百度蜘蛛等搜索引擎访问,思路是:判断user_agent,如果是百度蜘蛛、谷歌机器人等搜索引擎的user_agent,就返回403或者404,这样百度等搜索引擎就会认为这个网站无法打开或者不存在,自然也就不会收录了。

Nginx的配置代码如下:


if ($http_user_agent ~* "qihoobot|Baiduspider|Googlebot|Googlebot-Mobile|Googlebot-Image|Mediapartners-Google|Adsbot-Google|Feedfetcher-Google|Yahoo! Slurp|Yahoo! Slurp China|YoudaoBot|Sosospider|Sogou spider|Sogou web spider|MSNBot|ia_archiver|Tomato Bot")
{
   return 403;
}
通过curl模拟搜索引擎抓取,测试以上代码有效,实现了彻底禁止百度收录!


更多参考:《Apache/Nginx/PHP 屏蔽垃圾 UA 爬虫的方法》


文章来源:https://www.likecs.com/show-307369.html

相关文章

外贸商城开发经验分享

外贸商城开发经验分享

商城名称:Wholesale Gold Filled Jewelry, Gold Plated Jewelry, Cubic Zirconia Jewellery: JewelCZ 商城网址:htt...

网兜网优惠券折扣网项目开发经验

网兜网优惠券折扣网项目开发经验

项目名称:网兜网 项目网址:https://www.51dodo.net/ 项目介绍:网兜折扣优惠券运营平台(www.51dodo.net),是专业从事折扣优惠券信息运营服务、互联网信息发布、户外...

53种方法可以提高PHP的编程效率

用单引号代替双引号来包含字符串,这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量,单引号则不会,注意:只有echo能这么做,它是一种可以把多个字符串当作参数的“函数”(译注:PHP手册中说...

让flv和mp4格式的视频可以在服务器上播放,即向服务器添加http头的方法

也许你会在纳闷,为什么我上传了flv或MP4文件到服务器,可输入正确地址通过http协议来访问总是出现“无法找到该页”的404错误呢?这就表明mp4格式文件是服务器无法识别的,其实,这是没有在iis中...

一些可以查询IP地理位置、身份证所在地、手机归属地的接口

新浪的IP查询接口: 新浪的:https://counter.sina.com.cn/ip?ip=IP地址 返回Js数据,感觉不是很精确,可以把问号后面的去掉,直接返回本机对应的IP所在地...

PHP 不支持CURL的解决方法

最近为了给openkee.com博客的域名备案,把网站程序临时转到et53.com上面,由于博客采用的是emlog内核,而且使用了云插件,结果导致提交日志时报500错误。服务器采用的是PHP+IIS,...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。