如何设置不让搜索引擎收录某些HTML页面

飘逸的风3年前 (2023-05-18)随笔580

一、关于robots文件

    1. 搜索引擎蜘蛛访问网站时,会先查看网站根目录下有没有robots.txt文件,该文件用于指令搜索引擎禁止抓取网站某些内容或 允许抓取某些内容。注意:就算允许抓取所有内容,也要建一个空的robots.txt文件放在根目录下。

    2. 只有在需要禁止抓取某些内容时,robots.txt才有意义,如果该文件为空,就意味着允许搜索引擎抓取所有内容。

    3. 语法解释:

         最简单的robots文件:禁止搜所有搜索引擎抓取任何内容,写法为:

         User-agent:*             

         Disallow:/

        其中,User-agent用于指定规则适用于哪个蜘蛛。通配符*代表所有搜索引擎。如只适用于百度蜘蛛,则写为:User-agent:Baiduspider。谷歌蜘蛛:Googlebot.

        Disallow告诉蜘蛛不要抓取某些文件。如 Disallow:/post/index.html,告诉蜘蛛禁止抓取Post文件夹下index.html文件。 Disallow后什么都不写,代表允许抓取一切页面。


二、关于meta robots标签

     1. 用于指令搜索引擎禁止索引本页内容。

     2. 语法解释:<meta name="robots" content="noindex,nofollow"> 意思是 禁止所有搜索引擎索引本页面,禁止跟踪本页面上的链接。

        noindex:告诉蜘蛛不要索引本页面。

        nofollow:告诉蜘蛛不要跟踪本页面上的链接。

        nosnippet:告诉蜘蛛怒要在搜索结果中显示说明文字。

        noarchive:告诉搜索引擎不要显示快照。

        noodp:告诉搜索引擎不要使用开放目录中的标题和说明。


三、只禁止百度收录标签
     <meta name="Baiduspider" content="noindex,nofollow">


相关文章

浅谈社会化电子商务Social Shopping

一、什么是社会化电子商务(Social Shopping) Social Shopping is a method of e-commerce where shoppers’ friends...

去年全球网民增长8%至23亿 中国5.13亿排第一

去年全球网民增长8%至23亿 中国5.13亿排第一

2011年全球网民增长8%(腾讯科技配图) 腾讯科技讯(晁晖)北京时间12月26日消息,据国外媒体报道,调查机构BackgroundCheck.org的数据显示,在菲律宾、印度等亚洲国家拉动下,...

码农需要了解的10大开发趋势和技能

码农需要了解的10大开发趋势和技能

作为一个码农,在码农的世界跟不上潮流是伤不起的。写代码心如止水,但是此时此刻你应该准迎接新的天翻地覆。根据最新的报道表明,2013年码农是最高薪的职业。为了成为码农中的码农,你必须了解并且准备好201...

关于网站访问慢的想法

  近期本站访问非常慢,可能是使用国外服务器,而我宽带又用联通的原因吧。但这样确实很纠结,每次想找自己以前上传的参考资料都需要等半天,同样,也可能会给其他访问者带来一定的麻烦。   所以,我打算最近...

最近的动作

  最近在万网上开通了一个代理商,不开不知道,一开吓一跳!代理价格和会员直接价格,相差甚远啊!   万网早些时候,便已经与阿里云深度整合。不管是现在的虚拟主机,还是云服务器,都是基于阿里云。这对于其...

emlog博客升级5.3.1

呃呃呃,一口气从5.0.1升级到5.3.1,7个升级包,一个个上传,也是醉了! 不过还好,升级过程中,没有遇到任何让人头疼的问题。 一直用emlog,是我用过的所有博客系...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。