专业为本地企业建设网站、设计制作、程序订做、网站维护、论坛搭建
服务热线:0591-86060123
  建站服务
普及型网站设计套餐 ¥1500
企业型网站设计套餐 ¥3000
豪华型网站设计套餐 ¥5000
商城型网站设计套餐 ¥6580
定制型网站设计套餐 ¥面 谈
智赢型ABC ¥580/780/980
  网站建设
网站建设套餐
网站建设流程
功能模块介绍
网页设计报价
网站改版设计
网站售后服务
  客服中心
业务咨询:
点击这里给我发消息
点击这里给我发消息
值班电话:
  0591-86060123  (7*24)
  (0)13459451530    (7*24)
在线服务QQ:
QQ:109729489  QQ:13713791
网站优化文章
搜索引擎指南robots.txt文件
作者:佚名    文章来源:不详    点击数:    更新时间:2008-4-15

    t-Image

  Disallow: /3) 以下代码不允许任何一个搜索引擎和机器人挖掘目录和页面信息

  User-agent: *

  Disallow: /cgi-bin/

  Disallow: /privatedir/

  Disallow: /tutorials/blank.htm4) 你还可以对多个机器人设置不同的目标,看看下面的代码

  User-agent: *

  Disallow: /

  User-agent: Googlebot

  Disallow: /cgi-bin/

  Disallow: /privatedir/这个设置很有趣,这里我们禁止了所有的搜索引擎对于我们的网站的挖掘操作,除了google,在这里Google被允许访问除了/cgi-bin/和/privatedir/以外的所有站点。这里说明,规则是可以定制的,但不是继承而来的。

  3) 有另外一种使用Disallow的方法:即允许访问网站所有内容,其实只要冒号后不输入任何东西就可以了

  User-agent: *

  Disallow: /

  User-agent: ia_archiver

  Disallow:在这里,除了alex以外的所有爬虫都不允许搜索我们的网站

  4) 最后,一些爬虫现在支持Allow规则,最著名的就是Google。正如这个规则的名字所说,"Allow:"允许你精确的控制那些文件或者文件夹是可以被访问的。然而,这个文件目前还不是robots.txt协议的组成部分,所以我建议只有在必须使用时才使用它,因为一些不够聪明的爬虫可能认为它是错误的。

  下面的内容来自于Google's的FAQs for webmasters,如果你希望除了Google以外的爬虫都不挖掘你的网站,那么以下的代码是做好的选择

  User-agent: *

  Disallow: /

上一页  [1] [2] [3] 下一页

文章录入:admin    责任编辑:admin 
  • 上一篇文章:

  • 下一篇文章:

  • 版权所有:福清立普信息技术有限公司
    电话:(86)0591-86060123
    传真:(86)0591-85157891 服务质量监督:(0)13459451530
    地址:福清市元洪路景观豪庭4幢1709 邮编:350300
    《中华人民共和国增值电信业务经营许可证》编号:闽ICP备05031385号