专业为本地企业建设网站、设计制作、程序订做、网站维护、论坛搭建
服务热线:0591-86060123
  建站服务
普及型网站设计套餐 ¥1500
企业型网站设计套餐 ¥3000
豪华型网站设计套餐 ¥5000
商城型网站设计套餐 ¥6580
定制型网站设计套餐 ¥面 谈
智赢型ABC ¥580/780/980
  网站建设
网站建设套餐
网站建设流程
功能模块介绍
网页设计报价
网站改版设计
网站售后服务
  客服中心
业务咨询:
点击这里给我发消息
点击这里给我发消息
值班电话:
  0591-86060123  (7*24)
  (0)13459451530    (7*24)
在线服务QQ:
QQ:109729489  QQ:13713791
网站优化文章
搜索引擎指南robots.txt文件
作者:佚名    文章来源:不详    点击数:    更新时间:2008-4-15

   

  有一种力量其实一直在渗入大量的网站和页面,我们通常看不到它们,而且它们通常也很蛮横,大部分人甚至不知道它的存在,大家不要误会,其实我说得是搜索引擎爬虫和机器人。每天,上百个这样的爬虫会出来对网站进行快速的搜索。不管是不是google打算对整个网络进行索引,还是spam机器人打算收集大量的 email地址,通常它们这样的寻找是漫无目的的。作为网站拥有者,我们可以通过一个叫做robots.txt的文件来控制哪些动作是机器人可以做的。

  创建robots.txt文件

  好,现在我们开始行动。创建一个叫robots.txt的文本文件,请确保它的文件名是正确的。该文件必须上传到在您的网站的根目录下,而不是二级目录下(例如,应该是http://www.mysite.com,而不是http: //www.mysite.com/stuff),只有满足以上两点,即文件名正确和路径正确,搜索引擎才会根据该文件中的规则工作,否则 robots.txt仅仅只是个常规文件而已,没有任何作用。

  现在,你已经知道如果这个文件该如何命名,以及应该把它上传在何处,接下来你会学习在这个文件中键入命令,搜索引擎会遵循一个叫做“机器人排除协议”(Robots Exclusion Protocol)的协议。其实,它的格式很简单,并且能够满足大多数的控制需要。首先是一行USERAGENT用来识别爬虫类型,紧跟着的是一行或者多行DISALLOW,这些行是用来限制爬虫访问网站的一些部分的。

  1) robots.txt基本设置

  User-agent: *

  Disallow: /根据以上的声明,所有的爬虫(这里用*表示出来)均不允许对您的网站的任何部分进行索引,这里的/表示所有页面。通常情况下这不是我们需要的,但这里仅仅是让大家有个概念而已。

  2) 现在让我们做一些小小的改动。尽管每个站长都喜欢Google,但是你可能不希望Google的镜像机器人挖掘你的网站,也不希望它把你的网站的镜像放在网上,实现在线搜索,如果仅仅是为了节省你的网站所在的服务器的带宽,下面的声明可以做到这一点

  User-agent: Googlebo

[1] [2] [3] 下一页

文章录入:admin    责任编辑:admin 
  • 上一篇文章:

  • 下一篇文章:

  • 版权所有:福清立普信息技术有限公司
    电话:(86)0591-86060123
    传真:(86)0591-85157891 服务质量监督:(0)13459451530
    地址:福清市元洪路景观豪庭4幢1709 邮编:350300
    《中华人民共和国增值电信业务经营许可证》编号:闽ICP备05031385号