网站优化

谷歌 SEO 入门攻略 2018 年版(一):Google 抓取

点击次数:    更新时间:2017/12/22 10:31:36  【打印此页】  【关闭

2017-12-19 15:08 稿源:谷歌查找质量团队  0条评论

 撤稿纠错


 

QQ截图20171219152510.png


相关阅览:


谷歌 SEO 入门攻略 2018 年版(二):页面内容优化


谷歌 SEO 入门攻略 2018 年版(三):网站结构优化


谷歌 SEO 入门攻略 2018 年版(四):内容优化


谷歌 SEO 入门攻略 2018 年版(五):站点移动化及推行


前言


如果您经过 Google 查找运营、办理或推行在线内容,或经过在线内容获利,则本攻略对您适用。如果您是业务快速开展的商家、具有十几个网站的网站站长、网络署理方面的 SEO 专家,或者是对查找机制具有激烈爱好的 DIY SEO 达人,则本攻略也适用于您。如果您有爱好根据我们的最佳做法对 SEO 根底知识进行全面了解,那么本攻略相同适用于您。本攻略不会供给任何可让您的网站在 Google 中主动排位榜首的诀窍(抱愧!),可是如果您遵从下面列出的最佳做法,则有望让查找引擎更简略抓取、了解您的内容并将其编入索引。


查找引擎优化 (SEO) 通常是指对网站的各个部分进行纤细的修正。独自来看,这些修正可能只是逐渐纤细的改善,但与其他优化结合起来后,则可能会对您的网站在天然查找成果中的用户体会和作用产生明显影响。您可能早已了解本攻略中的许多主题,因为它们是任何网页的根本要素,但您可能并未充分利用它们。


您应该对网站进行优化,以满意用户需求。您的其间一个用户就是查找引擎,它可以协助其他用户发现您的内容。查找引擎优化是指协助查找引擎了解和出现内容。您的网站可能比我们的示例网站更简略或更杂乱,并且出现的内容可能天壤之别,但我们下面讨论的优化主题关于一切巨细和类型的网站均适用。我们期望本攻略在怎么改善网站方面可以给您带来一些全新的理念,同时也期望您在 Google 网站站长协助论坛1活跃共享您的问题、反应和成功事例。


相关术语


以下扼要术语表包含了本攻略中运用的重要术语:


•索引 - Google 会将其知悉的一切网页存储在其“索引”中。每个网页的索引条目描绘了该网页的内容和方位(网址)。编入索引是指当 Google 抓取、读取网页并将其增加到索引的进程。例如:Google 今日已将我网站上的几个网页编入索引。



•抓取 - 寻觅新增网页或已更新网页的进程。Google 会经过盯梢链接、读取站点地图或其他各种办法来发现网址。Google 经过抓取网页来寻觅新增网页,然后(在恰当的时候)将网页编入索引。



•抓取东西 - 从网络中抓取(提取)网页并将网页编入索引的主动化软件。



•Googlebot - Google 抓取东西的通用称号。Googlebot 会继续不断地抓取网页。



•SEO - 查找引擎优化:使您的网站更易于查找引擎抓取和编入索引的进程。也可指从事查找引擎优化的人的职位称号,例如:我们刚刚聘请了新的 SEO 来提高我们在网络上的曝光度。



您的网站是否已被 Google 查找引擎录入?


可在 Google 查找引擎中对您的网站的主页网址履行“site:”查找。如果您能看到成果,则标明您的网站在索引中。如“site:wikipedia.org”。


尽管 Google 可抓取数十亿网页的内容,但遗失部分网站也在所难免。所以如果你的网站未被录入,可能是以下原因导致的:


•网站未与网络上的其他网站严密关联



•您刚刚推出新的网站,Google 还没来得及抓取它



•网站的规划致使 Google 很难有用抓取其间的内容



•Google 在测验抓取网站时遇到问题



•您的政策阻挠 Google 抓取网站



怎么让我的网站显现在 Google 查找成果中?


让网站归入 Google 查找成果完全免费,且操作简略,乃至不需求向 Google 提交网站。Google 是一个全主动查找引擎,它运用网页抓取东西继续抓取网页,以便查找可增加到 Google 索引中的网站。实际上,显现在 Google 查找成果中的大多数网站都不是手动提交供归入索引的,而是 Google 在抓取网页时找到并主动增加的。了解 Google 怎么发现、抓取和出现网页。


我们供给了网站站长攻略,以协助网站站长构建方便 Google 处理的网站。尽管我们无法保证我们的抓取东西必定可以找到某个特定网站,但遵从这些攻略应该可以使您的网站显现在我们的查找成果中。


Google Search Console 供给了一系列东西,以协助您向 Google 提交内容,并监测您的网站/移动应用在 Google 查找成果中的曝光度。如果您情愿,当 Google 在抓取您网站的进程中发现任何严重问题时,Search Console 乃至可以向您发送提示。注册 Search Console5。


首要您需求问自己以下几个有关您的网站的根本问题。


•我的网站是否会显现在 Google 查找成果中?



•我是否为用户供给了高品质的网站内容?



•我的本地商家是否会显现在 Google 查找成果中?



•我的网站内容是否能让运用各种设备的用户轻松快速地找到?



•我的网站是否安全?



您可以在 http://g.co/webmasters6 上找到其他入门信息


协助 Google 发现您的内容


要让网站显现在 Google 查找成果中,首要过程就是保证 Google 可以找到它。最好的办法是提交站点地图。站点地图是网站上的一种文件,可奉告查找引擎网站上新增了网页或有更新的网页。具体了解怎么构建和提交站点地图。


Google 还会经过其他网页上的链接找到网页。


让 Google 知道不该抓取哪些页面


最佳做法


若为非灵敏信息,则可以运用 robots.txt 阻挠不必要的抓取


“robots.txt”文件会通知查找引擎它们是否可以拜访您网站的各个部分并履行抓取。此文件有必要命名为“robots.txt”,且应坐落网站的根目录下。被 robots.txt 阻挠的网页也可能会被抓取,因而您应运用更安全的办法维护灵敏网页。


lgfNdtsbT9HWGIkgTKORifnpI1Hi5NbFJPDRXSDPcxQmKm1Oj7LKdu0d9uN_FqtmQQc=w510.png


您可能不期望网站的某些页面被抓取,因为这些页面显现在查找引擎的查找成果中可能对用户无用。如果您期望阻挠查找引擎抓取您的网页,Google Search Console 可供给快捷的 robots.txt 生成器协助您创立此文件。请注意,如果您的网站运用了子域名,并且您期望 Google 不要抓取特定子域名上的某些网页,那么您有必要为该子域名独自创立一个 robots.txt 文件。


应防止的做法:


•不要让 Google 抓取内部查找成果页。用户不喜欢点击查找引擎成果后却登录到您网站上的其他查找成果页。


•答应抓取由署理服务器创立的网址。


若为灵敏信息,则请运用更安全的办法


要阻挠用户拜访灵敏或秘要信息,Robots.txt 并不是一个恰当或有用的办法。它只会奉告运转杰出的抓取东西不要抓取相应网页,却不会阻挠您的服务器将这些网页发送给恳求它们的浏览器。其间一个原因是:如果互联网上的某处(例如引荐来源网址日志)刚好存在指向这些被制止拜访的网址的链接,那么查找引擎依然可以引证这些网址(仅显现网址,但不显现标题或摘要)。此外,未赞同遵守《漫游器扫除标准》的不合规查找引擎或流氓查找引擎可能会违反您的 robots.txt 文件中的指令。最后,用户可能会出于猎奇查看您的 robots.txt 文件中的目录或子目录,并猜想您不想被看见的内容的网址。


在这些状况下,如果您只是期望网页不显现在 Google 中,则可运用 noindex 标记,无需忧虑任何用户会经过链接拜访该网页。但是,为了做到真实的安全,您应该运用合适的授权办法(例如需求用户暗码才干拜访)或将网页从网站上彻底移除。


本文链接:http://www.yizheng.org.cn/news/news407.html
上一条:20条App功用优化的主张    下一条:谷歌 SEO 入门攻略 2018 年版(二):页面内容优化