如果要防止被googleK掉网站,必须要看google的网站管理员指南,下面就是google的网站管理员指南详解。

Google的网站管理员指南包含三个部分,分别是:设计与内容指南;技术指南和质量指南。

循这些指南有助于 Google 查找您的网站并将其编入索引和进行排名。 即使您选择不采纳这些建议,我们也强烈建议您对“质量指南”多加留意,其中简要说明了一些可能造成网站从 Google 索引中彻底删除或受到其他处罚的违禁行为。 如果网站受到处罚,则可能不会再出现在 Google.cn 或任何 Google 合作伙伴网站的搜索结果中。

一、设计与内容指南:

1. 网站应具有清晰的层次结构和文本链接。 每个网页应至少可以通过一个静态文本链接打开。

2. 为用户提供网站地图,列出指向网站重要部分的链接。 如果网站地图上的链接超过或大约为 100 个,则需要将网站地图拆分为多个网页。

3. 网站应实用且信息丰富,网页文字应清晰、准确地表述要传达的内容。

4. 要考虑到用户会使用哪些字词来查找您的网页,确保网站上确实包含了这些文字。

5. 尽量使用文字而不是图片来显示重要的名称、内容或链接。 Google 抓取工具无法识别图片中所含的文字。

6. 确保 <标题> 元素和 ALT 属性具有描述性且准确无误。

7. 检查链接是否损坏,并确保 HTML 格式正确。

8. 如果要使用动态网页(即网址中包含”?” 字符),请注意并非每一个搜索引擎抓取工具都能抓取动态和静态网页。缩短参数长度和减少参数数目都会对这种情况有帮助。

9. 将特定网页上的链接限制在合理的数量内(少于 100 个)。

二、技术指南:

1. 使用诸如 Lynx 的文本浏览器来检查您的网站,因为大多数搜索引擎抓取工具查看您网站的方式与 Lynx 几乎一样。 如果诸如 Javascript、Cookie、会话 ID、框架、DHTML 或 Flash 等复杂功能造成您在文本浏览器中无法看到整个网站,则搜索引擎抓取工具在抓取您的网站时可能会遇到问题。

2. 允许搜索漫游器抓取您网站时不抓取会话 ID 和跟踪其访问网站路径的参数。 这些技术对跟踪单个用户的行为非常有用,但漫游器的访问模式却完全不同。 如果采用这些技术,可能会导致对网站的索引编入不完整, 因为漫游器可能无法排除那些看上去不同,但实际却指向同一个网页的网址。

3. 确保您的网络服务器支持 If-Modified-Since HTTP 标头。 通过该功能,您的网络服务器可以告诉 Google 自上次抓取您的网站以来,内容是否已发生变化。 该功能可以节省您的带宽和开销。

4. 利用网络服务器上的 robots.txt 文件。 该文件会告诉抓取工具哪些目录能够抓取,哪些不能。 确保该文件是网站的最新版本,以免意外拦截 Googlebot 抓取工具。 请访问 http://www.robotstxt.org/wc/faq.html,了解如何在漫游器访问您的网站时对其进行指示。 您可以使用 Google 网站管理员工具中的 robots.txt 分析工具来测试 robots.txt 文件,以确保正确使用此文件。

5. 如果您的公司购买了内容管理系统,请确保该系统能导出您的内容,以便搜索引擎抓取工具可以抓取您的网站。

6. 使用 robots.txt 可避免抓取搜索结果页或其他自动生成的页面,这些页面对来自搜索引擎的用户没有附加价值。

7. 对网站进行测试,以确保其在不同的浏览器中均能正确显示。

三、质量指南

这些质量指南涵盖了最常见的作弊形式或操纵行为,对于此处未列出的其他误导行为(例如,通过注册知名网站的错拼形式来欺骗用户),Google 仍可予以拒绝。 不要抱有侥幸心理,认为某种欺骗手段未在本页中列出,Google 就会认可该手段。 作为网站管理员,与其花费大量时间寻找漏洞加以利用,不如尽其所能维护基本原则,以便为用户带来更好的体验,从而使网站获得更高的排名。

如果您认为其他网站正在滥用 Google 质量指南,请通过 https://www.google.com/webmasters/tools/spamreport?hl=zh-CN 举报该网站。 Google 希望能开发出灵活的自动解决方案来解决上述问题,因而尽量避免一一处理违禁行为。 我们收到的滥用行为报告将用于创建灵活的规则系统,以便于识别并阻止以后的滥用企图。

1. 基本原则

(1)设计网页时该考虑的是用户,而不是搜索引擎。 不要欺骗用户,或提交给搜索引擎一种内容,而显示给用户另一种,这种做法通常称为”隐藏”。

(2)请不要为了提高搜索引擎排名而弄虚作假。 一个简单分辨是非的方法是:您是否可以坦然地跟竞争对手网站解释您对网站所做的事情。 另一个有用的测试手段即扪心自问:”这能否给我的用户带来帮助? 如果不存在搜索引擎,我是否还会这样做?”

(3)请不要参与旨在提高您的网站排名或 PageRank 的链接方案。 尤其要避免链接到违禁的网站或”恶邻”,因为您自身的排名会受到这些链接的负面影响。

(4)请不要使用未经授权的计算机程序来提交网页和检查排名等, 此类程序会耗用计算资源并违反我们的服务条款。 Google 不建议使用 WebPosition Gold? 这类产品向 Google 发送自动查询或用程序编写的查询。

2. 具体指南

(1)请不要使用隐藏文本或隐藏链接。

内容中的隐藏文字或链接可能导致您的网站被认为不可信赖,因为它向搜索引擎和访问者提供的信息不一样。 文字(如过量关键字)可能有多种隐藏方式。隐藏链接主要是让 Googlebot 可抓取但人眼无法识别。如果在网站中找到隐藏文字或链接,请将其删除;如果其与网站的访问者相关,则使之易于识别。

(2)请不要使用隐藏真实内容或欺骗性的重定向手段。

主要手段包含:隐藏真实内容、欺骗性 Javascript 重定向和门页等。Google 一直致力于为我们的用户提供最有价值且最具相关性的搜索结果。因此,我们坚决反对企图通过将搜索引擎和用户引导到他们并未选择的网址来操纵搜索引擎并欺骗用户的行为,我们也反对仅为从搜索引擎中获利而提供内容的行为。Google 可能会对门页网站以及其他有这类欺骗性行为的网站采取相应的措施,包括将这些网站从 Google 索引中删除。

(3)请不要向 Google 发送自动查询。

未经 Google 事先明确许可,Google 服务条款明文禁止向我们的系统发送任何类型的自动查询。发送自动查询会占用资源,并且,其中还会包括使用某些软件(例如 WebPosition Gold?)向 Google 发送自动查询以确定某个网站或网页在面向各种查询的 Google 搜索结果中的排名方式的情况。

(4)请不要加载使用无关关键字的网页。

关键字堆砌”是指在网页中加入大量关键字,尝试操纵网站在 Google 搜索结果中的排名。在网页中加入大量关键字会对用户体验产生负面影响,因而可能损害网站排名。请集中精力创建信息丰富的实用内容,在上下文中适当使用关键字。

(5)请不要创建包含大量重复内容的多个网页、子域或域。

重复内容通常是指域内或多个域之间存在的、与其他内容完全匹配或大致类似的内容。大多数情况下,重复内容本身不具有欺骗性。

如果您的网站包含多个具有大量重复内容的网页,您可以采用多种方法向 Google 指明您的首选网址。(这叫做”规范化”。)有关规范化的详细信息。

然而,在某些情况下,为操纵搜索引擎排名或获得更多的访问量,某些网站所有者会故意在多个域内安插重复内容。此类行为即属于欺骗性行为,这会导致非常糟糕的用户体验:用户在一组搜索结果中会看到大量相同的重复内容。

(6)请不要制作欺诈性或安装有病毒、特洛伊木马或其他有害软件的网页。

们希望我们的用户可以安全地搜索网页,此外,我们也一直在努力找出有危害的网页并不断加强对用户的保护。Google 根据自动算法和用户反馈来编制可能有危害的网站列表。我们的列表中主要包含两类有危害的网页:网上诱骗网页和包含恶意软件的网页。这些列表并不能让用户彻底免受网络中每个有危害的网站的攻击,而且,安全的网站也可能会被错误地标识为有危害的网站,但我们会定期更新这些列表以使其尽可能保持最新。

(7)请不要专门针对搜索引擎创建”桥页”,或使用其他如联属计划这类原创内容很少或几乎没有原创内容的俗套 (cookie cutter) 方法。

提高您网站在 Google 搜索结果中排名的其中一个最重要的步骤为:确保网站内容丰富,网站中包含相关的关键字,能够正确使用关键字,并且能够指明您网站内容的主题。

然而,有些网站管理员试图通过创建包含大量字词但缺乏或没有实质性内容的网页来提高其网页的排名并吸引访问者。对于那些试图仅通过显示已抄袭的内容或其他自动生成的网页来提高排名,而没有为用户提供有价值的内容的域名,Google 将对其采取相应措施。

(8)如果您的网站参与联属计划,请确保您的网站可为其增添价值。 请提供独特且相关的内容,使用户有理由首先访问您的网站。

只要您能为用户创建有价值的内容,从而使用户有理由访问您的网站,那么,联属网站本身是没有任何问题的。例如,您可以创建产品评论、评分和产品对比。

自由转载,转载请注明: 转载自WEB开发笔记 www.chhua.com

本文链接地址: 防止被google(谷歌)K掉网站的方法 http://www.chhua.com/web-note1784

相关笔记

更多