为什么被谷歌收录如此困难

为什么被谷歌收录如此困难 Jan 28, 2024 5:01:51 GMT

Quote

Post by account_disabled on Jan 28, 2024 5:01:51 GMT

每个网站都在某种程度上依赖于谷歌。很简单：您的网页会被 Google 编入索引，这样人们就可以找到您。事情就应该这样发展。然而，情况并非总是如此。许多页面从未被 Google 索引。如果您使用网站，尤其是大型网站，您可能已经注意到，并非网站上的每个页面都会被索引，并且许多页面要等待数周才能被 Google 收录。造成这个问题的因素有很多，其中许多因素与排名中提到的因素相同——内容质量和链接就是两个例子。有时，这些因素也非常复杂和技术性。严重依赖新网络技术的现代网站过去曾遭受索引问题的困扰，有些网站现在仍然如此。许多搜索引擎优化人员仍然认为，正是技术性问题阻碍了谷歌对内容进行索引，但这是一个神话。确实，如果您没有发送一致的技术信号来说明您希望将哪些网页编入索引，或者您的抓取预算不足，那么 Google 可能不会将您的网页编入索引，但保持内容质量的一致性也同样重要。大多数网站，无论大小，都有大量应该编入索引的内容，但实际上却没有。虽然 JavaScript 之类的东西确实使索引变得更加复杂，但即使您的网站是用纯 HTML 编写的，也可能会遇到严重的索引问题。

在这篇文章中，我们将讨论一些最常见的问题以及如何缓解目标电话号码或电话营销数据这些问题。 Google 未将您的网页编入索引的原因使用自定义索引检查器工具，我检查了美国最受欢迎的电子商务商店的大量样本是否存在索引问题。我发现平均有 15% 的可索引产品页面无法在 Google 上找到。这个结果是非常令人惊讶的。接下来我需要知道的是“为什么”：Google 决定不对技术上应该索引的内容建立索引的最常见原因是什么？ Google Search Console 会报告未索引页面的多种状态，例如“已抓取 - 当前未索引”或“已发现 - 当前未索引”。虽然此信息并不能明确帮助解决问题，但它是开始诊断的好地方。最重要的索引问题根据我收集的大量网站样本，Google Search Console 报告的最常见的索引问题是： 1.“已爬网 - 目前未编入索引” 在这种情况下，Google 访问了某个页面，但没有将其编入索引。根据我的经验，这通常是内容质量问题。鉴于当前电子商务的蓬勃发展，我们可以预期谷歌在质量方面会变得更加挑剔。因此，如果您发现您的页面“已爬网 - 目前未编入索引”，请确保这些页面上的内容具有独特的价值：在所有可索引页面上使用唯一的标题、描述和副本。避免从外部来源复制产品描述。使用规范标签来合并重复的内容。使用 robots.txt 文件或 noindex 标记阻止 Google 抓取您网站的低质量部分或将其编入索引。

如果您对该主题感兴趣，我建议您阅读 Chris Long 的Crawled — Current Not Indexed: A Coverage Status Guide。 2.“已发现 - 目前未编入索引” 这是我最喜欢处理的问题，因为它涵盖了从爬行问题到内容质量不足的所有问题。这是一个大问题，特别是在大型电子商务商店的情况下，我已经看到这适用于单个网站上的数千万个 URL。发现当前未编入索引的网站的 URL。 Google 可能会报告电子商务产品页面“已发现 - 目前未编入索引”，因为：抓取预算问题：抓取队列中可能存在太多 URL，这些 URL 可能会稍后被抓取并建立索引。质量问题：Google 可能认为该域上的某些页面不值得抓取，并通过在其 URL 中查找模式决定不访问它们。处理这个问题需要一些专业知识。如果您发现您的页面“已发现 - 目前未编入索引”，请执行以下操作：确定是否存在属于此类别的页面模式。也许问题与特定类别的产品有关，并且整个类别没有内部链接？或者可能很大一部分产品页面正在队列中等待索引？优化您的抓取预算。专注于发现 Google 花费大量时间抓取的低质量页面。通常的嫌疑人包括过滤的类别页面和内部搜索页面 - 这些页面在典型的电子商务网站上很容易达到数千万个。如果 Googlebot 可以自由地抓取它们，它可能没有资源来获取您网站上已在 Google 索引中的有价值的内容。