Googlebot 实际上是登陆页面

fomayof928@mowline · Post by **fomayof928@mowline** » Sun Feb 16, 2025 7:16 am

尝试尽可能好地运行 JavaScript，然后需要在有机会看到任何内容之前离开。

我们需要解决的问题是在他们的服务器上加载 Sitecore 登陆页面。换句话说，我们希望卸下 Googlebot 的繁重工作，并将其放在 Sitecore 的服务器上。这将确保当 Googlebot 访问该页面时，它不必执行任阿尔巴尼亚 WhatsApp 数据何繁重的工作，而是可以抓取呈现的 HTML。

在这种情况下，Googlebot 会登陆页面并查看 HTML（以及所有内容）。

还有更具体的选项（例如同构设置）
这是它有点麻烦的地方，但混合解决方案是存在的。目前最好的一种称为同构。

在此模型中，我们要求客户端将第一个请求加载到我们的服务器，然后客户端将发出任何未来的请求。

因此，Googlebot 来到该页面，客户端的服务器已经执行了该页面所需的初始 JavaScript，将渲染的 HTML 发送到浏览器，之后在客户端发生的任何工作。

如果您想推荐此解决方案，请阅读 AirBNB 团队的这篇文章，其中详细介绍了同构设置。

AJAX 抓取 = 不行
我不会详细介绍这一点，但只知道 Google 之前针对 JavaScript 的 AJAX 抓取解决方案已停止使用，并且最终将停止工作。我们不应该推荐这种方法。

（但是，我有兴趣听取最近实施此解决方案的人的案例研究。Google 对此有何回应？此外，这里有我的同事 Rob 写的一篇很棒的文章。）

概括
冒着过于简单化的风险，以下是 2018 年开始使用 JavaScript 和 SEO 需要做的事情：

了解您的客户域何时/何地使用客户端 JavaScript 加载页面上的内容或链接。
询问开发商。
关闭 JavaScript 并通过页面模板进行一些手动测试。
使用 JavaScript 爬虫进行爬网。
检查 GoogleBot 是否按照我们希望的方式查看内容。
谷歌的移动友好性检查器。
站点地图：查找页面上可见的内容。
使用 JavaScript 爬虫进行爬网。
给客户一个典型的推荐。
服务器端渲染。
混合解决方案（同构）。
不是 AJAX 爬虫。