Googlebot 实际上是登陆页面

Collection of structured data for analysis and processing.
Post Reply
fomayof928@mowline
Posts: 174
Joined: Mon Dec 23, 2024 3:37 am

Googlebot 实际上是登陆页面

Post by fomayof928@mowline »

尝试尽可能好地运行 JavaScript,然后需要在有机会看到任何内容之前离开。

我们需要解决的问题是在他们的服务器上加载 Sitecore 登陆页面。换句话说,我们希望卸下 Googlebot 的繁重工作,并将其放在 Sitecore 的服务器上。这将确保当 Googlebot 访问该页面时,它不必执行任 阿尔巴尼亚 WhatsApp 数据 何繁重的工作,而是可以抓取呈现的 HTML。

在这种情况下,Googlebot 会登陆页面并查看 HTML(以及所有内容)。

还有更具体的选项(例如同构设置)
这是它有点麻烦的地方,但混合解决方案是存在的。目前最好的一种称为同构。

在此模型中,我们要求客户端将第一个请求加载到我们的服务器,然后客户端将发出任何未来的请求。

因此,Googlebot 来到该页面,客户端的服务器已经执行了该页面所需的初始 JavaScript,将渲染的 HTML 发送到浏览器,之后在客户端发生的任何工作。

如果您想推荐此解决方案,请阅读 AirBNB 团队的这篇文章,其中详细介绍了同构设置。

AJAX 抓取 = 不行
我不会详细介绍这一点,但只知道 Google 之前针对 JavaScript 的 AJAX 抓取解决方案已停止使用,并且最终将停止工作。我们不应该推荐这种方法。

(但是,我有兴趣听取最近实施此解决方案的人的案例研究。Google 对此有何回应?此外,这里有我的同事 Rob 写的一篇很棒的文章。)

概括
冒着过于简单化的风险,以下是 2018 年开始使用 JavaScript 和 SEO 需要做的事情:

了解您的客户域何时/何地使用客户端 JavaScript 加载页面上的内容或链接。
询问开发商。
关闭 JavaScript 并通过页面模板进行一些手动测试。
使用 JavaScript 爬虫进行爬网。
检查 GoogleBot 是否按照我们希望的方式查看内容。
谷歌的移动友好性检查器。
站点地图:查找页面上可见的内容。
使用 JavaScript 爬虫进行爬网。
给客户一个典型的推荐。
服务器端渲染。
混合解决方案(同构)。
不是 AJAX 爬虫。
Post Reply