Google 是否会抓取包含正文内容的 JavaScript

1. Google 抓取 JavaScript 网站的方式

在谈及 Google 是否会抓取包含正文内容的 JavaScript 之前,先来了解一下 Google 抓取 JavaScript 网站的方式。

1.1 Google 可以抓取 JavaScript 网站

Google 的爬虫可以抓取 JavaScript 网站,但是并不代表所有的 JavaScript 网站都能被 Google 抓取。之所以有些 JavaScript 网站不能被 Google 抓取,是因为 Google 的爬虫会在抓取 JavaScript 网站时遇到很多的阻碍,比如一些 JavaScript 网站会动态生成内容、使用 Ajax 加载内容等等。

1.2 Google 可以处理 JavaScript 网站的链接

虽然在处理 JavaScript 网站时受到很多阻碍,但是 Google 的爬虫还是可以处理 JavaScript 网站的链接。如果 JavaScript 网站有一些传统的页面链接,比如主页、分类页面、商品页面等等,这些链接都可以被 Google 抓取。

1.3 Google 鼓励使用 JavaScript 网站

谈到 JavaScript 网站,自然就会想到 SPA(Single-page application 单页应用)这样的网站。Google 对于 SPA 的支持虽然不是很完美,但是在其官方文档中仍然鼓励使用 JavaScript 网站。特别是对于那些不希望将每个页面都发送给 Google 的网站,SPA 是一种非常好的选择。

2. Google 是否会抓取包含正文内容的 JavaScript

终于回到了我们今天的正题,Google 是否会抓取包含正文内容的 JavaScript?答案是肯定的,谷歌可以抓取包含正文内容的 JavaScript,这点可以通过 Google 的 John Mueller 在官方论坛中的回答得到印证:

We do index JavaScript content, both with and without 

"pretty" URLs (which usually won't have HTML5 push-state).

但是需要注意的是,仅仅是抓取包含正文内容的 JavaScript 是不够的。Google 还需要深入 JS 代码检测是否有隐藏在其中的垃圾代码,因此,Google 可能会重新排列代码,或删除一些不能被正确解释的代码。得到的 JavaScript 代码,最终才能被 Google 算法正确识别。

3. 如何优化 JavaScript 网站 SEO

虽然 Google 可以抓取包含正文内容的 JavaScript 网站,但是如何优化 JavaScript 网站 SEO 呢?以下几点可以参考。

3.1 URL 的友好化

URL 是网站最基本的元素,好的 URL 可以让用户很好地理解网站,并且是搜索引擎抓取的基础。JavaScript 网站一般使用的是 hash 路由,比较友好的应该是使用 HTML5 的 history 模式。

3.2 Meta 标签的设置

虽然 JavaScript 网站不像传统网站那样拥有明显的 head,但是我们可以在 JavaScript 中通过 document.head 操作该标签,进行 Meta 标签等相关设置。比如:

document.title = "这是标题";

var metaElem = document.createElement("meta");

metaElem.setAttribute("name", "keywords");

metaElem.setAttribute("content", "这是关键词");

document.head.appendChild(metaElem);

3.3 提高页面加载速度

JavaScript 网站一般都是单页应用,需要一次性加载所有的资源,这对页面的加载速度有很大的影响。为了提高页面加载速度,可以采用以下技术:

使用 webpack 进行代码打包压缩,减小代码体积,增加运行效率。

使用懒加载技术,将部分资源(如图片、广告等)延迟加载。

使用缓存技术,减少不必要的资源请求。

3.4 HTML 骨架屏技术

骨架屏技术是一种前端优化技术,主要是通过 HTML 和 CSS 来实现。利用骨架屏技术,在页面加载过程中先显示一个简单的骨架,等待数据加载完毕后再显示完整的页面内容。通过这种方式,可以优化 JavaScript 网站的用户体验。

4. 总结

JavaScript 网站的优化与传统网站有很大的不同。正确的优化可以使 JavaScript 网站在搜索引擎中获得更好的排名,并且更好地满足用户需求。Google 可以抓取包含正文内容的 JavaScript 网站,但是需要注意的是,JavaScript 中有一些代码可能会被 Google 删除、重排,最终被算法正确识别。

免责声明:本文来自互联网,本站所有信息(包括但不限于文字、视频、音频、数据及图表),不保证该信息的准确性、真实性、完整性、有效性、及时性、原创性等,版权归属于原作者,如无意侵犯媒体或个人知识产权,请来电或致函告之,本站将在第一时间处理。猿码集站发布此文目的在于促进信息交流,此文观点与本站立场无关,不承担任何责任。