图片 24

浏览器如何渲染页面

戏说HTML5

2015/12/23 · HTML5 ·
HTML5

原文出处:
木的树的博客   

如果有非技术人员问你,HTML5是什么,你会怎么回答?

 

新的HTML规范。。。

给浏览器提供了牛逼能力,干以前不能干的事。。。(确切地说应该是给浏览器规定了许多新的接口标准,要求浏览器实现牛逼的功能。。。
这里感谢红枫一叶)

给浏览器暴露了许多新的接口。。。

加了很多新的效果。。。

问的人其实并不明白他想问的真正问题,回答的人貌似明白,但又好像少了点什么。牛逼的能力、新的接口、炫酷的效果,首先回答的人自己就是晕晕乎乎。什么是HTML、什么是CSS、什么是DOM、什么是JavaScript,大部分的前端开发每天都在用这些,但很少会有人去思考一下他们之间的关系。

首先,HTML的全称是超文本标记语言,是一种标记形式的计算机语言。将这种标记语言给专门的解析器,就能够解析出一定的界面效果。浏览器就是专门解析这种标记语言的解析器。我们说他最终的效果是在屏幕上展示出特定的界面,那么浏览器肯定要把一个个的标记转换成内部的一种数据结构,这种数据结构便是DOM元素。比如,一个<a>标签在浏览器内部的世界中就是一个HTMLAnchorElement类型的一个实例。

一个HTML文件就好比用超文本标记语言写的一篇文章,文章通常是有结构的,在浏览器眼里它就是DOM。DOM描述了一系列层次化的节点树。(但这时候的DOM还是存在于浏览器内部是C++语言编写的)

 

随着历史的发展,当人们不在满足简单的显示文本,对于某些文本需要特殊强调或者给添加特殊格式的需求,慢慢的冒了出来。面对人们需要控制显示效果的需求,最先想到的也最简单的方式就是加标记。加一些样式控制的标记。这时候就出现了像<font>、<center>这种样式控制的标记。但是这样一来,所有的标记就会分为两大类:一种是说我是什么,一种是说我怎么显示。这还不是大问题,标记简单,但是浏览器要解析标记可就不那么简单了。想一想,这样干的话DOM也就要分成两大类,一类属于描述元素的DOM节点,一类属于描述显示效果的DOM节点。一个DOM节点可能代表一个元素,也可能是代表一种显示效果。怎么看都觉得别扭呀。

最后人们决定废弃样式标签,给元素标签添加一个style特性,style特性控制元素的样式(最初的样式声明语法肯定很简单)。原来的样式标签的特性,现在变成了样式特性的语法,样式标记变成了样式特性。这样逻辑上就清晰多了。那么问题来了:

  • 一篇文章如果修辞过多,必然会引起读者的反感。如果把元素和显示效果都放在一个文件中,必然不利于阅读。
  • 如果有10个元素都需要一个效果,是不是要把一个style重复写十遍呢
  • 父元素的设置效果对子元素有没有影响,让不让拼爹
  • 。。。。。。。。。

类似的问题肯定有很多,所以出来了CSS,层叠样式表,带来了css规则、css选择器、css声明、css属性等,这样以来就解决了以上痛点。标记语言这层解决了,但是浏览器就不能干坐着玩耍了,必然得提供支持。所以浏览器来解析一个静态html文件时,遍历整个html文档生成DOM树,当所有样式资源加载完毕后,浏览器开始构建呈现树。呈现树就是根据一系列css声明,经历了层叠之后,来确定一个个个DOM元素应该怎么绘制。这时候其实页面上还没有显示任何界面,渲染树也是浏览器内存里面的一种数据结构。渲染树完成之后,开始进行布局,这就好比已经知道一个矩形的宽高,现在要在画布量一量该画在哪,具体占多大地方。这个过程完了之后就是绘制的过程,然后我们便有了我们看到的显示界面了。

给标记加点效果的问题解决了,历史的车轮又开始前进了。慢慢的人们不再满足简单的显示效果,人们希望来点交互。那个时候写HTML的大部分并不懂软件开发,开玩笑嘛,我一写活动页的你让我用C++?C++干这事的确是高射炮打蚊子——大材小用。那正规军不屑干的事就交给游击队吧,这时候网景公司开发出了JavaScript语言,那时候的JavaScript根本没有现在这么火,一土鳖脚本语言,哪像现在这么牛逼哄哄统一宇宙。

JavaScript本是运行在浏览器的语言,HTML文本是静态的,不可能让JavaScript修改静态文件,但可以跟浏览器内部打交道。可是这个时候的DOM并不是今天的DOM,他们是C++对象,要么把JavaScript转换成C++指令操作这些C++对象,要么把这些C++对象包装成JavaScript原生对象。历史选择了后者,这时候也就标志着现代DOM的正式诞生。不过历史有时候会出现倒退,历史上总会出现几个奇葩,比如IE,IE奇葩他全家,包括Edge!

马克思是个江湖骗子,但恩格斯是个好同志。自然辩证法与历史唯物主义是好东西。从历史的角度我们可以看到。CSS、DOM、JavaScript的出现于发展最终的源头都在HTML,超文本标记语言。人们对web的需求最终都汇集在HTML上。所以只要历史产生新的需求,最终的变化都首先发生在HTML规范上。

当交互性不能在满足人们需求时,web迎来了新的需求:webapp。要迎合新的需求,首先要改变的就是HTML规范,这个时候已有的HTML4.0,已经无法满足人们日益增长的需求,所以HTML5迎着历史的需求,经过八年的艰苦努力,终于在2014年正式定稿!HTML5肯定是要加入新标签,然对于传统HTML而言,HTML5算是一个叛逆。所有之前的版本对于JavaScript接口的描述都不过三言两语,主要篇幅都用于定义标记,与JavaScript相关内容一概交由DOM规范去定义。而HTML5规范,则围绕着如何使用新增标记定义了大量JavaScript
API(所以其中有一些API是与DOM重叠,定义了浏览器应该支持的DOM扩展,由此可以看到HTML5也必定不是HTML的最终版)。

 

后记——
本文只是一个旁观者以线性的方式来翻阅HTML的发展史,但历史更像是晴空上突然的晴天霹雳,一声过后,有人哀嚎遍野,有人高歌入云。以此纪念曾红极一时的Silverlight、Flex,以此纪念广大一线开发者活到老学到老的不懈精神、曾经耗费的精力、曾经逝去的青春。

1 赞 1 收藏
评论

图片 1

转载自web fundamental

构建对象模型

浏览器渲染页面前需要先构建 DOM 和 CSSOM 树。因此,我们需要确保尽快将
HTML 和 CSS 都提供给浏览器。

  • 字节 → 字符 → 标记 → 节点 → 对象模型。
  • HTML 标记转换成文档对象模型 (DOM);CSS 标记转换成 CSS 对象模型
    (CSSOM)。DOM 和 CSSOM 是独立的数据结构。
  • Chrome DevTools Timeline可以捕获和检查 DOM 和 CSSOM
    的构建和处理开销。

文档对象模型 (DOM)

<html>
  <head>
    <meta name="viewport" content="width=device-width,initial-scale=1">
    <link href="style.css" rel="stylesheet">
    <title>Critical Path</title>
  </head>
  <body>
    <p>Hello web performance students!</p>
    <div><img src="awesome-photo.jpg"></div>
  </body>
</html>

一个包含一些文本和一幅图片的普通 HTML 页面,浏览器如何处理此页面?

HTML解析器输出的树是由DOM元素和属性节点组成的,它是HTML文档的对象化描述,也是HTML元素与外界(如Javascript)的接口。DOM与标签有着几乎一一对应的关系。

 图片 2 

  1. 转换: 浏览器从磁盘或网络读取 HTML
    的原始字节,并根据文件的指定编码(如 UTF-8)将它们转换成各个字符。
  2. Tokenizing: 浏览器将字符串转换成 W3C HTML5
    标准规定的各种tokens,例如,“<html>”、“<body>”,以及其他尖括号内的字符串。每个token都具有特殊含义和一组规则。
  3. 词法分析: 发出的标记转换成定义其属性和规则的“对象”。
  4. DOM 构建: 最后,由于 HTML
    标记定义不同标记之间的关系(一些标记包含在其他标记内),创建的对象链接在一个树数据结构内,此结构也会捕获原始标记中定义的父项-子项关系:HTML 对象是 body 对象的父项,bodyparagraph对象的父项,依此类推。

整个流程最终输出是页面的文档对象模型
(DOM),浏览器对页面进行的所有进一步处理都会用到它。

浏览器每次处理 HTML
标记时,都会完成以上所有步骤:将字节转换成字符,确定tokens,将tokens转换成节点,然后构建
DOM 树。这整个流程可能需要一些时间才能完成,有大量 HTML
需要处理时更是如此。

 图片 3

如果您打开 Chrome DevTools
并在页面加载时记录时间线,就可以看到执行该步骤实际花费的时间。在上例中,将一堆
HTML 字节转换成 DOM 树大约需要 5
毫秒。对于较大的页面,这一过程需要的时间可能会显著增加。创建流畅动画时,如果浏览器需要处理大量
HTML,这很容易成为瓶颈。

DOM
树捕获文档标记的属性和关系,但并未告诉我们元素在渲染后呈现的外观。那是
CSSOM 的责任。

CSS 对象模型 (CSSOM)

在浏览器构建这个简单页面的 DOM 过程中,在文档的 head 中遇到了一个 link
标记,该标记引用一个外部 CSS
样式表:style.css。由于预见到需要利用该资源来渲染页面,它会立即发出对该资源的请求,并返回以下内容:

body { font-size: 16px }
p { font-weight: bold }
span { color: red }
p span { display: none }
img { float: right }

我们本可以直接在 HTML 标记内声明样式(内联),但让 CSS 独立于 HTML
有利于我们将内容和设计作为独立关注点进行处理:设计人员负责处理
CSS,开发者侧重于 HTML,等等。

与处理 HTML 时一样,我们需要将收到的 CSS
规则转换成某种浏览器能够理解和处理的东西。因此,我们会重复 HTML
过程,不过是为 CSS 而不是 HTML:

 图片 4

CSS 字节转换成字符,接着转换成tokens和节点,最后链接到一个称为“CSS
对象模型”(CSSOM) 的树结构:

 图片 5

CSSOM
为何具有树结构?为页面上的任何节点对象计算最后一组样式时,浏览器都会先从适用于该节点的最通用规则开始(例如,如果该节点是
body 元素的子元素,则应用所有 body
样式),然后通过应用更具体的规则以递归方式优化计算的样式。

以上面的 CSSOM 树为例进行更具体的阐述。任何置于 body
元素内span 标记中的文本都将具有 16 像素字号,并且颜色为红色
。font-size 指令从 body 向下级层叠至 span。不过,如果某个 span
标记是某个段落 (p) 标记的子项,则其内容将不会显示。

Also, note that the above tree is not the complete CSSOM tree and only
shows the styles we decided to override in our
stylesheet.每个浏览器都提供一组默认样式(也称为“User Agent
样式”),即我们的样式只是override这些默认样式。

要了解 CSS 处理所需的时间,可以在 DevTools
中记录时间线并寻找“Recalculate Style”事件:unlike DOM parsing, the
timeline doesn’t show a separate “Parse CSS” entry, and instead captures
parsing and CSSOM tree construction, plus the recursive calculation of
computed styles under this one event.

 图片 6

我们的小样式表需要大约 0.6 毫秒的处理时间,影响页面上的 8 个元素 —
虽然不多,但同样会产生开销。不过,这 8 个元素从何而来呢?将 DOM 与 CSSOM
关联在一起的是渲染树。

渲染树构建、布局及绘制

CSSOM 树和 DOM
树合并成渲染树,然后用于计算每个可见元素的布局,并输出给绘制流程,将像素渲染到屏幕上。优化上述每一个步骤对实现最佳渲染性能至关重要。

浏览器根据 HTML 和 CSS 输入构建了 DOM 树和 CSSOM 树。
不过,它们是彼此完全独立的对象,分别capture文档不同方面的信息:一个描述内容,另一个则是描述需要对文档应用的样式规则。我们该如何将两者合并,让浏览器在屏幕上渲染像素呢?

  • DOM 树与 CSSOM
    树合并后形成渲染树,它只包含渲染网页所需的节点。遍历每个DOM树中的node节点,在CSSOM规则树中寻找当前节点的样式,生成渲染树。
  • 布局计算每个对象的精确位置和大小。
  • 最后一步是绘制,使用最终渲染树将像素渲染到屏幕上。

 图片 7

第一步是让浏览器将 DOM 和 CSSOM
合并成一个“渲染树”,网罗网页上所有可见的 DOM
内容,以及每个节点的所有 CSSOM 样式信息。

 图片 8

为构建渲染树,浏览器大体上完成了下列工作:

  1. 从 DOM 树的根节点开始遍历每个可见节点。
    • 某些节点不可见(例如脚本标记、元标记等),因为它们不会体现在渲染输出中,所以会被忽略。
    • 某些节点通过 CSS 隐藏,因此在渲染树中也会被忽略。例如 span
      节点上设置了“display: none”属性,所以也不会出现在渲染树中。
  2. 遍历每个可见节点,为其找到适配的 CSSOM
    规则并应用它们。从选择器的右边往左边开始匹配,也就是从CSSOM树的子节点开始往父节点匹配。
  3. Emit visible nodes with content and their computed styles.

注: visibility: hidden 与 display:
none 是不一样的。前者隐藏元素,但元素仍占据着布局空间(即将其渲染成一个空框),而后者
(display: none)
将元素从渲染树中完全移除,元素既不可见,也不是布局的组成部分。

最终输出的渲染同时包含了屏幕上的所有可见内容及其样式信息。有了渲染树,我们就可以进入“布局”阶段。

到目前为止,我们计算了哪些节点应该是可见的以及它们的计算样式,但我们尚未计算它们在设备视口内的确切位置和大小—这就是“布局”阶段,也称为“reflow”。

为弄清每个对象在网页上的确切大小和位置,浏览器从渲染树的根节点开始进行遍历。让我们考虑一个简单的实例:

<html>
  <head>
    <meta name="viewport" content="width=device-width,initial-scale=1">
    <title>Critial Path: Hello world!</title>
  </head>
  <body>
    <div style="width: 50%">
      <div style="width: 50%">Hello world!</div>
    </div>
  </body>
</html>

以上网页的正文包含两个嵌套 div:第一个(父)div
将节点的显示尺寸设置为视口宽度的 50%,父 div 包含的第二个
div宽度为其父项的 50%,即视口宽度的 25%。

 图片 9

 

布局流程的输出是一个“盒模型”,它会精确地捕获每个元素在视口内的确切位置和尺寸:所有相对测量值都转换为屏幕上的绝对像素。

最后,既然我们知道了哪些节点可见、它们的computed
styles以及几何信息,我们终于可以将这些信息传递给最后一个阶段:将渲染树中的每个节点转换成屏幕上的实际像素。这一步通常称为”painting”
or “rasterizing.”。

Chrome DevTools
可以帮助我们对上述所有三个阶段的耗时进行深入的了解。让我们看一下最初“hello
world”示例的布局阶段:

 图片 10

The “Layout” event captures the render tree construction, position, and
size calculation in the Timeline.

When layout is complete, the browser issues “Paint Setup” and “Paint”
events, which convert the render tree to pixels on the screen.

执行渲染树构建、布局和绘制所需的时间将取决于文档大小、应用的样式,以及运行文档的设备:文档越大,浏览器需要完成的工作就越多;样式越复杂,绘制需要的时间就越长(例如,单色的绘制开销“较小”,而阴影的计算和渲染开销则要“大得多”)。

下面简要概述了浏览器完成的步骤:

  1. 处理 HTML 标记并构建 DOM 树。
  2. 处理 CSS 标记并构建 CSSOM 树。
  3. 将 DOM 与 CSSOM 合并成一个渲染树。
  4. 根据渲染树来布局,以计算每个节点的几何信息。
  5. 将各个节点绘制到屏幕上。

如果 DOM 或 CSSOM
被修改,需要再执行一遍以上所有步骤,以确定哪些像素需要在屏幕上进行重新渲染。

Optimizing the critical rendering path is the process of minimizing
the total amount of time spent performing steps 1 through 5 in the above
sequence.
Doing so renders content to the screen as quickly as
possible and also reduces the amount of time between screen updates
after the initial render; that is, achieve higher refresh rates for
interactive content.

阻塞渲染的 CSS

默认情况下,CSS
被视为阻塞渲染的资源(但不阻塞html的解析),这意味着浏览器将不会渲染任何已处理的内容,直至
CSSOM
构建完毕请务必精简CSS,尽快提供它,并利用媒体类型和查询来解除对渲染的阻塞,以缩短首屏的时间。

在渲染树构建中,要求同时具有
DOM 和 CSSOM 才能构建渲染树。这会给性能造成严重影响:HTML
CSS 都是阻塞渲染的资源。 HTML 显然是必需的,因为如果没有
DOM,就没有可渲染的内容,但 CSS 的必要性可能就不太明显。如果在 CSS
不阻塞渲染的情况下尝试渲染一个普通网页会怎样?

  • 默认情况下,CSS 被视为阻塞渲染的资源。
  • 我们可以通过媒体类型和媒体查询将一些 CSS 资源标记为不阻塞渲染。
  • 浏览器会下载所有 CSS 资源,无论阻塞还是不阻塞。

没有 CSS 的网页实际上无法使用。所以浏览器将阻塞渲染,直至 DOM 和 CSSOM
全都准备就绪。

CSS
是阻塞渲染的资源。需要将它尽早、尽快地下载到客户端,以便缩短首次渲染的时间。

如果有一些 CSS
样式只在特定条件下(例如显示网页或将网页投影到大型显示器上时)使用,又该如何?如果这些资源不阻塞渲染,该有多好。

可以通过 CSS“媒体类型”和“媒体查询”来解决这类情况:

<link href=”style.css” rel=”stylesheet”>
<link href=”print.css” rel=”stylesheet” media=”print”>
<link href=”other.css” rel=”stylesheet” media=”(min-width: 40em)”>

媒体查询由媒体类型以及零个或多个检查特定媒体特征状况的表达式组成。例如,第一个样式表声明未提供任何媒体类型或查询,因此它适用于所有情况。也就是说它始终会阻塞渲染。第二个样式表则不然,它只在打印内容时适用—或许您想重新安排布局、更改字体等等,因此在网页首次加载时,该样式表不需要阻塞渲染。最后一个样式表声明提供了由浏览器执行的“媒体查询”:符合条件时,样式表会生效,浏览器将阻塞渲染,直至样式表下载并处理完毕。

通过使用媒体查询,我们可以根据特定用例(比如显示或打印),也可以根据动态情况(比如屏幕方向变化、尺寸调整事件等)定制外观。声明样式表时,请密切注意媒体类型和查询,因为它们将严重影响关键渲染路径的性能。

让我们考虑下面这些实例:

<link href=”style.css”    rel=”stylesheet”>
<link href=”style.css”    rel=”stylesheet” media=”all”>
<link href=”portrait.css” rel=”stylesheet”
media=”orientation:portrait”>
<link href=”print.css”    rel=”stylesheet” media=”print”>

  • 第一个声明阻塞渲染,适用于所有情况。
  • 第二个声明同样阻塞渲染:“all”是默认类型,和第一个声明实际上是等效的。
  • 第三个声明具有动态媒体查询,将在网页加载时计算。根据网页加载时设备的方向,portrait.css
    可能阻塞渲染,也可能不阻塞渲染。
  • 最后一个声明只在打印网页时应用,因此网页在浏览器中加载时,不会阻塞渲染。

最后,“阻塞渲染”仅是指浏览器是否需要暂停网页的首次渲染,直至该资源准备就绪。无论媒寻是否命中,浏览器都会下载上述所有的CSS样式表,只不过不阻塞渲染的资源对当前媒体不生效罢了。

使用 JavaScript 添加交互

JavaScript
允许我们修改网页的方方面面:内容、样式以及它如何响应用户交互。不过,JavaScript
也会阻止 DOM 构建和延缓网页渲染。为了实现最佳性能,可以让 JavaScript
异步执行,并去除关键渲染路径中任何不必要的 JavaScript。

  • JavaScript 可以查询和修改 DOM 与 CSSOM。
  • JavaScript的 执行会阻止 CSSOM的构建,所以和CSSOM的构建是互斥的。
  • JavaScript blocks DOM construction unless explicitly declared as
    async.

JavaScript
是一种运行在浏览器中的动态语言,它允许对网页行为的几乎每一个方面进行修改:可以通过在
DOM 树中添加和移除元素来修改内容;可以修改每个元素的 CSSOM
属性;可以处理用户输入等等。为进行说明,让我们用一个简单的内联脚本对之前的“Hello
World”示例进行扩展:

<html>
  <head>
    <meta name="viewport" content="width=device-width,initial-scale=1">
    <link href="style.css" rel="stylesheet">
    <title>Critical Path: Script</title>
    <style> body { font-size: 16px };p { font-weight: bold };
    span { color: red };p span { display: none };
    img { float: right }</style>
  </head>
  <body>
    <p>Hello web performance students!</p>
    <div><img src="awesome-photo.jpg"></div>
    <script>
      var span = document.getElementsByTagName('span')[0];
      span.textContent = 'interactive'; // change DOM text content
      span.style.display = 'inline';  // change CSSOM property
      // create a new element, style it, and append it to the DOM
      var loadTime = document.createElement('div');
      loadTime.textContent = 'You loaded this page on: ' + new Date();
      loadTime.style.color = 'blue';
      document.body.appendChild(loadTime);
    </script>
  </body>
</html>
  • JavaScript 允许我们进入 DOM 并获取对隐藏的 span 节点的引用 —
    该节点可能未出现在渲染树中,却仍然存在于 DOM
    内。然后,在获得引用后,就可以更改其文本,并将 display
    样式属性从“none”替换为“inline”。现在,页面显示“Hello interactive
    students!”。
  • JavaScript 还允许我们在 DOM
    中创建、样式化、追加和移除新元素。从技术上讲,整个页面可以是一个大的
    JavaScript
    文件,此文件逐一创建元素并对其进行样式化。但是在实践中,使用 HTML 和
    CSS 要简单得多。

尽管 JavaScript
为我们带来了许多功能,不过也在页面渲染方式和时间方面施加了更多限制。

首先,请注意上例中的内联脚本靠近网页底部。为什么呢?如果我们将脚本移至 span元素前面,就会脚本运行失败,并提示在文档中找不到对任何span 元素的引用

即 getElementsByTagName(‘span’) 会返回 null。这透露出一个重要事实:脚本在文档的何处插入,就在何处执行。当
HTML 解析器遇到一个 script 标记时,它会暂停构建
DOM,将控制权移交给 JavaScript 引擎;等 JavaScript
引擎运行完毕,浏览器会从中断的地方恢复 DOM 构建。

换言之,我们的脚本块在运行时找不到网页中任何靠后的元素,因为它们尚未被处理!或者说:执行内联脚本会阻止
DOM 构建,也就延缓了首次渲染。

在网页中引入脚本的另一个微妙事实是,它们不仅可以读取和修改 DOM
属性,还可以读取和修改 CSSOM 属性。实际上,示例中就是这么做的:将 span
元素的 display 属性从 none 更改为
inline。最终结果如何?我们现在遇到了race condition(资源竞争)。

如果浏览器尚未完成 CSSOM
的下载和构建,而却想在此时运行脚本,会怎样?答案很简单,对性能不利:浏览器将延迟脚本执行和
DOM 构建,直至其完成 CSSOM 的下载和构建。

简言之,JavaScript 在 DOM、CSSOM 和 JavaScript
执行之间引入了大量新的依赖关系,从而可能导致浏览器在处理以及在屏幕上渲染网页时出现大幅延迟:

  • 脚本在文档中的位置很重要。
  • 当浏览器遇到一个 script 标记时,DOM 构建将暂停,直至脚本完成执行。
  • JavaScript 可以查询和修改 DOM 与 CSSOM。
  • JavaScript 执行将暂停,直至 CSSOM 就绪。即CSSDOM构建的优先级更高。

“优化关键渲染路径”在很大程度上是指了解和优化 HTML、CSS 和 JavaScript
之间的依赖关系谱。

解析器阻塞与异步 JavaScript

默认情况下,JavaScript
执行会“阻塞解析器”:当浏览器遇到文档中的脚本时,它必须暂停 DOM
构建,将控制权移交给 JavaScript 运行时,让脚本执行完毕,然后再继续构建
DOM。实际上,内联脚本始终会阻止解析器,除非编写额外代码来推迟它们的执行。

通过 script 标签引入的脚本又怎样:

<html>
  <head>
    <meta name="viewport" content="width=device-width,initial-scale=1">
    <link href="style.css" rel="stylesheet">
    <title>Critical Path: Script External</title>
  </head>
  <body>
    <p>Hello web performance students!</p>
    <div><img src="awesome-photo.jpg"></div>
    <script src="app.js"></script>
  </body>
</html>

app.js

var span = document.getElementsByTagName('span')[0];
span.textContent = 'interactive'; // change DOM text content
span.style.display = 'inline';  // change CSSOM property
// create a new element, style it, and append it to the DOM
var loadTime = document.createElement('div');
loadTime.textContent = 'You loaded this page on: ' + new Date();
loadTime.style.color = 'blue';
document.body.appendChild(loadTime);

无论我们使用 <script> 标记还是内联 JavaScript
代码段,两者能够以相同方式工作。
在两种情况下,浏览器都会先暂停并执行脚本,然后才会处理剩余文档。如果是外部
JavaScript
文件,浏览器必须停下来,等待从磁盘、缓存或远程服务器获取脚本,这就可能给关键渲染路径增加更长的延迟。

默认情况下,所有 JavaScript
都会阻止解析器。由于浏览器不了解脚本计划在页面上执行什么操作,它会作最坏的假设并阻止解析器。向浏览器传递脚本不需要在引用位置执行的信号既可以让浏览器继续构建
DOM,也能够让脚本在就绪后执行。为此,我们可以将脚本标记为异步:

<html>
  <head>
    <meta name="viewport" content="width=device-width,initial-scale=1">
    <link href="style.css" rel="stylesheet">
    <title>Critical Path: Script Async</title>
  </head>
  <body>
    <p>Hello web performance students!</p>
    <div><img src="awesome-photo.jpg"></div>
    <script src="app.js" async></script>
  </body>
</html>

向 script
标记添加异步关键字可以指示浏览器在等待脚本可用期间(仅指下载期间,因为所有脚本的执行都会阻塞解析器)不阻止
DOM 构建,这样可以显著提升性能。

分析关键渲染路径性能

发现和解决关键渲染路径性能瓶颈需要充分了解常见的陷阱。让我们踏上实践之旅,找出常见的性能模式,从而帮助您优化网页。

优化关键渲染路径能够让浏览器尽可能快地绘制网页:更快的网页渲染速度可以提高吸引力、增加网页浏览量以及提高转化率。为了最大程度减少访客看到空白屏幕的时间,我们需要优化加载的资源及其加载顺序。

为帮助说明这一流程,让我们先从可能的最简单情况入手,逐步构建我们的网页,使其包含更多资源、样式和应用逻辑。在此过程中,我们还会对每一种情况进行优化,以及了解可能出错的环节。

到目前为止,我们只关注了资源(CSS、JS 或 HTML
文件)可供处理后浏览器中会发生的情况,而忽略了从缓存或从网络获取资源所需的时间。我们作以下假设:

  • 到服务器的网络往返(传播延迟时间)需要 100 毫秒。
  • HTML 文档的服务器响应时间为 100
    毫秒,所有其他文件的服务器响应时间均为 10 毫秒。

Hello World 体验

<html>
  <head>
    <meta name="viewport" content="width=device-width,initial-scale=1">
    <title>Critical Path: No Style</title>
  </head>
  <body>
    <p>Hello web performance students!</p>
    <div><img src="awesome-photo.jpg"></div>
  </body>
</html>

我们将从基本 HTML 标记和单个图像(无 CSS 或 JavaScript)开始。让我们在
Chrome DevTools 中打开 Network 时间线并检查生成的资源瀑布:

 图片 11

正如预期的一样,HTML 文件下载花费了大约 200
毫秒。请注意,蓝线的透明部分表示浏览器在网络上等待(即尚未收到任何响应字节)的时间,而不透明部分表示的是收到第一批响应字节后完成下载的时间。HTML
下载量很小 (<4K),我们只需单次往返便可获取整个文件。因此,获取 HTML
文档大约需要 200
毫秒,其中一半的时间花费在网络等待上,另一半花费在等待服务器响应上。

当 HTML 内容可用后,浏览器会解析字节,将它们转换成tokens,然后构建 DOM
树。请注意,为方便起见,DevTools 会在底部记录 DOMContentLoaded
事件的时间(216 毫秒),该时间同样与蓝色垂直线相符。HTML
下载结束与蓝色垂直线 (DOMContentLoaded)
之间的间隔是浏览器构建 DOM 树所花费的时间
在本例中仅为几毫秒。

请注意,我们的“趣照”并未阻止 domContentLoaded 事件。这证明,我们构建渲染树甚至绘制网页时无需等待页面上的每个静态资源:并非所有资源都对快速提供首次绘制具有关键作用。事实上,当我们谈论关键渲染路径时,通常谈论的是
HTML 标记、CSS 和
JavaScript。图像不会阻止页面的首次渲染,不过,我们当然也应该尽力确保系统尽快绘制图像!

That said, the load event (also known as onload), is blocked on the
image: DevTools reports the onload event at 335ms. Recall that the
onload event marks the point at which all resources that the page
requires have been downloaded and processed; at this point (the red
vertical line in the waterfall), the loading spinner can stop spinning
in the browser.

结合使用 JavaScript 和 CSS

“Hello World
experience”页面虽然看起来简单,但背后却需要做很多工作。在实践中,我们还需要
HTML 之外的其他资源:我们可能需要 CSS
样式表以及一个或多个用于为网页增加一定交互性的脚本。让我们将两者结合使用,看看效果如何:

<html>
  <head>
    <title>Critical Path: Measure Script</title>
    <meta name="viewport" content="width=device-width,initial-scale=1">
    <link href="style.css" rel="stylesheet">
  </head>
  <body onload="measureCRP()">
    <p>Hello web performance students!</p>
    <div><img src="awesome-photo.jpg"></div>
    <script src="timing.js"></script>
  </body>
</html>

添加 JavaScript 和 CSS 之前:

 图片 12

 

添加 JavaScript 和 CSS 之后:

 图片 13

添加外部 CSS 和 JavaScript
文件将额外增加两个瀑布请求,浏览器差不多会同时发出这两个请求。不过,请注意,现在 domContentLoaded 事件与 onload 事件之间的时间差小多了。这是怎么回事?

  • 与纯 HTML 示例不同,我们还需要获取并解析 CSS 文件才能构建
    CSSOM,要想构建渲染树,DOM 和 CSSOM 缺一不可。
  • 由于网页上还有一个阻塞解析器的JavaScript 文件,系统会在下载并解析
    CSS 文件之前阻止 domContentLoaded事件:因为 JavaScript 可能会查询
    CSSOM,必须在下载 CSS 文件之后才能执行 JavaScript。

如果我们用内联脚本替换外部脚本会怎样?即使直接将脚本内联到网页中,浏览器仍然无法在构建
CSSOM 之前执行脚本。简言之,内联 JavaScript 也会阻止解析器。

不过,尽管内联脚本会阻止
CSS,但这样做是否能加快页面渲染速度呢?让我们尝试一下,看看会发生什么。

外部 JavaScript:

 图片 14

内联 JavaScript:

 图片 15

我们减少了一个请求,但 onload 和 domContentLoaded 时间实际上没有变化。为什么呢?怎么说呢,我们知道,这与
JavaScript 是内联的还是外部的并无关系,因为只要浏览器遇到 script
标记,就会进行阻止,并等到之前的css文件的 CSSOM
构建完毕。此外,在我们的第一个示例中,浏览器是并行下载 CSS 和
JavaScript,并且差不多是同时完成。在此实例中,内联 JavaScript
代码并无多大意义。但是,我们可以通过多种策略加快网页的渲染速度。

首先回想一下,所有内联脚本都会阻止解析器,但对于外部脚本,可以添加“async”关键字来解除对解析器的阻止。让我们撤消内联,尝试一下这种方法:

<html>
  <head>
    <title>Critical Path: Measure Async</title>
    <meta name="viewport" content="width=device-width,initial-scale=1">
    <link href="style.css" rel="stylesheet">
  </head>
  <body onload="measureCRP()">
    <p>Hello web performance students!</p>
    <div><img src="awesome-photo.jpg"></div>
    <script async src="timing.js"></script>
  </body>
</html>

阻止解析器的(外部)JavaScript:

 图片 16

异步(外部)JavaScript:

 图片 17

效果好多了!解析 HTML
之后不久即会触发 domContentLoaded 事件;浏览器已得知不要阻止
JavaScript,并且由于没有其他阻止解析器的脚本,CSSOM 构建也可并行进行了。

或者,我们也可以同时内联 CSS 和 JavaScript:

<html>
  <head>
    <title>Critical Path: Measure Inlined</title>
    <meta name="viewport" content="width=device-width,initial-scale=1">
    <style>
      p { font-weight: bold }
      span { color: red }
      p span { display: none }
      img { float: right }
    </style>
  </head>
  <body>
    <p>Hello web performance students!</p>
    <div><img src="awesome-photo.jpg"></div>
    <script>
      var span = document.getElementsByTagName('span')[0];
      span.textContent = 'interactive'; // change DOM text content
      span.style.display = 'inline';  // change CSSOM property
      // create a new element, style it, and append it to the DOM
      var loadTime = document.createElement('div');
      loadTime.textContent = 'You loaded this page on: ' + new Date();
      loadTime.style.color = 'blue';
      document.body.appendChild(loadTime);
    </script>
  </body>
</html>

图片 18

请注意,domContentLoaded 时间与前一示例中的时间实际上相同;只不过没有将
JavaScript 标记为异步,而是同时将 CSS 和 JS 内联到网页本身。这会使 HTML
页面显著增大,但好处是浏览器无需等待获取任何外部资源,网页已经内置了所有资源。

即便是非常简单的网页,优化关键渲染路径也并非轻而易举:需要了解不同资源之间的依赖关系图,需要确定哪些资源是“关键资源”,还必须在不同策略中做出选择,找到在网页上加入这些资源的恰当方式。这一问题不是一个解决方案能够解决的,每个页面都不尽相同。您需要遵循相似的流程,自行找到最佳策略。

不过,我们可以回过头来,看看能否找出某些常规性能模式。

性能模式

最简单的网页只包括 HTML 标记;没有 CSS,没有
JavaScript,也没有其他类型的资源。要渲染此类网页,浏览器需要发起请求,等待
HTML 文档到达,对其进行解析,构建 DOM,最后将其渲染在屏幕上:

<html>
  <head>
    <meta name="viewport" content="width=device-width,initial-scale=1">
    <title>Critical Path: No Style</title>
  </head>
  <body>
    <p>Hello web performance students!</p>
    <div><img src="awesome-photo.jpg"></div>
  </body>
</html>

图片 19

T0 与
T1 之间的时间捕获的是网络和服务器处理时间。在最理想的情况下(如果
HTML 文件较小),我们只需一次网络往返便可获取整个文档。由于 TCP
传输协议工作方式的缘故,较大文件可能需要更多次的往返。因此,在最理想的情况下,上述网页具有单次往返(最少)关键渲染路径。

现在,我们还以同一网页为例,但这次使用外部 CSS 文件:

<html>
  <head>
    <meta name="viewport" content="width=device-width,initial-scale=1">
    <link href="style.css" rel="stylesheet">
  </head>
  <body>
    <p>Hello web performance students!</p>
    <div><img src="awesome-photo.jpg"></div>
  </body>
</html>

 图片 20

我们同样需要一次网络往返来获取 HTML 文档,然后检索到的标记告诉我们还需要
CSS 文件;这意味着,浏览器需要返回服务器并获取
CSS,然后才能在屏幕上渲染网页。因此,这个页面至少需要两次往返才能显示出来。CSS
文件同样可能需要多次往返,因此重点在于“最少”。

让我们定义一下用来描述关键渲染路径的词汇:

  • 关键资源: 可能阻止网页首次渲染的资源。
  • 关键路径长度: 获取所有关键资源所需的往返次数或总时间。
  • 关键字节: 实现网页首次渲染所需的总字节数,它是所有关键资源传送文件大小的总和。我们包含单个
    HTML 页面的第一个示例包含一项关键资源(HTML 文档);关键路径长度也与
    1 次网络往返相等(假设文件较小),而总关键字节数正好是 HTML
    文档本身的传送大小。

现在,让我们将其与上面 HTML + CSS 示例的关键路径特性对比一下:

图片 21

  • 2 项关键资源
  • 2 次或更多次往返的最短关键路径长度
  • 9 KB 的关键字节

我们同时需要 HTML 和 CSS 来构建渲染树。所以,HTML 和 CSS
都是关键资源:CSS 仅在浏览器获取 HTML
文档后才会获取,因此关键路径长度至少为两次往返。两项资源相加共计 9KB
的关键字节。

现在,让我们向组合内额外添加一个 JavaScript 文件。

<html>
  <head>
    <meta name="viewport" content="width=device-width,initial-scale=1">
    <link href="style.css" rel="stylesheet">
  </head>
  <body>
    <p>Hello web performance students!</p>
    <div><img src="awesome-photo.jpg"></div>
    <script src="app.js"></script>
  </body>
</html>

我们添加了 app.js,它既是网页上的外部 JavaScript
静态资源,又是一种解析器阻止(即关键)资源。更糟糕的是,为了执行
JavaScript 文件,我们还需要进行阻塞并等待 CSSOM;因为JavaScript 可以查询
CSSOM,因此在下载 style.css 并构建 CSSOM 之前,浏览器将会暂停解析。

 图片 22

即便如此,如果我们实际查看一下该网页的“网络瀑布”,就会注意到 CSS 和
JavaScript 请求差不多是同时发起的;浏览器获取
HTML,发现两项资源并发起两个请求。因此,上述网页具有以下关键路径特性:

  • 3 项关键资源
  • 2 次或更多次往返的最短关键路径长度
  • 11 KB 的关键字节

现在,我们拥有了三项关键资源,关键字节总计达 11
KB,但我们的关键路径长度仍是两次往返,因为我们可以同时传送 CSS 和
JavaScript。了解关键渲染路径的特性意味着能够确定哪些是关键资源,此外还能了解浏览器如何安排资源的获取时间。让我们继续探讨示例。

在与网站开发者交流后,我们意识到我们在网页上加入的 JavaScript
不必具有阻塞作用:网页中的一些分析代码和其他代码不需要阻止网页的渲染。了解了这一点,我们就可以向
script 标记添加“async”属性来解除对解析器的阻止:

<html>
  <head>
    <meta name="viewport" content="width=device-width,initial-scale=1">
    <link href="style.css" rel="stylesheet">
  </head>
  <body>
    <p>Hello web performance students!</p>
    <div><img src="awesome-photo.jpg"></div>
    <script src="app.js" async></script>
  </body>
</html>

图片 23

 

 异步脚本具有以下几个优点:

  • 脚本不再阻止解析器,也不再是关键渲染路径的组成部分。
  • 由于没有其他关键脚本,CSS 也不需要阻止 domContentLoaded 事件。
  • domContentLoaded 事件触发得越早,其他应用逻辑开始执行的时间就越早。

因此,我们优化过的网页现在恢复到了具有两项关键资源(HTML 和
CSS),最短关键路径长度为两次往返,总关键字节数为 9 KB。

最后,如果 CSS 样式表只需用于打印,那会如何呢?

<html>
  <head>
    <meta name="viewport" content="width=device-width,initial-scale=1">
    <link href="style.css" rel="stylesheet" media="print">
  </head>
  <body>
    <p>Hello web performance students!</p>
    <div><img src="awesome-photo.jpg"></div>
    <script src="app.js" async></script>
  </body>
</html>

 图片 24

因为 style.css 资源只用于打印,浏览器不必阻止它便可渲染网页。所以,只要
DOM
构建完毕,浏览器便具有了渲染网页所需的足够信息。因此,该网页只有一项关键资源(HTML
文档),并且最短关键渲染路径长度为一次往返。

总结:

By default,CSS is treated as a render blocking resource, which means
that the browser won’t render any processed content until the CSSOM is
constructed.
html和css都是阻塞渲染的资源,所以要尽快构建完DOM和CSSDOM才能最快显示首屏。但是CSS解析和HTML解析可以并行。 

当 HTML 解析器遇到一个 script 标记时,它会暂停构建
DOM,下载js文件(来源于外部/内联/缓存),然后将控制权移交给 JavaScript
引擎(此时若在脚本引用其后的元素,会发生引用错误);等 JavaScript
引擎运行完毕,浏览器会从中断的地方恢复 DOM
构建。也就是如果页面有script标签,DOMContentLoaded事件需要等待JS执行完才触发。但是可以将脚本标记为异步,在下载js文件的过程中不会阻塞DOM的构建。

defer 和 async都是异步下载js文件,但也有区别:
defer属性只有ie支持,该属性的脚本都是在页面解析完毕之后执行,而且延迟脚本不一定按照先后顺序执行。
async的js在下载完后会立即执行(因此脚本所执行的顺序并不是脚本在代码中的顺序,有可能后面出现的脚本先加载成功先执行)。

异步资源不会阻塞解析器,让浏览器避免在执行脚本之前受阻于
CSSOM的构建。通常,如果脚本可以使用 async
属性,意味着它并非首次渲染所必需,可以考虑在首次渲染后异步加载脚本。

Race Condition

What if the browser hasn’t finished downloading and building the CSSOM
when we want to run our script? The answer is simple and not very good
for performance: the browser delays script execution and DOM
construction until it has finished downloading and constructing the
CSSOM.即script标签中的JS需要等待位于其前面的CSS加载完才执行。

HTML解析器怎么构建DOM树的?DOM树和html标签是一一对应的,在从上往下解析html时,会边解析边构建DOM。如果碰到外部资源(link或script)时,会进行外部资源的加载。外部资源是js时会暂停html解析,等js加载和执行完才继续;外部资源是css时不影响html解析,但影响首屏渲染。

domContentLoaded:当初始 HTML
文档已经完成加载和解析成DOM树时触发,不会等CSS文件、图片、iframe加载完成。
load:when all resources(including images,) that the page requires
have been downloaded and processed.通过动态获取的资源和load事件无关。 

发表评论

电子邮件地址不会被公开。 必填项已用*标注