欢迎各位兄弟 发布技术文章

这里的技术是共享的

You are here

网页性能之并行下载与减少连接Overhead的平衡

shiping1 的头像

网页性能之并行下载与减少连接Overhead的平衡

2011-06-07 15:01 by hackerzhou

最近在改写博客的主题,其中一个比较重要的方面就是研究如何提升网页在浏览器中加载的效率。本 文主要从页面内资源加载的角度出发来探讨这个问题,网上也有很多关于这方面的争论,主要分为主张多资源文件从而并发下载的“主多派”和主张整合页面资源到 较少资源文件的“主少派”。那么什么才是真相?多资源文件真的能做到并发下载吗?

其实每个网站都应该就其各自的特点来进行优化,更多的时候并行下载资源和减少连接数开销是一种博弈的效果。现在的浏览器都使用并发连接来提升浏览器的性能,具体参见:并发连接数对浏览器加载速度的测试。在我看来,提高网页加载性能的关键就在于合理的利用这些默认的数据合理的排布HTML中引用到的CSS和JS脚本文件以及合理控制这些资源文件的数量。

与浏览器遇到JavaScript是否阻塞有关

首先来看看我们的浏览器是怎么加载页面资源的,以我室友tomsheep的博客http://tomsheep.net为例子:

首先,浏览器发起直接对目标html的请求,然后分析其中用到的资源并下载,浏览器有自己的规则来判断什么样的资源可以被并行下载,什么样的不可以,参考pagespeed的doc所说的,浏览器对加载顺序有着特殊的喜好:JS的出现会延迟后续CSS的下载,因为JS会改变页面元素,浏览器会延迟整个页面的渲染直到JS被下载解释并执行,所以必须让CSS的链接在JS前面以达到尽可能的并行。

举个pagespeed上的例子:

1
2
3
4
5
6
7
<head>
<link rel="stylesheet" type="text/css" href="stylesheet1.css" />
<script type="text/javascript" src="scriptfile1.js" />
<script type="text/javascript" src="scriptfile2.js" />
<link rel="stylesheet" type="text/css" href="stylesheet2.css" />
<link rel="stylesheet" type="text/css" href="stylesheet3.css" />
</head>

如果我们的html代码是这样子的,那么浏览器下载CSS会被前面两个JS给阻塞住,导致如下图般瀑布式的加载:

而当CSS和JS的加载顺序变成如下代码所示的时候,就可以避免阻塞下载的情况发生:

1
2
3
4
5
6
7
<head>
<link rel="stylesheet" type="text/css" href="stylesheet1.css" />
<link rel="stylesheet" type="text/css" href="stylesheet2.css" />
<link rel="stylesheet" type="text/css" href="stylesheet3.css" />
<script type="text/javascript" src="scriptfile1.js" />
<script type="text/javascript" src="scriptfile2.js" />
</head>

浏览器就可以进行并行的下载,从而提升效率:

可以看到,页面资源在html中出现的顺序对浏览器是否并行下载资源有着重要的影响,并不是只要出现多个资源文件都能并行的下载。

与浏览器支持的并发连接数有关

在HTTP 1.1协议中要求浏览器访问同一host的连接数不得大于2,但事实上当前绝大多数浏览器都违背了这一要求,具体参见:并发连接数对浏览器加载速度的测试,实际的默认连接数的多少跟操作系统以及浏览器版本有关。但我们基本上可以认为,浏览器的并发连接数大于6(忽略过时的浏览器,比如IE6)。

浏览器在进行每一次请求资源的过程中,都需要进行DNS Lookup来将域名翻译成IP地址并且新建一个TCP连接(如果没有keepalive或者keepalive timeout了),因此连接越多由此带来的overhead越大。而且,一旦资源文件超过了浏览器支持的最大并发数量,那么必定有资源要被延迟下载。比 如加载某网页需要下载13个资源文件(包含原始的html)、全都是CSS不会产生JS延迟、每次请求耗时100ms,那么浏览器第一次连接用于请求 html,第二到第七次连接并发请求2-7号资源,第八到第十三次连接并发请求8-13号资源,可以看到,浏览器在并发连接的情况下也用了300ms。而 如果将13个文件合并成7个文件的话,用200+ms就能完成(单个文件增大后传输会稍慢,不过少了DNS Lookup以及TCP连接的overhead,整体性能会有一个飞跃)。

综上所述,并行下载和降低连接overhead需要达到一个平衡状态才是一个好的方案,片面的追求较少的连接数或较高的并行性都是不可取的。这个平 衡状态是因站点而已的,网站管理员需要根据各自网站的特点选用合适的技术来提升访问效率(当然服务器的性能也是相当重要的因素)。同时也推荐给大家一个网 站,http://site-perf.com/,它能够模拟浏览器用不同的连接数来测试你的网站,和Firebug插件一样对调优很有帮助。

常用的技术

CSS Sprites,用来将不经常改动的小图片整合成一张大图片,在CSS中利用background- position、width和height来控制显示的区域。优点是能显著的减少连接数以减少overhead而且可以被复用。缺点是制作起来比较费功 夫,而且没有什么好办法解决repeat的背景图(因为大小未知)。

Data URL 和 DHTML,通过Base64编码将二进制文件(比如图片)捆绑到HTML/CSS中。 优点是制作简便,也能减少连接数。缺点是BASE64在一定程度上会增大文件大小(即使用了GZip压缩);浏览器也要重新解码显示,会带来一定的性能问 题;最重要的是,无法被缓存,每次请求HTML/CSS都会加载一遍。

CDN,全称Content Delivery Network,即内容分发网络。现在有一定规模以及并发访问量需求的站点(比如网易和新浪等)都将各自的页面资源(CSS/JS/图片等)分发在不同的 host主机上,能让浏览器同时从多个host上下载资源而且也能根据负载和网络状况等因素将用户的请求递交到离用户最近的主机上,提升可靠性。成本巨 大,不是一般人能玩得起的。当然有一些cdn站点提供诸如jquery之类的服务,在jQuery官方下载可以看到介绍,经我试验下来微软的ajax.aspnetcdn.com响应速度最快,优点有很多,速度和稳定性咱就不提了,更重要的是对浏览者来说他们可能已经请求过该脚本并放在缓存中了。

研究了各自的利弊之后得出我博客主题所使用的策略:主要使用CSS Sprites,用Data URL来解决背景repeat问题。当然,这也是因站点而已的,对于小站点(比如我的博客)之类的,可以把所有用到的图片整合到一张图片中;对于那些大站 点,就应该把相近的功能整合到一张图中,这样就算有调整,客户端也不用下载整张大图,只需要更新修改的部分就可以。不管是CSS Sprites还是Data URL都是针对网站本身的样式来说,不适合把内容中的图片(比如新闻中的图片)捆绑进HTML/CSS/图片中。

本文基于 署名 2.5 中国大陆 许可协议发布,欢迎转载,演绎或用于商业目的,但是必须保留本文的署名 hackerzhou 并包含 原文链接
发表评论

本文有 10 条评论

  1. invinzeng
    2011-11-01 10:45

    文章写得不错,今后多多交流 :)

  2. 高空作业平台
    2011-06-21 14:28

    是嘛 介素尊的吗

  3. 手机刷机包
    2011-06-14 17:51

    文章看了,分析的透彻,是这样的

  4. Shyc2001
    2011-06-07 19:03

    看完以后马上先把blog的css和js的顺序调了一下…
    谢谢~

    • hackerzhou
      2011-06-07 19:38

      恩,其实是比较简单的一个小技巧~只不过貌似没什么人关注
      你用pagespeed测试一下的话他会告诉你有哪些地方应该改的

  5. Ryanmagic
    2011-06-07 18:27

    hackerzhou的全是技术帖,看不懂。。。

  6. 打湿!
    2011-06-07 18:20

    dns lookup 有缓存的吧?我用firebug看到很多域名解析的耗时都是0ms

    • hackerzhou
      2011-06-07 19:42

      恩,对的,但还有一些比的overhead,比如建立一个TCP连接(要是keepalive关了或者数据太多导致keepalive超时了)

 

来自 http://hackerzhou.me/2011/06/parallelized-download-for-optimizing-webpage-performance.html




载入页面时使用多域名实现资源并行下载。图片,js、css文件等(转)  

2012-05-14 20:23:09|  分类: 前端技术 |字号 订阅

 

网 页中包含的资源(图片、js、css、iframe等)引起的http请求基本上都来源于同一个域名,有的网站对静态资源文件使用了独立的无cookie 域名。YSlow提倡的高性能网站准则中有一条“reduce DNS lookups”,减少域名数量以便减少域名解析所需要的时间,但是,有的情况下,适当的增加网页中使用的域名数却可以提升网页的速度。

首先,我们来看一个例子:
图片下载被阻塞:
http://blog.tugai.net/performance/sharding_dominant_domain/block_download.html

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml"> <head>  <title>block image download</title> </head> <body>  <p>只有前10张图片(IE,Firefox前6张)并行下载。</p>  <img src="http://blog.tugai.net/performance/mime.php?type=img&v=1" />  <img src="http://blog.tugai.net/performance/mime.php?type=img&v=2" />  <img src="http://blog.tugai.net/performance/mime.php?type=img&v=3" />  <img src="http://blog.tugai.net/performance/mime.php?type=img&v=4" />  <img src="http://blog.tugai.net/performance/mime.php?type=img&v=5" />  <img src="http://blog.tugai.net/performance/mime.php?type=img&v=6" />  <img src="http://blog.tugai.net/performance/mime.php?type=img&v=7" />  <img src="http://blog.tugai.net/performance/mime.php?type=img&v=8" />  <img src="http://blog.tugai.net/performance/mime.php?type=img&v=9" />  <img src="http://blog.tugai.net/performance/mime.php?type=img&v=10" />  <img src="http://blog.tugai.net/performance/mime.php?type=img&v=11" />  <img src="http://blog.tugai.net/performance/mime.php?type=img&v=12" /> </body> </html> 


在这个例子中,网页包含12张图片,每张图片加载需要4秒钟。
以下是网页加载时的瀑布图:
载入页面时使用多域名实现资源并行下载。图片,js、css文件等(转) - wzfjesun - wzfjesun 的博客
IE6加载时的瀑布图
载入页面时使用多域名实现资源并行下载。图片,js、css文件等(转) - wzfjesun - wzfjesun 的博客
Firefox3加载瀑布图

从 上图中可以看到,IE6下,前10张图片是并行下载,后2张要在前10张图片下载完成后才开始下载,Firefox下情况比较类似,只不过图片是每6张一 组下载。这是因为浏览器限制了同一个域名下最大并行下载数量(或者说最大连接数),当并行下载数到达上限时,其后的http请求就必须排队等待,除了图片 外,css、html等网页资源也存在同样的问题。同一域名的最大并行下载数量与浏览器类型、浏览器版本、HTTP版本有关,以下是网上收集的数据,并未 核实。
载入页面时使用多域名实现资源并行下载。图片,js、css文件等(转) - wzfjesun - wzfjesun 的博客

并行下载是加快网页显示非常关键的一项技术,如何多图片的并行下载呢?我们再来看另外一个例子。
多图片并行下载:
http://blog.tugai.net/performance/sharding_dominant_domain/parallel_download.html

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">  <html xmlns="http://www.w3.org/1999/xhtml">  <head>   <title>parallel image download</title>  </head>  <body>   <p>所有图片并行下载。</p>   <img src="http://blog.tugai.net/performance/mime.php?type=img&v=1" />   <img src="http://blog.tugai.net/performance/mime.php?type=img&v=2" />   <img src="http://blog.tugai.net/performance/mime.php?type=img&v=3" />   <img src="http://blog.tugai.net/performance/mime.php?type=img&v=4" />   <img src="http://blog.tugai.net/performance/mime.php?type=img&v=5" />   <img src="http://blog.tugai.net/performance/mime.php?type=img&v=6" />   <img src="http://blog1.tugai.net/performance/mime.php?type=img&v=7" />   <img src="http://blog1.tugai.net/performance/mime.php?type=img&v=8" />   <img src="http://blog1.tugai.net/performance/mime.php?type=img&v=9" />   <img src="http://blog1.tugai.net/performance/mime.php?type=img&v=10" />   <img src="http://blog1.tugai.net/performance/mime.php?type=img&v=11" />   <img src="http://blog1.tugai.net/performance/mime.php?type=img&v=12" />  </body>  </html>  
再来看看该网页的瀑布图:
载入页面时使用多域名实现资源并行下载。图片,js、css文件等(转) - wzfjesun - wzfjesun 的博客
IE6加载瀑布图
载入页面时使用多域名实现资源并行下载。图片,js、css文件等(转) - wzfjesun - wzfjesun 的博客
Firefox3加载瀑布图

上例中已经实现了多图片的并行下载,网页加载时间从7.9s减少到4s,速度提升了一倍。从源代码中可以看到,图片使用了不同的域名,每个域名连接的图片不超过6张。本例的关键技术就是使用了多域名来区分资源(包括图片、css等)。

IP和域名

“每 台服务器的最大连接数”,这里说的服务器是指的URL地址中的域名,而不是服务器的IP地址,所以,同一IP、不同域名会被看成不同的服务器。利用 Apache的ServerAlias可以很方便的在同一域名下增加多个别名域名,相应的,在域名解析时只需要添加一个别名的CNAME记录即可。

多少个域名合适

在前面的内容中你已经看到了,两个域名比一个域名好,三个域名是否会比两个域名好呢?10个域名呢?YSlow的开发者、Yahoo网页性能专家Steve Souders在他的性能研究报告中指出,从一个域名增加到两个域名,网站性能能够得到提升,当域名大于两个时,会对网页加载时间产生负面影响。这个问题的最终答案是域名的数量与网页资源的数量、体积有关,但是,按着经验来说,两个足以。

如何划分资源

如 何给指定的资源分配多域名中的一个域名呢?非常关键的一条原则是保证一个资源在分配时总是分配到固定的一个域名,这样,如果资源已经在浏览器缓存了的话, 下次访问时就可以在缓存中读取,避免从其他域名再次下载资源。其中一种方法是,使用哈希函数转换资源的文件名为整数,再根据约定的算法选择域名。

当然,手动指定是最原始但有效的方法。
来自 http://wzfjesun.blog.163.com/blog/static/14245693920124148239436/

普通分类: