网站的访问速度是由多个因素所共同决定的,这些因素例如应用程序的响应速度、网络带宽、服务器性能、与客户端之间的网络传输速度等等。其中最重要的一个因素是应用程序本身的响应速度,因此当你为网站性能所苦恼时,你第一个需要着手进行处理的便是尽可能的提升应用程序的执行速度,你可以使用缓存或者是优化代码的执行效率来提升应用程序的速度。
但是,本文并不是介绍如何来提升应用程序的执行效率,前面提到的只不过是为了防止您病急乱投医。在确保您的应用程序的性能已经达到足够好,同时服务器的性能也完全满足的情况下,不妨来试试网页压缩来进一步提升网页的浏览速度,而且非常重要的是,它完全不需要任何的成本,只不过是会让您的服务器CPU占用率稍微提升一两个百分点而已或者更少。
网页压缩是一项由WEB服务器和浏览器之间共同遵守的协议,也就是说WEB服务器和浏览器都必须支持该技术,所幸的是现在流行的浏览器都是支持的,包括IE、FireFox、Opera等;服务器有Apache和IIS等。双方的协商过程如下:
1. 首先浏览器请求某个URL地址,并在请求的头(head)中设置属性accept-encoding值为gzip,deflate,表明浏览器支持gzip和deflate这两种压缩方式(事实上deflate也是使用gzip压缩协议,下面我们会介绍二者之间的区别);
2. WEB服务器接收到请求后判断浏览器是否支持压缩,如果支持就传送压缩后的响应内容,否则传送不经过压缩的内容;
3. 浏览器获取响应内容后,判断内容是否被压缩,如果是则解压缩,然后显示响应页面的内容。
在实际的应用中我们发现压缩的比率往往在3到10倍,也就是本来50k大小的页面,采用压缩后实际传输的内容大小只有5至15k大小,这可以大大节省服务器的网络带宽,同时如果应用程序的响应足够快时,网站的速度瓶颈就转到了网络的传输速度上,因此内容压缩后就可以大大的提升页面的浏览速度。
接下来我们介绍几种常用的环境下如何启用网页压缩功能。
1. 纯Tomcat服务器
如果您的WEB应用程序是跑在Tomcat服务器下的,而且直接使用Tomcat所提供的HTTP服务,那建议你马上动手,因为实在是太简单了,你只需要在server.xml配置文件中给HTTP Connector增加一个compression的参数值为on并重启Tomcat服务器就立刻生效,配置如下:
maxThreads="150" connectionTimeout="20000"
redirectPort="8443" compression="on"/>
Tomcat采用的是HTTP/1.1的GZIP压缩协议,它会根据浏览器送过来的请求中的accept-encoding值是否包含gzip来判断浏览器是否支持gzip压缩协议,如果浏览器支持就启用gzip压缩,否则就不进行任何压缩处理。Tomcat中还有另外一个参数compressableMimeType,这个参数可以用来指定压缩哪种类型的内容,例如可以指定该配置值为:text/html,text/plain ,则只压缩contentType为text/html和text/plain的页面,不过您最好也将css和javascript文件也算在压缩的文件类型中,因为这两者的压缩效果也十分的明显。
2. Apache服务器
在apache1.3版本,大家常用mod_gzip对输出内容进行压缩,现在主流的浏览器都支持gzip解压缩。在apache2下,这个模块换名为mod_deflate,对应的模块文件名是mod_deflate.so。mod_gzip本文不做介绍,下面描述一下在Apache2下如何启用并配置mod_deflate模块。默认安装的Apache不管是Windows还是Linux/Unix,都是不启用该模块的, Linux/Unix下甚至不带该模块,你需要手工编译这个模块。
下面我们分别介绍在Windows和Linux操作系统下如何启用并配置mod_deflate模块。
在Windows下采用安装程序安装的Apache服务器已经带有deflate所需要的模块 mod_deflate.so和mod_headers.so,我们只需要在httpd.conf配置文件中启用并进行相关的配置即可,配置如下:
LoadModule deflate_module modules/mod_deflate.so
LoadModule headers_module modules/mod_headers.so
# Insert filter
SetOutputFilter DEFLATE
# Netscape 4.x has some problems...
BrowserMatch ^Mozilla/4 gzip-only-text/html
# Netscape 4.06-4.08 have some more problems
BrowserMatch ^Mozilla/4\.0[678] no-gzip
# MSIE masquerades as Netscape, but it is fine
# BrowserMatch \bMSIE !no-gzip !gzip-only-text/html
# NOTE: Due to a bug in mod_setenvif up to Apache 2.0.48
# the above regex won't work. You can use the following
# workaround to get the desired effect:
BrowserMatch \bMSI[E] !no-gzip !gzip-only-text/html
# Don't compress images
SetEnvIfNoCase Request_URI .(?:gif|jpe?g|png)$ no-gzip dont-vary
# Make sure proxies don't deliver the wrong content
Header append Vary User-Agent env=!dont-vary
而如果是Linux/Unix操作系统,如果你没有在编译安装的过程中将所需要的两个模块mod_deflate和mod_headers编译进去的话,那就稍微有点麻烦,首先我们先看如何在编译安装Apache过程中也同时编译这两个模块,请在执行configure程序时增加两个参数分别是
# ./configure --enable-deflate --enable-headers
这样在编译完Apache后就可以直接在httpd.conf中启用并配置deflate模块了,配置的方法跟Windows平台下是相同的。
如果说您的Apache已经在运行了,不想再重新编译一次,那也可以选择只编译deflate模块所需的文件mod_deflate.c和mod_headers.c。这两个文件位于{apache-src}/modules/filters/目录下(其中{apache-src}为apache源文件所在的目录)。使用如下命令来单独编译这两个源文件。
# {apache-bin}/apxs -i -a -c {apache-src}/modules/filters/mod_deflate.c
# {apache-bin}/apxs –i –a –c {apache-src}/modules/filters/mod_headers.c
其中{apache-bin}为Apache安装目录下的bin目录,接下来在httpd.conf直接配置该模块即可。
很多时候你在单独编译deflate模块的时候可能会碰到编译错误,提示是:
Cannot load /opt/apache/modules/mod_deflate.so into server: /opt/apache/modules/mod_deflate.so: undefined symbol: deflate
解决的方法如下:
编辑/usr/local/apache2/bin/apr-config文件修改其中的LDFLAGS值为"-lz"
然后再重新编译mod_deflate模块,apxs -ica mod_deflate.c即可。
为了省却不必要的麻烦,请尽量在编译安装时直接加上--enable-deflate --enable-headers参数。
3. IIS服务器
微软的IIS服务器同样也是目前用得最多的WEB服务器之一,而且用来运行ASP页面也是必不可少的。IIS6本身支持gzip压缩,IIS5就比较费劲了,你可以找一些第三方的组件来处理,例如httpzip,网址是:http://www.port80software.com/products/httpzip/?vid=3354166,不过这玩意是收费的。接下来我们介绍如何在IIS6中启用压缩功能。
打开Internet信息服务(IIS)管理器,右击"网站"->"属性",选择"服务"。在"HTTP压缩"框中选中"压缩应用程序文件"和"压缩静态文件",按需要设置"临时目录"和"临时目录的最大限制",如下图所示:
接下来配置gzip组件,在Internet信息服务(IIS)管理器,点击"Web服务扩展"->"增加一个新的Web服务扩展...",在"新建Web服务扩展"框中输入扩展名"HTTP Compression",添加"要求的文件"为C:\WINDOWS\system32\inetsrv\gzip.dll,选中"设置扩展状态为允许",如下图所示:
还没完呢,我们还需要修改一个配置文件,修改之前请先停止IIS服务,打开C:\Windows\System32\inetsrv\MetaBase.xml,这个文件很大,找到下面一段信息:
HcCompressionDll="%windir%\system32\inetsrv\gzip.dll"
HcCreateFlags="1"
HcDoDynamicCompression="TRUE"
HcDoOnDemandCompression="TRUE"
HcDoStaticCompression="TRUE"
HcDynamicCompressionLevel="0"
HcFileExtensions="htm
html
txt"
HcOnDemandCompLevel="10"
HcPriority="1"
HcScriptFileExtensions="asp
dll
exe"
>
增加一些要进行压缩的文件后缀,其中HcFileExtensions是静态文件的扩展名,增加js和css等;HcScriptFileExtensions为动态文件的扩展名,增加aspx,保存后启动IIS即可生效。
最后我们介绍如何来测试前面所做的工作是否起效,你可能会觉得很奇怪,配置好了,用浏览器打开页面正常,查看页面源码,内容并没有变化,大小也跟原来一样,怎么回事呢?这是因为浏览器已经把内容解压了的结果,有两个方法来判断压缩是否生效:第一,查看WEB服务器的日志,不管是Apache或者是IIS,二者的访问日志格式都差不多是下面这种格式:
127.0.0.1 - - [14/May/2006:08:44:28 +0800] "GET /manual/style/css/manual.css HTTP/1.1" 200 19351
最后两个数字分别是HTTP的结果码(200表示OK),19351表示的是响应内容的大小,把这个大小跟你在浏览器上查看源码的大小比较一下就可以知道是否生效。另外一种方法就是自己写一个HTTP客户端的小程序并设置Accept-Encoding的值为gzip,deflate,由这个程序去请求服务器端的某个URL地址,然后打印出响应的内容,如果是一堆乱码,恭喜你,配置成功。下面是一段Java写的测试客户端代码(需要用到commons-httpclient包):
HttpClient http = new HttpClient();
String url = "http://www.dlog.cn/javayou";
GetMethod get = new GetMethod(url);
try{
System.out.println("fetching url : "+ url);
get.addRequestHeader("accept-encoding", "gzip,deflate");
int er = http.executeMethod(get);
if(er==200){
System.out.println(get.getResponseContentLength());
String html = get.getResponseBodyAsString();
System.out.println(html);
System.out.println(html.getBytes().length);
}
}finally{
get.releaseConnection();
}
相关网址
Apache http://httpd.apache.org
Tomcat http://tomcat.apache.org
IIS 6.0 http://www.microsoft.com/windowsserver2003/iis/
mod_deflate详细配置文档 http://httpd.apache.org/docs/2.2/mod/mod_deflate.html
关于作者
刘冬,一直使用J2EE/J2ME从事移动互联网方面的开发,拥有开源博客产品DLOG4J,目前DLOG4J已经推出3.0多用户版。您可以通过Java自由人网站来跟他联系,网址是:http://www.dlog.cn/javayou ,另外他的邮件地址是javayou@gmail.com。 |