使用Varnish代替Squid做网站缓存加速器的详细解决方案

来源:百度文库 编辑:神马文学网 时间:2024/04/26 01:07:58
我曾经写过一篇文章──《初步试用Squid的替代产品──Varnish Cache网站加速器》,但当时仅仅是用着玩,没做深入研究。
今天写的这篇关于Varnish的文章,已经是一篇可以完全替代Squid做网站缓存加速器的详细解决方案了。网上关于Varnish的资料很少,中文资料更是微乎其微,希望本文能够吸引更多的人研究、使用Varnish。
在我看来,使用Varnish代替Squid的理由有三点:
1、Varnish采用了“Visual Page Cache”技术,在内存的利用上,Varnish比Squid具有优势,它避免了Squid频繁在内存、磁盘中交换文件,性能要比Squid高。
2、Varnish的稳定性还不错,我管理的一台图片服务器运行Varnish已经有一个月,没有发生过故障,而进行相同工作的Squid服务器就倒过几次。
3、通过Varnish管理端口,可以使用正则表达式快速、批量地清除部分缓存,这一点是Squid不能具备的。

下面来安装Varnish网站缓存加速器(Linux系统):
1、创建www用户和组,以及Varnish缓存文件存放目录(/var/vcache):
/usr/sbin/groupadd www -g 48
/usr/sbin/useradd -u 48 -g www www
mkdir -p /var/vcache
chmod +w /var/vcache
chown -R www:www /var/vcache
2、创建Varnish日志目录(/var/logs/):
mkdir -p /var/logs
chmod +w /var/logs
chown -R www:www /var/logs
3、编译安装varnish:
wgethttp://blog.s135.com/soft/linux/varnish/varnish-1.1.2.tar.gz
tar zxvf varnish-1.1.2.tar.gz
cd varnish-1.1.2
./configure --prefix=/usr/local/varnish
make && make install
4、创建Varnish配置文件:
vi /usr/local/varnish/vcl.conf
输入以下内容:
引用
backend myblogserver {
set backend.host = "192.168.0.5";
set backend.port = "80";
}
acl purge {
"localhost";
"127.0.0.1";
"192.168.1.0"/24;
}
sub vcl_recv {
if (req.request == "PURGE") {
if (!client.ip ~ purge) {
error 405 "Not allowed.";
}
lookup;
}
if (req.http.host ~ "^blog.s135.com") {
set req.backend = myblogserver;
if (req.request != "GET" && req.request != "HEAD") {
pipe;
}
else {
lookup;
}
}
else {
error 404 "Zhang Yan Cache Server";
lookup;
}
}
sub vcl_hit {
if (req.request == "PURGE") {
set obj.ttl = 0s;
error 200 "Purged.";
}
}
sub vcl_miss {
if (req.request == "PURGE") {
error 404 "Not in cache.";
}
}
sub vcl_fetch {
if (req.request == "GET" && req.url ~ "\.(txt|js)$") {
set obj.ttl =3600s;
}
else {
set obj.ttl = 30d;
}
}
这里,我对这段配置文件解释一下:
(1)、Varnish通过反向代理请求后端IP为192.168.0.5,端口为80的web服务器;
(2)、Varnish允许localhost、127.0.0.1、192.168.0.***三个来源IP通过PURGE方法清除缓存;
(3)、Varnish对域名为blog.s135.com的请求进行处理,非blog.s135.com域名的请求则返回“Zhang Yan Cache Server”;
(4)、Varnish对HTTP协议中的GET、HEAD请求进行缓存,对POST请求透过,让其直接访问后端Web服务器。之所以这样配置,是因为POST请求一般是发送数据给服务器的,需要服务器接收、处理,所以不缓存;
(5)、Varnish对以.txt和.js结尾的URL缓存时间设置1小时,对其他的URL缓存时间设置为30天。
5、启动Varnish
ulimit -SHn 51200
/usr/local/varnish/sbin/varnishd -n /var/vcache -f /usr/local/varnish/vcl.conf -a 0.0.0.0:80 -s file,/var/vcache/varnish_cache.data,1G -g www -u www -w 30000,51200,10 -T 127.0.0.1:3500 -p client_http11=on
6、启动varnishncsa用来将Varnish访问日志写入日志文件:
/usr/local/varnish/bin/varnishncsa -n /var/vcache -w /var/logs/varnish.log &
7、配置开机自动启动Varnish
vi /etc/rc.local
在末尾增加以下内容:
引用
ulimit -SHn 51200
/usr/local/varnish/sbin/varnishd -n /var/vcache -f /usr/local/varnish/vcl.conf -a 0.0.0.0:80 -s file,/var/vcache/varnish_cache.data,1G -g www -u www -w 30000,51200,10 -T 127.0.0.1:3500 -p client_http11=on
/usr/local/varnish/bin/varnishncsa -n /var/vcache -w /var/logs/youvideo.log &
8、优化Linux内核参数
vi /etc/sysctl.conf
在末尾增加以下内容:
引用
net.ipv4.tcp_fin_timeout = 30
net.ipv4.tcp_keepalive_time = 300
net.ipv4.tcp_syncookies = 1
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_tw_recycle = 1
net.ipv4.ip_local_port_range = 5000    65000
再看看如何管理Varnish:
1、查看Varnish服务器连接数与命中率:
/usr/local/varnish/bin/varnishstat

2、通过Varnish管理端口进行管理:
用help看看可以使用哪些Varnish命令:
/usr/local/varnish/bin/varnishadm -T 127.0.0.1:3500 help
引用
Available commands:
ping [timestamp]
status
start
stop
stats
vcl.load
vcl.inline
vcl.use
vcl.discard
vcl.list
vcl.show
param.show [-l] []
param.set
help [command]
url.purge
dump.pool
3、通过Varnish管理端口,使用正则表达式批量清除缓存:
(1)、例:清除类似http://blog.s135.com/a/zhangyan.html的URL地址):
/usr/local/varnish/bin/varnishadm -T 127.0.0.1:3500 url.purge /a/
(2)、例:清除类似http://blog.s135.com/tech的URL地址:
/usr/local/varnish/bin/varnishadm -T 127.0.0.1:3500 url.purge w*$
(3)、例:清除所有缓存:
/usr/local/varnish/bin/varnishadm -T 127.0.0.1:3500 url.purge *$
4、一个清除Squid缓存的PHP函数(清除Varnish缓存同样可以使用该函数,无需作任何修改,十分方便):
view plaincopy to clipboardprint
function purge($ip, $url)
{
$errstr = '';
$errno = '';
$fp = fsockopen ($ip, 80, $errno, $errstr, 2);
if (!$fp)
{
return false;
}
else
{
$out = "PURGE $url HTTP/1.1\r\n";
$out .= "Host:blog.s135.com\r\n";
$out .= "Connection: close\r\n\r\n";
fputs ($fp, $out);
$out = fgets($fp , 4096);
fclose ($fp);
return true;
}
}
purge("192.168.0.4", "/index.php");
?>
附1:Varnish官方网站:http://www.varnish-cache.org/
附2:2007年12月10日,我写了一个每天0点运行,按天切割Varnish日志,生成一个压缩文件,同时删除上个月旧日志的脚本(/var/logs/cutlog.sh):
/var/logs/cutlog.sh文件内容如下:引用
#!/bin/sh
# This file run at 00:00
date=$(date -d "yesterday" +"%Y-%m-%d")
pkill -9 varnishncsa
mv /var/logs/youvideo.log /var/logs/${date}.log
/usr/local/varnish/bin/varnishncsa -n /var/vcache -w /var/logs/youvideo.log &
mkdir -p /var/logs/youvideo/
gzip -c /var/logs/${date}.log > /var/logs/youvideo/${date}.log.gz
rm -f /var/logs/${date}.log
rm -f /var/logs/youvideo/$(date -d "-1 month" +"%Y-%m*").log.gz
设置在每天00:00定时执行:
/usr/bin/crontab -e
或者  vi /var/spool/cron/root
输入以下内容:引用
0 0 * * * /bin/sh /var/logs/cutlog.sh
Tags:linux ,squid ,varnish ,cache
技术大类 ?Cache与存储 |评论(45) |引用(0) |阅读(28783)
Jacky2007-12-3 10:28
varnish如何做到在不重启的情况下重新载入配置文件
Jacky2007-12-3 10:29
用varnish做反向代理的时候,登录一般的网站没有任何问题。登录DZ论坛的后台出现无法登录,没有任何提示。用squid就没有这样的问题,不知道那位老大遇到过这样的问题。张宴 回复于 2007-12-5 19:08
出问题是肯定的,因为本文中的Varnish配置将缓存所有类型的文件,而你使用squid之所以正常,是因为在squid配置文件中没有配置去缓存php文件。同样,对于Varnish,你可以选择不缓存.php文件,修改vcl.conf配置文件:
if (req.request != "GET" && req.request != "HEAD") {
pipe;
}
elseif(req.url ~ "\.(php|cgi)($|\?)") {
pass;
}
else {
lookup;
}
itsea2007-12-4 23:42
张兄,今天测了一下varnish,原来用nginx+squid ESTAB连接大概在1700的机器换了varnish后连接数只有300多了,访问起来一切正常,cacti查看到流量也是正常的,难道varnish就强在这?配置是按您的配置做的。
另外还有个问题vcache这个目录是用来保存cache文件的是吗?我在ll vcache里什么文件都没有。
还有用varnish这个方法还解决了一直让我头疼的squid不支持iis compress问题,实在太感谢了张宴 回复于 2007-12-5 20:02
TCP连接数Varnish要比Squid少,因为Varnish的TCP连接释放要比Squid快。
但同时处理的请求数Varnish要比Squid高一些,这是我在F5 BIG-IP下的两台服务器,一台Varnish、另一台Squid,F5 BIG-IP分给它们的连接数相同,Varnish实时处理的请求数比Squid多1倍,平均处理的请求数也比Squid多100余个:
/usr/local/webserver/varnish/bin/varnishstat
-----------------------------------------------------------
70979868       580.97       356.55 Client requests received
70897998       580.97       356.14 Cache hits
/usr/local/squid/bin/squidclient -p 80 mgr:5min
-----------------------------------------------------------
client_http.requests = 248.425264/sec
client_http.hits = 245.135282/sec
如果正常的话,vcache这个目录里只有一个大小为1G的文件:varnish_cache.data
itsea2007-12-5 10:06
今天遇到的问题貌似跟楼上说的一样,varnish做反向代理后dvbbs登陆不正常,用户登陆后显示同一个用户名,验证码不变。张宴 回复于 2007-12-5 19:21
同理,有些URL是实时的,不需要被缓存,可以自己修改配置文件,用req.url ~过滤掉这些URL。
不过,不建议对discus!、dvbbs等别人写的论坛程序使用Squid、Varnish做缓存,因为这些程序本身就没有用PURGE指令去刷新Squid、Varnish缓存的功能。
就连Discuz!的官方论坛www.discuz.net,也只不过对图片、css、js文件用squid进行了缓存,php等其他文件都是MISS透过:
http://www.discuz.net/
Via  1.0 www1.discuz.net:80 (squid)
X-Cache  MISS from www1.discuz.net
X-Powered-By  PHP/5.2.4
http://www.discuz.net/register.php
Via  1.0 www1.discuz.net:80 (squid)
X-Cache  MISS from www1.discuz.net
X-Powered-By  PHP/5.2.4
http://www.discuz.net/forumdata/cache/style_1.css
Via  1.0 www1.discuz.net:80 (squid)
X-Cache  HIT from www1.discuz.net
http://www.discuz.net/images/default/logo.gif
Via  1.0 www1.discuz.net:80 (squid)
X-Cache  HIT from www1.discuz.net
minuteman2007-12-6 16:20
正好这两天我在自己的BLOG上也做了varnish缓存的实验
用varnishncsa输出日志,但发现里面有不少日志条目是127.0.0.1来的访问,觉得比较奇怪,是不是varnishd工作时候产生的?上网找也没找到相关的解释。
老大你有没有相关知识分享一下?嘿嘿
leftleg2007-12-7 12:50
discuz 做缓存的话 ,可以试试使用缓存帖子分页。
Jacky2007-12-7 14:12
varnish可以实现类似于squid那样的父子节点关系吗?
itsea2007-12-7 14:51
今天在另外一个平台上使用varnish测试
增加了
if (req.request != "GET" && req.request != "HEAD") {
pipe;
}
elseif(req.url ~ "\.(aspx|asp|shtml|vimg)($|\?)") {
pass;
}
else {
lookup;
}
}
后还是偶尔有用户登陆后显示别人的用户名
而且程序员更新js文件后不能马上看到
/usr/local/varnish/bin/varnishadm -T 127.0.0.1:3500 url.purge *$
purge所有后也不行,还发现一个小问题执行 varnishadm后容易使varnishd父进程吃cpu 100%一直下不来
我的访问量在 350 request/sec
e文的理解能力比较查在man跟官方faq里似乎没看到类似情况
minuteman2007-12-7 17:57
缓存不该缓存的对象的问题
也许可以通过在recv里
if (req.http.Cache-Control ~ "no-cache") {
pass;
}
在fetch里加
if (obj.http.Pragma ~ "no-cache" || obj.http.Cache-Control ~ "no-cache" || obj.http.Cache-Control ~ "private") {
pass;
}
leftleg2007-12-10 16:00
ping [timestamp]
status
start
stop
stats
vcl.load
vcl.inline
vcl.use
vcl.discard
vcl.list
vcl.show
param.show [-l] []
param.set
help [command]
telnet 管理有个 vcl.load 应该可以 不重启的情况下重新载入配置文件
小春2007-12-20 12:02
张老师,我装好了,一切正常,只提到的管理这些功能不正常:
[root@linux1 ~]# /usr/local/varnish/bin/varnishadm -T 127.0.0.1:3500
usage: varnishadm -T [address]:port command [...]
上面命令明明没有问题,端口监听也正常.
[root@linux1 ~]# /usr/local/varnish/bin/varnishstat
Cannot open /usr/local/varnish/var/varnish/www.38hao.org/_.vsl: No such file or directory
但是我的,这_.vsl文件明明是在/data/cache目录下,他非到 /usr/local/varnish/var/varnish/下读!张宴 回复于 2007-12-20 21:31
/usr/local/varnish/bin/varnishstat -n /data/vcache
jack2007-12-21 09:59
[root@localhost root]# cat start_cache.sh
ulimit -SHn 51200
/usr/local/varnish/sbin/varnishd -n /home/cache -f /usr/local/varnish/vcl.conf -a 0.0.0.0:81 -s file,/home/cache/varnish_cache.data,1G -g www -u www -w 30000,51200,10 -T 127.0.0.1:3500 -p client_http11=on
/usr/local/varnish/bin/varnishncsa -n /home/cache -w /home/logs/www.log &
[root@localhost root]# sh start_cache.sh
file /home/cache/varnish_cache.data size 1073741824 bytes (262144 fs-blocks, 262144 pages)
Using old SHMFILE
[root@localhost root]# netstat -untl
Active Internet connections (only servers)
Proto Recv-Q Send-Q Local Address               Foreign Address             State
tcp        0      0 0.0.0.0:199                 0.0.0.0:*                   LISTEN
tcp        0      0 0.0.0.0:80                  0.0.0.0:*                   LISTEN
tcp        0      0 0.0.0.0:21                  0.0.0.0:*                   LISTEN
tcp        0      0 0.0.0.0:22                  0.0.0.0:*                   LISTEN
tcp        0      0 127.0.0.1:25                0.0.0.0:*                   LISTEN
udp        0      0 0.0.0.0:161                 0.0.0.0:*
服务启动时也不报错,就是看不到varnish监听的端口,如何debug? 实在看不出什么问题,
请张老师指点一下!
coffee2007-12-21 16:49
(1)、Varnish通过反向代理请求后端IP为192.168.0.5,端口为80的web服务器;
backend.host  如果有多台的话 是否也可以象 SQUID 那样设置在 hosts文件里面,
(3)、Varnish对域名为blog.s135.com的请求进行处理,非blog.s135.com域名的请求则返回“Zhang Yan Cache Server”;
squid 可以根据到目的IP是否符合在判断是否可以使用 这样就不用判断域名 不知道在 Varnish 也可以这样设置
阿木2007-12-23 08:34
张老师,我服务器上用varnish+nginx在同一台机器上跑,运行没有三分钟的时候,就开始卡,仍后几乎网页打不开。不知道什么原因,而我在本地虚拟环境测试一点问题都没有,只是本地的是varnish+apache,而线上服务器是varnish+nginx,有点不解,请张老师指点一下,有遇到想关问题的朋友指点一下!
原来本地是squid+nginx速度飞快,现在是varnish+nginx就卡得不行...
varnish2008-1-4 17:41
问下varnish 怎么配置 泛域名 的主机,我很很多二级域名,比如 xx.abc.com    ,一个一个加好麻烦。。。squid 或者nginx 都支持 .abc.com 的张宴 回复于 2008-1-4 21:24
if (req.http.host ~ "^blog.s135.com") {
改成
if (req.http.host ~ ".abc.com") {
aiqingno2008-1-5 11:38
张老师,我连菜鸟都算不上。。
想问问如何,把访问的地址的IP更换成www.XXXXX.com的类型呢?
需要什么才可以的吗?
antiaiqingno2008-1-6 16:56
需要反向DNS
xia_you_mu2008-1-6 18:30
问个问题,如果要做个全国性的网站负载均衡,可否搭配varnish+F5 bigip实现
1.varnish专门做cache  Server
2.F5 Bigip用做服务器负载均衡
张宴 回复于 2008-1-7 08:16
F5 BIGIP + Varnish是可行的,但是Varnish的缓存基本上在内存中,如果Varnish进程停止再启动,Varnish就会重新访问后端Web服务器。
还有种方案就是F5 BIGIP + Squid,Squid的缓存会保持在磁盘和内存,虽然Squid性能没有Varnish高,但它停止、重启的时候,可以直接先从磁盘读取缓存数据。
代码罐头2008-1-9 15:36
引用
F5 BIGIP + Varnish是可行的,但是Varnish的缓存基本上在内存中,如果Varnish进程停止再启动,Varnish就会重新访问后端Web服务器。
还有种方案就是F5 BIGIP + Squid,Squid的缓存会保持在磁盘和内存,虽然Squid性能没有Varnish高,但它停止、重启的时候,可以直接先从磁盘读取缓存数据。
这样的话.重启Varnish会导致边缘节点访问一定时间内卡一下吧?
内存方式虽然快.但是这点上会很郁闷了.
powerv2008-1-16 01:45
张老师:我出现如下错误
101 32
all commands are in lower-case.
我的配置是这样的 Varnish 和 nginx 同在一台机器上,没办法,只有一台机器。我把Varnish配置为公网的80,如 210.21.21.21:80 这样,nginx配置为:127.0.0.1:80 启动是正常的,但访问时出现
101 32
all commands are in lower-case.