轻量级持久存储系统 MemcacheDB

来源:百度文库 编辑:神马文学网 时间:2024/04/28 07:47:25
注:memcached可能简称mc,memcachedb可能简称mcdb
一、memcachedb是什么
mcdb是一款分布式键值持久存储系统,由新浪开源。mcdb基于mc协议,所以可以使用mc客户端直接使用,存储引擎方面使用Berkeley DB,支持主从复制模式。

二、memcachedb的应用场景
首先,我们从基本的数据存储的角度看mysql、memcached、memcachedb的区别和特点,当然它们肯定不只这点区别。

mc因为是非持久存储的,所以它的定位就是缓存。
而mcdb不是用来做缓存的,它是和mysql同个层次的东西。不一样的是,mcdb性能要比mysql高,而mysql检索功能比mcdb强。如果非要从缓存的角度看的话,那mc就是缓解mysql读压力,而mcdb则是缓解mysql写压力。
mcdb适合应用的场景:
1.浏览/点击/等统计,也可以局部代替mysql的count函数
2.标志,例如,JE的“我在干什么”功能
3.频繁写的地方,访客列表、评论之类的
之前,我写过的feed设计最大特点是使用mcdb来分散写压力,对sns来说动态产生太频繁了,全部写进mysql压力太大了,毕竟读/写1K和100K性能不是一样的,一台mcdb和一台mysql的成本不一样啊。。
虽然mcdb的方式比较简单,但是应用场合还是很丰富的,使用新产品要发散思维,充分发挥想象力~
不过重要的数据还是不建议使用,感觉还不是很放心。

三、安装
安装MemcacheDB之前需要安装Libevent和Berkeley Db
1.先安装libevent
下载地址: http://www.monkey.org/~provos/libevent/
Java代码
  1. tar zxvf libevent-1.4.9-stable.tar.gz    
  2. cd libevent-1.4.9-stable    
  3. ./configure    
  4. make    
  5. make install  

2.安装Berkeley Db
下载地址:http://www.oracle.com/technology/software/products/berkeley-db/index.html
Java代码
  1. tar xvzf db-4.7.25.tar.gz   
  2. cd db-4.7.25/   
  3. cd build_unix/   
  4. ../dist/configure   
  5. make   
  6. make install  

安装完后,编辑/etc/ld.so.conf把Java代码
  1. usr/local/lib   
  2. /usr/local/BerkeleyDB.4.7/lib  

3.安装memcachedb
下载地址:http://code.google.com/p/memcachedb/downloads/list
Java代码
  1. tar xvzf memcachedb-1.2.0.tar.gz   
  2. cd memcachedb-X.Y.Z   
  3. ./configure --enable-threads   
  4. make   
  5. make install  

4.创建数据保存点
Java代码
  1. mkdir /data/21201 -p   
  2. chown -R willko:wheel  


四、使用
1.单机模式
Java代码
  1. memcachedb -u willko -p 21201 -d -r -H /data/21201/ -v >/data/21201.log 2>&1  

2.主从模式
Java代码
  1. memcachedb -p 21210 -d -r -u willko -H /data/21210_m -N -R 127.0.0.1:31210 -M    
  2. 主服务器,用31210来同步数据   
  3.   
  4. memcachedb -p 21211 -d -r -u willko -H /data/21211_from_local_21210 -N -R 127.0.0.1:31211 -O 127.0.0.1:31210 -S   
  5. 从服务器,主从模式-R是必须设置的。  

测试是否同步
Java代码
  1. [root@srv willko]# telnet 127.0.0.1 21210  
  2. Trying 127.0.0.1...   
  3. Connected to 127.0.0.1.   
  4. Escape character is '^]'.   
  5. set yy 0 0 4  
  6. yyyy   
  7. STORED   
  8. get yy   
  9. VALUE yy 0 4  
  10. yyyy   
  11. END  

Java代码
  1. [root@srv willko]# telnet 127.0.0.1 21211  
  2. Trying 127.0.0.1...   
  3. Connected to 127.0.0.1.   
  4. Escape character is '^]'.   
  5. get yy   
  6. VALUE yy 0 4  
  7. yyyy   
  8. END  

3.FYI:参数说明
Java代码
  1. memcachedb 1.2.0  
  2. -p       TCP监听端口,默认是 21201  
  3. -U       UDP监听端口,默认是 0,也就是关闭。   
  4. -s      使用socket通讯,参数是设置unix socket的路径,此通讯方式只能本地使用   
  5. -a      unix socket文件的权限,默认是 0700  
  6. -l   监听地址,默认是 INDRR_ANY   
  7. -d            以守护进程方式运行   
  8. -r            maximize core file limit   
  9. -u  以启动,只有root才能使用,因为memcachedb不允许以root启动   
  10. -c       max simultaneous connections, default is 1024  
  11. -b       item size smaller than  will use fast memory alloc, default is 512B   
  12. -v            打印错误和警告信息   
  13. -vv           打印整个交互过程   
  14. -h            print this help and exit   
  15. -i            print license info   
  16. -P      进程PID保存路径,只能在守护进程方式下使用   
  17. -t       线程数,默认是4  
  18. --------------------BerkeleyDB Options-------------------------------   
  19. -m       in-memmory cache size of BerkeleyDB in megabytes, default is 64MB   
  20. -A       underlying page size in bytes, default is 4096, (512B ~ 64KB, power-of-two)   
  21. -f      数据文件名, 默认是 'data.db'  
  22. -H       数据保存目录,默认是 '/data1/memcachedb'  
  23. -B   数据结构类型,有 'btree' 和 'hash'两种. 默认是 'btree'  
  24. -L       log buffer size in kbytes, default is 32KB   
  25. -C       每隔多少秒checkpoint, 设置为0将实时写入硬盘, 默认是5分钟   
  26. -T       do memp_trickle every  seconds, 0 for disable, default is 30 seconds   
  27. -e       percent of the pages in the cache that should be clean, default is 60%   
  28. -D       do deadlock detecting every  millisecond, 0 for disable, default is 100ms   
  29. -N            设置 DB_TXN_NOSYNC 标志来改善性能,但是牺牲事务的持久性。默认为 关闭   
  30. --------------------Replication Options-------------------------------   
  31. -R            主服务器提供同步数据的地址和端口,主从模式必须设置   
  32. -O            从服务器同步源地址和端口   
  33. -M/-S         以主或从服务器启动   
  34. -n            允许从服务器数量, 默认是2台   
  35. -----------------------------------------------------------------------  

关于-C和-N选项涉及到数据完整性,会在下面会说明一下

五、备份和恢复
1.热备份
因为memcachedb是基于bdb的,所以可以用bdb自带的热备份工具备份
Java代码
  1. [root@srv willko]# /usr/local/BerkeleyDB.4.7/bin/db_hotbackup -h /data/21201/ -b ./bak/   
  2. -h是数据的目录   
  3. -b是备份的目录  

恢复的话,启动memcacedb的数据目录设置成备份目录就可以了

2.单机模式crash恢复
bdb的事务处理和很多事物引擎相似,都是先写日志,数据先保存在内存。所以crash以后,可以通过日志来恢复。启动memcachedb的时候,可以使用-C选项来设置checkpoint的间隔时间,如果设置得太长,恢复时间越长。
Java代码
  1. /usr/local/BerkeleyDB.4.7/bin/db_recover -cf -h /data/21201/   
  2. -h是你的数据目录  

模拟crash
Java代码
  1. [root@srv willko]# memcachedb -u willko -p 21201 -d -r -H /data/21201/ -v >/data/21201.log 2>&1  -P /data/21201/21201.pid   
  2. [root@srv willko]# telnet localhost 21201  
  3. Trying 127.0.0.1...   
  4. Connected to localhost.   
  5. Escape character is '^]'.   
  6. set t 0 0 4    
  7. hhhh       #设置键为t,值为hhhh的   
  8. STORED   
  9. get t   
  10. VALUE t 0 4  
  11. hhhh   
  12. END   
  13. quit   
  14. Connection closed by foreign host.   
  15. [root@srv willko]# kill -9 `cat /data/21201/21201.pid ` #用-9来模拟crash   
  16. [root@srv willko]# /usr/local/BerkeleyDB.4.7/bin/db_recover -cf -h /data/21201/     
  17. recovery 100% complete   
  18. [root@srv willko]# memcachedb -u willko -p 21201 -d -r -H /data/21201/ -v >/data/21201.log 2>&1  -P /data/21201/21201.pid   
  19. [root@srv willko]# telnet localhost 21201  
  20. Trying 127.0.0.1...   
  21. Connected to localhost.   
  22. Escape character is '^]'.   
  23. get t   
  24. VALUE t 0 4  
  25. hhhh #还可以获得crash前设置的值   
  26. END   
  27. quit   
  28. Connection closed by foreign host.   
  29. [root@srv willko]#   


3.主从模式的crash恢复
主从模式下可以考虑启用-N选项来提高性能,如果不是用-N,日志是实时写到硬盘,这也是为什么crash以后可以通过日志恢复的原因。
但是如果使用-N来提高性能是有代价的,也就是日志不实时写硬盘,那crash以后无法保证完全恢复,没写入硬盘的数据无法通过日志恢复。但是如果你做了主从模式,那就无需担心,因为当事务提交以后,会马上同步到slave。
也就是说使用-N选项后,crash后通过slave来恢复。

六、一点抱怨
目前,持久存储系统产品非常的多,我觉得未来的持久存储肯定不只提供hash table存储,还应该把加入list、tree等的支持。这些都可以扩大持久存储系统的应用场景,未来持久存储系统成熟的时候,将会大规模代替RMDB。
最近,有个亮点产品出现,叫redis,目前还只是beta。