利用Tokyo Tyrant构建兼容Memcached协议、支持故障转移、高并发的分布式key-value持久存储系统[原创] - 回忆未来[张宴] - 服务器系统架构与底层研发

来源:百度文库 编辑:神马文学网 时间:2024/04/28 21:14:22
[文章作者:张宴 本文版本:v1.4 最后修改:2010.06.11 转载请注明原文链接:http://blog.s135.com/read.php/362/]

  Tokyo Cabinet 是日本人 平林幹雄 开发的一款 DBM 数据库,该数据库读写非常快,哈希模式写入100万条数据只需0.643秒,读取100万条数据只需0.773秒,是 Berkeley DB 等 DBM 的几倍。

  



  Tokyo Tyrant 是由同一作者开发的 Tokyo Cabinet 数据库网络接口。它拥有Memcached兼容协议,也可以通过HTTP协议进行数据交换。

  Tokyo Tyrant 加上 Tokyo Cabinet,构成了一款支持高并发的分布式持久存储系统,对任何原有Memcached客户端来讲,可以将Tokyo Tyrant看成是一个Memcached,但是,它的数据是可以持久存储的。这一点,跟新浪的Memcachedb性质一样。

  相比Memcachedb而言,Tokyo Tyrant具有以下优势:

  1、故障转移:Tokyo Tyrant支持双机互为主辅模式,主辅库均可读写,而Memcachedb目前支持类似MySQL主辅库同步的方式实现读写分离,支持“主服务器可读写、辅助服务器只读”模式。

  

这里使用 $memcache->addServer 而不是 $memcache->connect 去连接 TokyoTyrant 服务器,是因为当 Memcache 客户端使用 addServer 服务器池时,是根据“crc32(key) %current_server_num”哈希算法将 key 哈希到不同的服务器的,PHP、C 和 python的客户端都是如此的算法。Memcache 客户端的 addserver 具有故障转移机制,当 addserver 了2台 Memcached服务器,而其中1台宕机了,那么 current_server_num 会由原先的2变成1。

  引用 memcached 官方网站和 PHP 手册中的两段话:
引用http://www.danga.com/memcached/
If a host goes down, the API re-maps that dead host's requests onto the servers that are available.

http://cn.php.net/manual/zh/function.Memcache-addServer.php
Failovermay occur at any stage in any of the methods, as long as other serversare available the request the user won't notice. Any kind of socket orMemcached server level errors (except out-of-memory) may trigger thefailover. Normal client errors such as adding an existing key will nottrigger a failover.



  2、日志文件体积小:Tokyo Tyrant用于主辅同步的日志文件比较小,大约是数据库文件的1.3倍,而Memcachedb的同步日志文件非常大,如果不定期清理,很容易将磁盘写满。



  3、超大数据量下表现出色:
wget http://www.1978th.net/tokyocabinet/tokyocabinet-1.4.45.tar.gz
tar zxvf tokyocabinet-1.4.45.tar.gz
cd tokyocabinet-1.4.45/
./configure
#注:在32位Linux操作系统上编译Tokyo cabinet,请使用./configure --enable-off64代替./configure,可以使数据库文件突破2GB的限制。
#./configure --enable-off64
make
make install
cd ../

  2、然后编译安装tokyotyrant
wget http://www.1978th.net/tokyotyrant/tokyotyrant-1.1.40.tar.gz
tar zxvf tokyotyrant-1.1.40.tar.gz
cd tokyotyrant-1.1.40/
./configure
make
make install
cd ../



  二、配置
  1、创建tokyotyrant数据文件存放目录
mkdir -p /ttserver/

  2、启动tokyotyrant的主进程(ttserver)
  (1)、单机模式
ulimit -SHn 51200
ttserver-host 127.0.0.1 -port 11211 -thnum 8 -dmn -pid /ttserver/ttserver.pid-log /ttserver/ttserver.log -le -ulog /ttserver/ -ulim 128m -sid 1 -rts/ttserver/ttserver.rts/ttserver/database.tcb#lmemb=1024#nmemb=2048#bnum=10000000

  (2)、双机互为主辅模式
  服务器192.168.1.91:
ulimit -SHn 51200
ttserver-host 192.168.1.91 -port 11211 -thnum 8 -dmn -pid/ttserver/ttserver.pid -log /ttserver/ttserver.log -le -ulog /ttserver/-ulim 128m -sid 91 -mhost 192.168.1.92 -mport 11211 -rts/ttserver/ttserver.rts/ttserver/database.tcb#lmemb=1024#nmemb=2048#bnum=10000000

  服务器192.168.1.92:
ulimit -SHn 51200
ttserver-host 192.168.1.92 -port 11211 -thnum 8 -dmn -pid/ttserver/ttserver.pid -log /ttserver/ttserver.log -le -ulog /ttserver/-ulim 128m -sid 92 -mhost 192.168.1.91 -mport 11211 -rts/ttserver/ttserver.rts/ttserver/database.tcb#lmemb=1024#nmemb=2048#bnum=10000000

  (3)、参数说明
ttserver [-host name] [-port num] [-thnum num] [-tout num] [-dmn][-pid path] [-log path] [-ld|-le] [-ulog path] [-ulim num] [-uas] [-sidnum] [-mhost name] [-mport num] [-rts path] [dbname]

  -host name : 指定需要绑定的服务器域名或IP地址。默认绑定这台服务器上的所有IP地址。
  -port num : 指定需要绑定的端口号。默认端口号为1978
  -thnum num : 指定线程数。默认为8个线程。
  -tout num : 指定每个会话的超时时间(单位为秒)。默认永不超时。
  -dmn : 以守护进程方式运行。
  -pid path : 输出进程ID到指定文件(这里指定文件名)。
  -log path : 输出日志信息到指定文件(这里指定文件名)。
  -ld : 在日志文件中还记录DEBUG调试信息。
  -le : 在日志文件中仅记录错误信息。
  -ulog path : 指定同步日志文件存放路径(这里指定目录名)。
  -ulim num : 指定每个同步日志文件的大小(例如128m)。
  -uas : 使用异步IO记录更新日志(使用此项会减少磁盘IO消耗,但是数据会先放在内存中,不会立即写入磁盘,如果重启服务器或ttserver进程被kill掉,将导致部分数据丢失。一般情况下不建议使用)。
  -sid num : 指定服务器ID号(当使用主辅模式时,每台ttserver需要不同的ID号)
  -mhost name : 指定主辅同步模式下,主服务器的域名或IP地址。
  -mport num : 指定主辅同步模式下,主服务器的端口号。
  -rts path : 指定用来存放同步时间戳的文件名。

  如果使用的是哈希数据库,可以指定参数“#bnum=xxx”来提高性能。它可以指定bucket存储桶的数量。例如指定“#bnum=1000000”,就可以将最新最热的100万条记录缓存在内存中:
ttserver-host 127.0.0.1 -port 11211 -thnum 8 -dmn -pid /ttserver/ttserver.pid-log /ttserver/ttserver.log -le -ulog /ttserver/ -ulim 128m -sid 1 -rts/ttserver/ttserver.rts /ttserver/database.tch#bnum=1000000

  如果大量的客户端访问ttserver,请确保文件描述符够用。许多服务器的默认文件描述符为1024,可以在启动ttserver前使用ulimit命令提高这项值。例如:
ulimit -SHn 51200

  3、停止tokyotyrant(ttserver)
ps -ef | grep ttserver
  找到ttserver的进程号并kill,例如:
kill -TERM 2159



  三、调用
  1、任何Memcached客户端均可直接调用tokyotyrant。

  2、还可以通过HTTP方式调用,下面以Linux的curl命令为例,介绍如何操作tokyotyrant:
  (1)、写数据,将数据“value”写入到“key”中:
curl -X PUT http://127.0.0.1:11211/key -d "value"

  (2)、读数据,读取“key”中数据:
curl http://127.0.0.1:11211/key

  (3)、删数据,删除“key”:
curl -X DELETE http://127.0.0.1:11211/key
利用Tokyo Tyrant构建兼容Memcached协议、支持故障转移、高并发的分布式key-value持久存储系统[原创] - 回忆未来[张宴] - 服务器系统架构与底层研发 利用Tokyo Tyrant构建兼容Memcached协议、支持故障转移、高并发的分布式key-value持久存储系统[原创] - 回忆未来[张宴] - 服务器系统架构与底层研发 查看Apache并发请求数及其TCP连接状态[原创] - 回忆未来[张宴] - 服务器系统架构与底层研发 Flare-兼容Memcached协议的分布式key/value存储系统 - 张沈鹏,在路上... - JavaEye技术网站 亿级数据的高并发通用搜索引擎架构设计[原创] - 回忆未来[张宴] - 服务器系统架构与底... 基于Sphinx MySQL的千万级数据全文检索(搜索引擎)架构设计[原创] - 回忆未来[张宴] - 服务器系统架构与底层研发 一些分布式key/value存储系统的比较 一些分布式key/value存储系统的比较 百度、新浪、Mixi、Apache社区赞助的开源key-value分布式存储系统 分布式缓存系统Memcached简介与实践 分布式缓存系统memcached简介与实践 说说大型高并发高负载网站的系统架构 大型高并发高负载网站的系统架构 说说大型高并发高负载网站的系统架构 说说大型高并发高负载网站的系统架构 分布式缓存系统Memcached简介与实践 - 戏水的技术点点 - 博客园 分布式缓存系统memcached简介与实践 - 51CTO.COM 性能强劲的Tokyo Cabinet 和 Tokyo Tyrant [转载]说说大型高并发高负载网站的系统架构 - jiangxinyanyu的专栏 - CS... 说说大型高并发高负载网站的系统架构 - elimago的专栏 - CSDN博客 [转载]说说大型高并发高负载网站的系统架构 大型高并发高负载网站的系统架构-Web开发 亿级数据的高并发通用搜索引擎架构设计[原创] 说说大型高并发高负载网站的系统架构(更新)[Michael] - 我的BT下载实验室 - BlogJava