`
willko
  • 浏览: 383766 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

轻量级持久存储系统 MemcacheDB

阅读更多
注:memcached可能简称mc,memcachedb可能简称mcdb
一、memcachedb是什么
mcdb是一款分布式键值持久存储系统,由新浪开源。mcdb基于mc协议,所以可以使用mc客户端直接使用,存储引擎方面使用Berkeley DB,支持主从复制模式。

二、memcachedb的应用场景
首先,我们从基本的数据存储的角度看mysql、memcached、memcachedb的区别和特点,当然它们肯定不只这点区别。

mc因为是非持久存储的,所以它的定位就是缓存。
而mcdb不是用来做缓存的,它是和mysql同个层次的东西。不一样的是,mcdb性能要比mysql高,而mysql检索功能比mcdb强。如果非要从缓存的角度看的话,那mc就是缓解mysql读压力,而mcdb则是缓解mysql写压力。
mcdb适合应用的场景:
1.浏览/点击/等统计,也可以局部代替mysql的count函数
2.标志,例如,JE的“我在干什么”功能
3.频繁写的地方,访客列表、评论之类的
之前,我写过的feed设计最大特点是使用mcdb来分散写压力,对sns来说动态产生太频繁了,全部写进mysql压力太大了,毕竟读/写1K和100K性能不是一样的,一台mcdb和一台mysql的成本不一样啊。。
虽然mcdb的方式比较简单,但是应用场合还是很丰富的,使用新产品要发散思维,充分发挥想象力~
不过重要的数据还是不建议使用,感觉还不是很放心。

三、安装
安装MemcacheDB之前需要安装Libevent和Berkeley Db
1.先安装libevent
下载地址: http://www.monkey.org/~provos/libevent/
tar zxvf libevent-1.4.9-stable.tar.gz 
cd libevent-1.4.9-stable 
./configure 
make 
make install

2.安装Berkeley Db
下载地址:http://www.oracle.com/technology/software/products/berkeley-db/index.html
tar xvzf db-4.7.25.tar.gz
cd db-4.7.25/
cd build_unix/
../dist/configure
make
make install

安装完后,编辑/etc/ld.so.conf把
usr/local/lib
/usr/local/BerkeleyDB.4.7/lib

3.安装memcachedb
下载地址:http://code.google.com/p/memcachedb/downloads/list
tar xvzf memcachedb-1.2.0.tar.gz
cd memcachedb-X.Y.Z
./configure --enable-threads
make
make install

4.创建数据保存点
mkdir /data/21201 -p
chown -R willko:wheel


四、使用
1.单机模式
memcachedb -u willko -p 21201 -d -r -H /data/21201/ -v >/data/21201.log 2>&1

2.主从模式
memcachedb -p 21210 -d -r -u willko -H /data/21210_m -N -R 127.0.0.1:31210 -M 
主服务器,用31210来同步数据

memcachedb -p 21211 -d -r -u willko -H /data/21211_from_local_21210 -N -R 127.0.0.1:31211 -O 127.0.0.1:31210 -S
从服务器,主从模式-R是必须设置的。

测试是否同步
[root@srv willko]# telnet 127.0.0.1 21210
Trying 127.0.0.1...
Connected to 127.0.0.1.
Escape character is '^]'.
set yy 0 0 4
yyyy
STORED
get yy
VALUE yy 0 4
yyyy
END

[root@srv willko]# telnet 127.0.0.1 21211
Trying 127.0.0.1...
Connected to 127.0.0.1.
Escape character is '^]'.
get yy
VALUE yy 0 4
yyyy
END

3.FYI:参数说明
memcachedb 1.2.0
-p <num>      TCP监听端口,默认是 21201
-U <num>      UDP监听端口,默认是 0,也就是关闭。
-s <file>     使用socket通讯,参数是设置unix socket的路径,此通讯方式只能本地使用
-a <mask>     unix socket文件的权限,默认是 0700
-l <ip_addr>  监听地址,默认是 INDRR_ANY
-d            以守护进程方式运行
-r            maximize core file limit
-u <username> 以<username>启动,只有root才能使用,因为memcachedb不允许以root启动
-c <num>      max simultaneous connections, default is 1024
-b <num>      item size smaller than <num> will use fast memory alloc, default is 512B
-v            打印错误和警告信息
-vv           打印整个交互过程
-h            print this help and exit
-i            print license info
-P <file>     进程PID保存路径,只能在守护进程方式下使用
-t <num>      线程数,默认是4
--------------------BerkeleyDB Options-------------------------------
-m <num>      in-memmory cache size of BerkeleyDB in megabytes, default is 64MB
-A <num>      underlying page size in bytes, default is 4096, (512B ~ 64KB, power-of-two)
-f <file>     数据文件名, 默认是 'data.db'
-H <dir>      数据保存目录,默认是 '/data1/memcachedb'
-B <db_type>  数据结构类型,有 'btree' 和 'hash'两种. 默认是 'btree'
-L <num>      log buffer size in kbytes, default is 32KB
-C <num>      每隔多少秒checkpoint, 设置为0将实时写入硬盘, 默认是5分钟
-T <num>      do memp_trickle every <num> seconds, 0 for disable, default is 30 seconds
-e <num>      percent of the pages in the cache that should be clean, default is 60%
-D <num>      do deadlock detecting every <num> millisecond, 0 for disable, default is 100ms
-N            设置 DB_TXN_NOSYNC 标志来改善性能,但是牺牲事务的持久性。默认为 关闭
--------------------Replication Options-------------------------------
-R            主服务器提供同步数据的地址和端口,主从模式必须设置
-O            从服务器同步源地址和端口
-M/-S         以主或从服务器启动
-n            允许从服务器数量, 默认是2台
-----------------------------------------------------------------------

关于-C和-N选项涉及到数据完整性,会在下面会说明一下

五、备份和恢复
1.热备份
因为memcachedb是基于bdb的,所以可以用bdb自带的热备份工具备份
[root@srv willko]# /usr/local/BerkeleyDB.4.7/bin/db_hotbackup -h /data/21201/ -b ./bak/
-h是数据的目录
-b是备份的目录

恢复的话,启动memcacedb的数据目录设置成备份目录就可以了

2.单机模式crash恢复
bdb的事务处理和很多事物引擎相似,都是先写日志,数据先保存在内存。所以crash以后,可以通过日志来恢复。启动memcachedb的时候,可以使用-C选项来设置checkpoint的间隔时间,如果设置得太长,恢复时间越长。
/usr/local/BerkeleyDB.4.7/bin/db_recover -cf -h /data/21201/
-h是你的数据目录

模拟crash
[root@srv willko]# memcachedb -u willko -p 21201 -d -r -H /data/21201/ -v >/data/21201.log 2>&1  -P /data/21201/21201.pid
[root@srv willko]# telnet localhost 21201
Trying 127.0.0.1...
Connected to localhost.
Escape character is '^]'.
set t 0 0 4 
hhhh       #设置键为t,值为hhhh的
STORED
get t
VALUE t 0 4
hhhh
END
quit
Connection closed by foreign host.
[root@srv willko]# kill -9 `cat /data/21201/21201.pid ` #用-9来模拟crash
[root@srv willko]# /usr/local/BerkeleyDB.4.7/bin/db_recover -cf -h /data/21201/  
recovery 100% complete
[root@srv willko]# memcachedb -u willko -p 21201 -d -r -H /data/21201/ -v >/data/21201.log 2>&1  -P /data/21201/21201.pid
[root@srv willko]# telnet localhost 21201
Trying 127.0.0.1...
Connected to localhost.
Escape character is '^]'.
get t
VALUE t 0 4
hhhh #还可以获得crash前设置的值
END
quit
Connection closed by foreign host.
[root@srv willko]# 


3.主从模式的crash恢复
主从模式下可以考虑启用-N选项来提高性能,如果不是用-N,日志是实时写到硬盘,这也是为什么crash以后可以通过日志恢复的原因。
但是如果使用-N来提高性能是有代价的,也就是日志不实时写硬盘,那crash以后无法保证完全恢复,没写入硬盘的数据无法通过日志恢复。但是如果你做了主从模式,那就无需担心,因为当事务提交以后,会马上同步到slave。
也就是说使用-N选项后,crash后通过slave来恢复。

六、一点抱怨
目前,持久存储系统产品非常的多,我觉得未来的持久存储肯定不只提供hash table存储,还应该把加入list、tree等的支持。这些都可以扩大持久存储系统的应用场景,未来持久存储系统成熟的时候,将会大规模代替RMDB。
最近,有个亮点产品出现,叫redis,目前还只是beta。

参考资料:
http://memcachedb.org/
http://memcachedb.org/memcachedb-guide-1.0.pdf
  • 大小: 5.6 KB
8
1
分享到:
评论
4 楼 willko 2009-06-22  
bachmozart:我看的源码是0.6和0.2版本,记得是这样

redis所谓的持久化不过就是一个内存数据结构+同步到文件的方式,比如发送命令道服务器,服务器就会将内存dump到文件,下次启动从文件装入内存,所以不能持久化太多东西,必须内存可以放下
3 楼 willko 2009-06-22  
bachmozart 写道
BDB本身提供了不同的存储数据结构,比如有B-TREE,HASH等等,屏蔽掉底层实现机制这样上层用起来也简单

redis只是一个面向网络的数据结构集合,就目前看,其存储能力有限,系统启动时要把全部持久化的内容加载到内存,也就是说其持久化的容量只能是内存容量范围允许的,所以从目前看,这东西功能的确有限

想请教下,redis是不是你有10g数据,这10g要一次性装载进入内存?
2 楼 willko 2009-05-26  
bachmozart 写道

BDB本身提供了不同的存储数据结构,比如有B-TREE,HASH等等,屏蔽掉底层实现机制这样上层用起来也简单

redis只是一个面向网络的数据结构集合,就目前看,其存储能力有限,系统启动时要把全部持久化的内容加载到内存,也就是说其持久化的容量只能是内存容量范围允许的,所以从目前看,这东西功能的确有限

我所说的数据结构是为了方便应用使用,而不是指底层的实现。
因为只是key-value,所以想实现链表之类的结构,节点的关系只能靠自己维护了。。。

例如,
sohu社区的论坛列表就是通过mc+list来实现的,这样的话论坛列表的排序不用order by来实现。而且也可以使用缓存,,当有新帖子发布的时候,只需维护节点关系就好了。这样做,不会因为帖子的频繁浮动导致缓存频繁失效。
而最近访客的实现,我是通过fixed-size array+指针来模拟双向list的,,这样做有个缺点,,就是很难做到重复访问的检测,因为复杂度是o(n)。不知道je是怎么实现的。

越是简单的东西,使用越考验功夫,所以我还是觉得提供数据结构接口是有必要的,,至于它底层怎么实现,,这个没所谓。。

在大牛面前班门弄斧了 ^_^
1 楼 bachmozart 2009-05-26  
BDB本身提供了不同的存储数据结构,比如有B-TREE,HASH等等,屏蔽掉底层实现机制这样上层用起来也简单

redis只是一个面向网络的数据结构集合,就目前看,其存储能力有限,系统启动时要把全部持久化的内容加载到内存,也就是说其持久化的容量只能是内存容量范围允许的,所以从目前看,这东西功能的确有限

相关推荐

    memcachedb

    memcachedb, memcachedb

    memcachedb 手册

    memcachedb 手册 pdf ,很详细,希望能帮到你们

    memcachedb-1.2.0.tar.gz

    memcachedb-1.2.0.tar.gz

    cpp-分布式缓存服务器memcachedb

    memcachedb是 一个由新浪网的开发人员开放出来的开源项目,给memcached分布式缓存服务器添加了Berkeley DB的持久化存储机制和异步主辅复制机制

    Ubuntu 9.04中安装Memcachedb

    NULL 博文链接:https://chinaestone.iteye.com/blog/521674

    Memcached VS Redis

    Memcached VS Redis:2者究竟有哪些区别,什么场景下应用那种类型的缓存服务器。

    NoSQL数据库笔谈

    1. 序 2. 思想篇 CAP 最终一致性 变体 BASE 其他 I/O的五分钟法则 不要删除数据 RAM是硬盘,硬盘是磁带 Amdahl定律和Gustafson定律 万兆以太网 3. 手段篇 一致性哈希 ...持久化设计 5. 应用篇 eBay 架构经验

    memcldj:将JSON Blob快速加载到memcache或memcachedb中

    自述文件 快速将JSON Blob加载到或。 给定一个文件,请使用JSON文档中的值作为键,并将其值设置为JSON Blob。 注意:不支持嵌套键。 安装 ...或通过安装。 ... -addr="127.0.0.1:11211": hostport of memcache ...

    大数据云计算技术系列 NoSQL数据库学习教程(共71页).pdf

    4 MemcacheDB 4 Mnesia 4 LightCloud 4 HamsterDB 4 Flare 4 最终一致性Key Value存储 4 Amazon之Dynamo 4 功能特色 4 架构特色 4 BeansDB 4 简介 4 更新 4 特性 4 性能 4 Nuclear 4 两个设计上的Tips 4 Voldemort 4...

    memCached学习

    MySQL Memcache_engine的安装...Memcache_engine是一个MySQL 5.1数据库的存储引擎,它能够让用户通过标准的SQL语句(SELECT/UPDATE/INSERTE/DELETE)访问Memcached(还支持新浪的Memcachedb、dbcached)中存放的数据。

    开源内存数据库的调研与分析.doc

    内存数据库的优劣对比,主要包括fastdb,memcachedb,mangodb等,也涉及到了数据库的设计思路,已经性能比较。对于选择合适的内存数据库有一定的帮助吧。

    libevent-1.3e.tar.gz

    libevent是一个事件触发的网络库,适用于windows、linux、bsd等多种平台,内部使用select、epoll、kqueue等系统调用管理事件机制。著名分布式缓存软件memcached也是libevent based,而且libevent在使用上可以做到跨...

    3d3Paste:一个简单的 pastebin 和 shorturl 组合服务

    对于粘贴和 URL 的存储,我们使用带有 cmemcached python 插件的 memcachedb 和 memcached,但是我们正在努力使其更加模块化。 所有粘贴和 URL 都使用 MsgPack 进行序列化。 安装和配置 目前,您需要 Python 2.7 ...

    《Redis实战》

    1.1 Key-Value存储系统简介 .................................................................................................... 6 1.1.1 Voldemort ..........................................................

Global site tag (gtag.js) - Google Analytics