Monthly Archives: April 2009

Hbase 数据模型

*  介绍 *  概览 *  行 *  列簇 *  时间戳 *  簇属性 *  实例 o  源ERD o  HBase目标模型 介绍 HBase 的数据模型是继 Bigtable 数据模型的之后的克隆版,特别适用于密集的数据系统。由于关系型数据库的架构是基于单台机器的,无法获得高的伸缩性。例如,连接两个表的JOIN操作,在内存中完成,这就无法跨越网络。关系分布式数据库的公司,需要做很多重新设计的工作,这就是他们的许可证这个贵的原因。其他的可选方法是复制,而当从机写超载时,最后的选择是分表。在这个时候,数据的正则化是你在类中唯一记住要看的,这也是为什么数据模型要在纸上写得明明白白,还不是仅仅给你看的。 概览 看简单点,HBase可以概括成一个 Map<byte[], Map<byte[], Map<byte[], Map<Long, byte[]>>>。第一个Map是映射从 row keys 到 column families。第二个Map是映射从 column families 到他们的 column keys。第三个Map是映射从 … Continue reading

Posted in HBase | Leave a comment