-
Recent Posts
Archives
Categories
Blogroll
Meta
Category Archives: HBase
在 HBase 0.20.x 编程中,执行 new HBaseConfiguration() 是抛出XML分析异常
原因是有多个XML分析器,需要通过JVM指定一个属性来解决问题。 -Djavax.xml.parsers.DocumentBuilderFactory=com.sun.org.apache.xerces.\ internal.jaxp.DocumentBuilderFactoryImpl 使 用上面指定的分析器就不再抛出异常
Posted in HBase
Leave a comment
安装 HBase 0.20.x
我把HBase官方的文档译了一下,没完成,方便对比着看。 Requirements Java 1.6.x, preferably from Sun. Use the latest version available. Java 1.6.x ,sun ,最好是最新版 This version of HBase will only run on Hadoop 0.20.x. 指定的Hadoop版 本 ssh must be installed and sshd must be running to use Hadoop’s … Continue reading
Posted in HBase
Leave a comment
Hbase 数据模型
* 介绍 * 概览 * 行 * 列簇 * 时间戳 * 簇属性 * 实例 o 源ERD o HBase目标模型 介绍 HBase 的数据模型是继 Bigtable 数据模型的之后的克隆版,特别适用于密集的数据系统。由于关系型数据库的架构是基于单台机器的,无法获得高的伸缩性。例如,连接两个表的JOIN操作,在内存中完成,这就无法跨越网络。关系分布式数据库的公司,需要做很多重新设计的工作,这就是他们的许可证这个贵的原因。其他的可选方法是复制,而当从机写超载时,最后的选择是分表。在这个时候,数据的正则化是你在类中唯一记住要看的,这也是为什么数据模型要在纸上写得明明白白,还不是仅仅给你看的。 概览 看简单点,HBase可以概括成一个 Map<byte[], Map<byte[], Map<byte[], Map<Long, byte[]>>>。第一个Map是映射从 row keys 到 column families。第二个Map是映射从 column families 到他们的 column keys。第三个Map是映射从 … Continue reading
Posted in HBase
Leave a comment