hbase手动合并region，hbase数据合并过程

小程序：扫一扫查出行
【扫一扫了解最新限行尾号】
复制小程序

hbase如何关闭自动合并与压缩

在hmater主机上键入./start-hbase.sh命令启动数据库，不需要在其它节点执行。正常启动后在mater上有两个进程，HMaster和 HQuorumPeer；数据节点上有HRegionServer和HQuorumPeer进程。

在要卸载的子节点上，HBASE_HOME/bin目录下，执行 ./graceful_stop.sh 子节点的hostname，即可卸载子节点。该命令会自动关闭Load Balancer，然后Assigned Region，之后会将该节点关闭。

当 Region 管理的数据过多时，可以通过手动或自动的方式触发 HBase Split 将一个 Region 分裂成两个新的子 Region，并对父 Region 进行清除处理（不会立即清除）。

不矛盾，合并机制是为了对更新、删除后的数据进行有效管理，并释放资源；拆分是为了避免Region太大，致使Region所在节点因负载过重而宕机设定的机制。两者都是为了对大数据存储和管理进行优化而设定的机制，因此并不矛盾。

1、理想情况下，在不超过hbase.regionserver.global.memstore.upperLimit的情况下，Memstore应该尽可能多的使用内存(配置给Memstore部分的，而不是真个Heap的)。

2、MemStore 是 HBase 非常重要的组成部分，MemStore 作为 HBase 的写缓存，保存着数据的最近一次更新，同时是HBase能够实现高性能随机读写的重要组成。

3、regionServer 其实是hbase的服务，部署在一台物理服务器上，region有一点像关系型数据的分区，数据存放在region中，当然region下面还有很多结构，确切来说数据存放在memstore和hfile中。

1、问题解析：对于数据写入很快的集群，还需要特别关注一个参数：hbase.hstore.blockingStoreFiles，此参数表示如果当前hstore中文件数大于该值，系统将会强制执行compaction操作进行文件合并，合并的过程会阻塞整个hstore的写入。

2、HBase还引入了“协处理器”（coprocessors）这一概念，允许在HBase进程中执行用户代码。这基本上与关系型数据库中的触发和预存进程相同。目前，Cassandra还没有类似HBase协处理器的功能。

3、）第二种方向，由于HBase是开源的，所以可以对HBase本身机制进行完善与扩展，最终形成一个能够满足业务需要的稳定可用的HBase版本。

4、HBase依赖Zookeeper提供消息通信机制。与FUJITSU Cliq等商用大数据产品不同，HBase是Google Bigtable的开源实现，类似Google Bigtable利用GFS作为其文件存储系统。

HBase保存数据的流程有以下几个步骤：HBase表的列族在创建之初只有一个Region，随着插入数据的增多Region变得越来越大。

以fileServer为例，在使用默认的split策略--IncreasingToUpperBoundRegionSplitPolicy 的情况下，16个预分区Region，则单个Resion容量达到 min(32，50)，即32GB时分裂。

默认，HBase 在创建表的时候，会自动为表分配一个 Region，正处于混沌时期，start-end key 无边界，所有 RowKey 都往这个 Region里分配。

Hbase Split 是一个很重要的功能，HBase 通过把数据分配到一定数量的 Region 来达到负载均衡的。

hbase手动合并region的介绍就聊到这里吧，感谢你花时间阅读本站内容，更多关于hbase数据合并过程、hbase手动合并region的信息别忘了在本站进行查找喔。