正文

hbase添加列簇，hbase的列建议多少

IP云V管理员/2023-08-25/1 阅读

08/25

小程序：扫一扫查出行
【扫一扫了解最新限行尾号】
复制小程序

HBASE之创建表、插入值、表结构查看

对表的创建、删除、显示以及修改等，可以用HBaseAdmin，一旦创建了表，那么可以通过HTable的实例来访问表，每次可以往表里增加数据。

Database，是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。

两种方式：一，建立一个hive和hbase公用的表，这样可以使用hive操作hbase的表，但是插入数据较慢，不建议这样做。二，手写mapreduce，把hive里面的数据转换为hfile，然后倒入。

存储时，数据按照RowKey的字典序(byte order)排序存储。设计RowKey时，要充分排序存储这个特性，将经常一起读取的行存储放到一起。(位置相关性)Column Family 列族：HBASE表中的每个列，都归属于某个列族。

HBase性能优化-Rowkey&列族设计

必须在设计上保证RowKey的唯一性。由于在HBase中数据存储是Key-Value形式，若向HBase中同一张表插入相同RowKey的数据，则原先存在的数据会被新的数据覆盖。设计的RowKey应均匀的分布在各个HBase节点上，避免数据热点现象。

必须在设计上保证RowKey的唯一性。由于在HBase中数据存储是Key-Value形式，若向HBase中同一张表插入相同RowKey的数据，则原先存在的数据会被新的数据覆盖。设计的RowKey应均匀的分布在各个HBase节点上，避免数据热点现象。

我这里只分了三个region，用hbase shell命令创建表，设置预分区数量为3 下图中，可以看到，预分区以后，数据的读写访问请求数量均匀分布在3台RegionServer上，避免了热点问题。

hbase怎么用?

1、HBase利用Hadoop HDFS作为其文件存储系统，利用Hadoop的MapReduce来处理HBase中的海量数据，利用Zookeeper作为协调工具。

2、目前主流的数据库或者NoSQL要么在CAP里面选择AP，比较典型的例子是Cassandra，要么选择CP比如HBase，这两个是目前用得非常多的NoSQL的实现。

3、用户画像比如大型的视频网站，电商平台产生的用户点击行为、浏览行为等等存储在HBase中为后续的智能推荐做数据支撑。

4、HBase主要用ZooKeeper来实现HMaster选举与主备切换、系统容错、RootRegion管理、Region状态管理和分布式SplitWAL任务管理等。

请描述怎样才能获得hbase表中哪些列能实现索引?为什么?

方法如下：rowkey是行的主键，Hbase支持3种检索方式，通过单个Rowkey访问，按照某个Rowkey键值进行get操作，获取唯一一条记录。通过Rowkey的range进行scan，通过设置startRowKey和endRowKey，在这个范围内进行扫描。

通过单个RowKey访问(get)通过RowKey的range（正则）(like)全表扫描(scan)RowKey行键 (RowKey)可以是任意字符串(最大长度是64KB，实际应用中长度一般为 10-100bytes)，在HBASE内部，RowKey保存为字节数组。

HBase是一个分布式的、面向列的开源数据库，具有高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。

hbase的region是按行划分，而非按列，如果你读取指定一行的所有列数据，regionServer虽然无法保证你的所有数据都在一个HFile中，但是至少是在一个Region中。

hbase添加列簇的介绍就聊到这里吧，感谢你花时间阅读本站内容，更多关于hbase的列建议多少、hbase添加列簇的信息别忘了在本站进行查找喔。

相关阅读

目录[+]