hbase检索指定列，hbase 检索

小程序：扫一扫查出行
【扫一扫了解最新限行尾号】
复制小程序

hbase(分布式、可扩展的NoSQL数据库)

HBase是一种分布式、可扩展的NoSQL数据库，它是基于Hadoop的HDFS文件系统构建的。HBase被设计用来处理海量数据，并提供高可靠性、高性能的读写操作。它采用了分布式存储和计算的方式，可以在数千台服务器上存储和处理PB级别的数据。

HBase是一个基于Apache Hadoop的面向列的NoSQL数据库，是Google BigTable的开源实现。它运行在HDFS之上，为Hadoop提供类似于BigTable规模的服务。HBase针对半结构化数据，是一个多版本的、可伸缩的、高可靠的、高性能的、分布式的和面向列的动态模式数据库。

深入了解 HBase：NoSQL 数据库的魅力与核心原理HBase，这个强大的分布式 NoSQL 数据库，凭借其在大数据存储、高并发写入和实时查询方面的卓越性能，成为数据处理领域的热门选择。它巧妙地将数据存储在 HDFS 上，实现了与传统数据库的不同之处。

怎样才能获知hbase表中哪些列能实现索引

1、全表扫描(scan)RowKey行键 (RowKey)可以是任意字符串(最大长度是64KB，实际应用中长度一般为 10-100bytes)，在HBASE内部，RowKey保存为字节数组。存储时，数据按照RowKey的字典序(byte order)排序存储。设计RowKey时，要充分排序存储这个特性，将经常一起读取的行存储放到一起。

2、同样地，在HBase中，当我们通过概念视图查询数据时，HBase会在底层的物理存储结构中找到对应的数据并返回给我们。

3、这个用于查询HBase表返回单条记录结果的类是Result类。HBase中通过row和columns确定的为一个存贮单元称为cell，每个cell都保存着同一份数据的多个版本，版本通过时间戳来索引。HBase查询功能很简单，不支持join等复杂操作，不支持复杂的事物（行级事务）。HBase表一般有这样一个特点：大、面向列、稀疏。

4、LSM树，写入与读取的权衡当写入量大时，LSM树登场，通过顺序写入和内存-磁盘分层，牺牲部分读性能以换取高效的写入。HBase等NoSQL存储广泛采用LSM树，memtable、immutable memtable和SSTable的组合，让数据处理更为灵活高效。