正文
从hbase查询用到的工具,hbase快速查询的原理
小程序:扫一扫查出行
【扫一扫了解最新限行尾号】
复制小程序
【扫一扫了解最新限行尾号】
复制小程序
操作hbase有哪些工具
HBase Shell:HBase自带的命令行工具,可以进行数据的增删改查、表的创建和删除等操作。 HBase Web UI:HBase自带的Web界面,可以进行表的创建和删除、数据的查询和导出等操作。
HBase的命令行工具,适合HBase管理使用,可以使用shell命令来查询HBase中数据的详细情况。
可以对HBase进行性能监视的软件有:ApacheHBasePerformanceMonitoring、HBaseThrift2ServerMetrics、HBaseGrafanaDashboard。
Hive的定位是数据仓库,虽然也有增删改查,但其删改查对应的是整张表而不是单行数据,查询的延迟较高。其本质是更加方便的使用mr的威力来进行离线分析的一个数据分析工具。
Hbase统计表总行数的三种方式
有时候我们需要统计HBase表的行数,一般要么是写MR程序,要么是写SQL。
访问hbase数据库表中的行一共有三种方式,分别是:通过单个行健访问、通过一个行健的区间来访问、全表扫描。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。
与nosql数据库们一样,RowKey是用来检索记录的主键。
Hbase是不支持条件查询、聚集操作和Order by查询的!Hbase查询方式只有三种:根据主键,根据主键范围和全表。
我们知道对于hbase的查询,最快的方式就是get,这样的话,可以迅速定位到一条数据。而get查询其实就是scan的特殊情况,只是startRow和endRow一样。所以此时我们可以采用scan+startRow+endRow的方式进行操作。
描述hbase的scan和get功能以及实现的异同
1、技术实现上,get 是特殊的 scan,scan 的条数为 1。scan 并没有设计为一次 RPC 请求,因为一次 scan 操作的扫描结果可能数据量非常大。
2、通过Scan可以对表中的行进行浏览,得到每一行的信息,比如列名,时间戳等,Scan相当于一个游标,通过next()来浏览下一个,通过调用HTable.getScanner(Scan)来返回一个ResultScanner对象。
3、HBase 有四种典型的数据API操作类型,分别为 get、scan 和put、delete,其中 get 和 scan 属于 read 类型,put、delete属于write类型。默认场景下,HBase 只提供一个队列,所有请求都会进入该队列进行优先级排序。
4、在HBase中 一个row对应的相同的列只会有一行。
从hbase查询用到的工具的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于hbase快速查询的原理、从hbase查询用到的工具的信息别忘了在本站进行查找喔。