正文
Hbase常用的shell实验总结,hbase shell的基本操作
小程序:扫一扫查出行
【扫一扫了解最新限行尾号】
复制小程序
【扫一扫了解最新限行尾号】
复制小程序
Hbase知识点总结?
容量大:HBase 分布式数据库中的表可以存储成千上万的行和列组成的数据。面向列:HBase 的数据在表中是按照某列存储的,根据数据动态地增加列,并且可以单独对列进行各种操作。
a. 创建一张test的表 b. 接着创建自增序列 test_sequence c. 通过自增序列,写入数据信息 注意事项:删除test表时,最好连带删除 test_sequence。先用HBase命令行启用表,然后再进行删除,或者查询。
hbase:适合大型数据存储,其作用可以类比于传统数据库的作用,主要关注的数据的存取。hive:适合大数据的管理,统计,处理,其作用类比于传统的数据仓库,主要关注的数据的处理。
《HBase入门与实践》:全书共分为3个部分。前两个部分分别介绍了分布式系统和大规模数据处理的发展历史;第三部分通过真实的应用和代码示例以及支持这些实践技巧的理论知识,进一步探索HBase的一些实用技术。
HBase分布式存储:HBase-HadoopDatabase是一个高可靠性,高性能,面向列,可伸缩的分布式存储系统,利用HBase技术可在廉价PC上搭建起大规模结构化存储集群,介绍其入门的基础知识,以及设计原则,需实际操作才能熟练。
HBASE之创建表、插入值、表结构查看
对表的创建、删除、显示以及修改等,可以用HBaseAdmin,一旦创建了表,那么可以通过HTable的实例来访问表,每次可以往表里增加数据。
创建表 使用HBaseShell或HBaseAPI可以创建表,需要指定表的名称和列族。例如,创建一个名为student的表,包含一个列族info。插入数据 使用Put命令可以向表中插入数据,需要指定行键、列族、列和值。
全表扫描(scan)RowKey行键 (RowKey)可以是任意字符串(最大长度是64KB,实际应用中长度一般为 10-100bytes),在HBASE内部,RowKey保存为字节数组。存储时,数据按照RowKey的字典序(byte order)排序存储。
两种方式:一,建立一个hive和hbase公用的表,这样可以使用hive操作hbase的表,但是插入数据较慢,不建议这样做。二,手写mapreduce,把hive里面的数据转换为hfile,然后倒入。
hbaseshell命令显示已杀死
1、首先连接上linux主机,进入命令行状态。输入:ps -ef,按回车,查询进程列表。选择需要终止的进程,例如PID为9977的进程,则命令行输入:kill 9977,按回车即可终止该进程。
2、但是,如果命令执行时间超过了设置的最大时间限制,由于 HBase Shell 本身不支持命令的强制中断,因此仍然会执行完毕。
3、直接关闭再次重启就好。解决linux光标的方法,只需要在命令行中输入隐藏光标是echo -e \033[?25l显示光标是echo -e \033[?25h。如果输入代码后还是没有反应建议直接关机重启或者卸载重装。
4、命令可以在显示的右下角有一个方框的图标,点击图标往下划可以找到命令的按钮,点击就可以启动命令了。
5、然后将该输出的结果作为下一个命令(kill:杀死进程)的输入,即可以实现该功能。不过具体的做法,我由于已经很长时间没有编写SHELL程序了,所以现在已经忘记了,但是我提供的思路肯定是正确的,是肯定可以实现的。呵呵呵。
hbaseshell转换时间类型
布尔类型(Boolean):HBase支持的布尔类型只有true和false两个取值。日期类型(Date):HBase中的日期类型表示一个日期,它是以毫秒为单位存储的。
时间戳的类型是 64位整型。时间戳可以由hbase(在数据写入时自动 )赋值,此时时间戳是精确到毫秒的当前系统时间。时间戳也可以由客户显式赋值。如果应用程序要避免数据版本冲突,就必须自己生成具有唯一性的时间戳。
在linux Shell中并没有毫秒级的时间单位,只有秒和纳秒。所以在shell中可以获取秒级时间戳,但是不能获取毫秒级时间戳。有时候确实需要毫秒级时间戳,于是使用秒和纳秒的时间戳来组合一下。
命令可以在显示的右下角有一个方框的图标,点击图标往下划可以找到命令的按钮,点击就可以启动命令了。
关于Hbase常用的shell实验总结和hbase shell的基本操作的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。