使用HBase Shell 接口的注意事项

总结培训当天反馈的问题,新手们需要注意几点:
问题1,  HBase(可以理解为不需要建'name'列,hbase自动建立一个用于存储“行标识”的“列”),举例如下:
例一:
create 'employees', 'SN', 'department', 'address'   这个employees表的结构将为:
row_id     SN    department    address
--------------------------------------------------
共有四列,第一列用于标识行, 这里你可以当做‘name’来用
插入数据: put 'employees', 'HongKong', 'SN:', '20080501' 
注意是put,不是Ruby的puts
对比的情况:
创建表: create 'employees', 'name', 'SN', 'department', 'address'
此时数据为: 除了标识本身外,还有一个name列,下面简单设置为一样的值。
put 'employees', 'HongKong', 'name:', 'HongKong'
例二:
网上流行资料的例子:

一个存储学生成绩的表:

name grad      course:math   course:art
Tom    1                87                    97
Jerry   2            100                  80
这里grad对于表来说是一个列,course对于表来说是一个列族,这个列族由两个列组成:math和art,当然我们可以根据我们的需要在course中建立更多的列族,如computer,physics等相应的列添加入course列族.  建立一个表格 scores 具有两个列族grad 和courese
hbase(main):002:0> create 'scores', 'grade', 'course'
0 row(s) in 4.1610 seconds
分析,请注意,为什么创建的表是没有“name”这一列呢? 其实这里的name列就对应例一的row_id,不用显式创建的。
导入数据为:  put 'scores', 'Tom', 'grade:', '1'     , Tom对应name 
问题2. 参数的警告说明
很多人开始都碰到类似 
hbase(main):034:0> put 'employees', 'HongKong', 'name:', 'Hongkong', 'SN:', '20080501'
ArgumentError: wrong number of arguments (6 for 5) 
hbase(main):033:0> put 'employees', 'Kong', 'name:' 'Kong'
ArgumentError: wrong number of arguments (3 for 4)
这是参数数量不对的说明, 请尤其注意逗号, 空格不能用来分隔参数的。 
以put为例,参数一般为5个, 6个 10个都报错。但为什么又有(3 for 4)呢?  5和4个的时候可以工作呢?  timestamp 是optional的。所以参数多的时候, 按照上限5报警,少的时候按照下限4报警。
put       Put a cell 'value' at specified table/row/column and optionally
           timestamp coordinates.  To put a cell value into table 't1' at
           row 'r1' under column 'c1' marked with the time 'ts1', do:

           hbase> put 't1', 'r1', 'c1', 'value', ts1 
问题3.  插入数据
hbase(main):030:0> put 'employees', 'Tom', 'name:' 'Tom', 'SN:', '20091101', 'department:', 'D&R', 'address:country', 'China', 'address:city', 'Beijing'
ArgumentError: wrong number of arguments (11 for 5)
怎么回事呢?  不要老想着SQL, put插入的Cell数据,  这么多一起来,当然报错咯 
问题4.  删除表必须先停,然后再删: To remove the table, you must first disable it before dropping it
hbase(main):025:0> disable 'test'
09/04/19 06:40:13 INFO client.HBaseAdmin: Disabled test
0 row(s) in 6.0426 seconds
hbase(main):026:0> drop 'test'
09/04/19 06:40:17 INFO client.HBaseAdmin: Deleted test 
问题5.  如何运行脚本文件
${HBASE_HOME}/bin/hbase shell PATH_TO_SCRIPT示例: 
./hbase shell /data/automation/create_import.hbase
--------------------------------------------------------------------------------------------
disable 'employees'
drop 'employees'

create 'employees', 'SN', 'department', 'address'
put 'employees', 'HongKong', 'SN:', '20080501189'
put 'employees', 'HongKong', 'department:', 'R&D'
put 'employees', 'HongKong', 'address:country', 'China'
put 'employees', 'HongKong', 'address:city', 'Beijing'
put 'employees', 'Cudynia', 'SN:', '20010807368'
put 'employees', 'Cudynia', 'department:', 'HR'
put 'employees', 'Cudynia', 'address:country', 'US'
put 'employees', 'Cudynia', 'address:city', 'San Francisco'

exit

0 个评论

要回复文章请先登录注册