Hive的数据类型

Hive的内置数据类型可以分为两大类:(1)、基础数据类型;(2)、复杂数据类型。其中,基础数据类型包括:
TINYINT,SMALLINT,INT,BIGINT,BOOLEAN,FLOAT,DOUBLE,STRING,BINARY,TIMESTAMP,DECIMAL,CHAR,VARCHAR,DATE。下面的表格列出这些基础类型所占的字节以及从什么版本开始支持这些类型。数据类型所占字节开始支持版本TINYINT1byte,-128 ~ 127SMALLINT2byte,-32,768 ~ 32,767INT4byte,-2,147,483,648 ~ 2,147,483,647BIGINT8byte,-9,223,372,036,854,775,808 ~ 9,223,372,036,854,775,807BOOLEANFLOAT4byte单精度DOUBLE8byte双精度STRINGBINARY从Hive0.8.0开始支持TIMESTAMP从Hive0.8.0开始支持DECIMAL从Hive0.11.0开始支持CHAR从Hive0.13.0开始支持VARCHAR从Hive0.12.0开始支持DATE从Hive0.12.0开始支持
复杂类型包括ARRAY,MAP,STRUCT,UNION,这些复杂类型是由基础类型组成的。
ARRAY :ARRAY类型是由一系列相同数据类型元素组成的,这些元素可以通过下标来访问比如有一个ARRAY类型的变量fruits,它是由['apple','orange','mango']组成,那么可以通过fruits[1]来访问orange; 
MAP :MAP包含key->value键值对,可以通过key来访问元素。比如”userlist”是一个map类型,其中username是key;password是value,那么我们可以通过userlist['username']来得到这个用户对应的password; 
STRUCT :STRUCT可以包含不同数据类型的元素。这些元素可以通过点的方式来得到,比如user是一个STRUCT类型,那么可以通过user.address得到这个用户的地址。 
UNION : UNIONTYPE ,他是从Hive 0.7.0开始支持的。

0 个评论

要回复文章请先登录注册