hive

hive

CDH里的HIVE GATEWAY角色是指什么东西?

hive macg 回复了问题 • 2 人关注 • 2 个回复 • 56 次浏览 • 2017-06-16 15:40 • 来自相关话题

sqoop导出hive到mysql问题

hive wangxiaolei 回复了问题 • 5 人关注 • 6 个回复 • 2518 次浏览 • 2017-06-02 11:31 • 来自相关话题

hive avro格式的表可以添加字段吗?

hadoop fish 回复了问题 • 2 人关注 • 1 个回复 • 64 次浏览 • 2017-05-27 16:35 • 来自相关话题

OutOfMemoryError: PermGen space 问题

hive 煢煢&菡萏 回复了问题 • 6 人关注 • 5 个回复 • 664 次浏览 • 2017-05-26 10:19 • 来自相关话题

升级hive2.1.1后语法异常

hive fish 回复了问题 • 2 人关注 • 1 个回复 • 61 次浏览 • 2017-05-22 10:46 • 来自相关话题

sqoop 从hive导入mysql中文出现乱码。

hive 叶落秋无声 回复了问题 • 4 人关注 • 2 个回复 • 1264 次浏览 • 2017-05-21 16:19 • 来自相关话题

求一个数据量很大的文件,行与行中某一个字段(列)的交集数

hive 开心就好_kxjh 回复了问题 • 2 人关注 • 2 个回复 • 94 次浏览 • 2017-05-17 14:29 • 来自相关话题

sql查询

hive 赵波 回复了问题 • 2 人关注 • 2 个回复 • 84 次浏览 • 2017-05-10 14:25 • 来自相关话题

大家使用spark thriftserver,用hive jdbc 连接发觉每一次执行sql,zk连接都不释放

hive fish 回复了问题 • 3 人关注 • 2 个回复 • 100 次浏览 • 2017-05-09 09:38 • 来自相关话题

sqoop 从mysql导入hive hive 表锁问题

sqoop fish 回复了问题 • 2 人关注 • 1 个回复 • 78 次浏览 • 2017-05-07 12:07 • 来自相关话题

hive-0.13.1-cdh5.2.0升级到 apache-hive-2.1.1后,启动hive报异常提示

回复

hive BingClouds 发起了问题 • 1 人关注 • 0 个回复 • 73 次浏览 • 2017-05-04 17:05 • 来自相关话题

本地运行Spark,创建HiveContext的时候报UnsatisfiedLinkError

hadoop wangxiaolei 回复了问题 • 2 人关注 • 1 个回复 • 91 次浏览 • 2017-05-04 12:23 • 来自相关话题

hive从csv文件导入hive表,数据行数不对应的问题。

hive wangxiaolei 回复了问题 • 2 人关注 • 1 个回复 • 90 次浏览 • 2017-04-24 15:41 • 来自相关话题

hive 非等值关联

回复

hive jsh0401 发起了问题 • 1 人关注 • 0 个回复 • 80 次浏览 • 2017-04-15 10:32 • 来自相关话题

启动hiveserver2后的问题

hive fish 回复了问题 • 3 人关注 • 2 个回复 • 140 次浏览 • 2017-03-31 19:36 • 来自相关话题

hive的启动问题。

hadoop fish 回复了问题 • 4 人关注 • 4 个回复 • 261 次浏览 • 2017-03-24 12:51 • 来自相关话题

第八课《8 数据分析引擎 Hive(第二部分)》

hive 李虎翼 回复了问题 • 12 人关注 • 14 个回复 • 291 次浏览 • 2017-03-11 14:41 • 来自相关话题

hive1.2升级到hive2.1

hive 李虎翼 回复了问题 • 2 人关注 • 1 个回复 • 157 次浏览 • 2017-03-11 14:40 • 来自相关话题

sqoop使用create-hive-table命令

hive fish 回复了问题 • 2 人关注 • 2 个回复 • 275 次浏览 • 2017-02-09 10:29 • 来自相关话题

条新动态, 点击查看
fish

fish 回答了问题 • 2015-10-22 09:54 • 18 个回复 不感兴趣

hive server2启动报错

赞同来自:

Cannot find hadoop installation: $HADOOP_HOME or $HADOOP_PREFIX must be set or hadoop must be in the path
是执行什么的时候报的错? 显示全部 »
Cannot find hadoop installation: $HADOOP_HOME or $HADOOP_PREFIX must be set or hadoop must be in the path
是执行什么的时候报的错?
fish

fish 回答了问题 • 2015-10-25 00:27 • 4 个回复 不感兴趣

使用sqoop从mysql导入数据到Hive报错

赞同来自:

这是apache hive1.1.1版本的一个问题: https://issues.apache.org/jira/browse/HIVE-10831
将你机器上的hive拷贝到我的环境中执行也会发生同样的问题。
 
换用apache hive 1.2.1 ... 显示全部 »
这是apache hive1.1.1版本的一个问题: https://issues.apache.org/jira/browse/HIVE-10831
将你机器上的hive拷贝到我的环境中执行也会发生同样的问题。
 
换用apache hive 1.2.1 或者 CDH版本的就可以正常工作。

CDH里的HIVE GATEWAY角色是指什么东西?

回复

hive macg 回复了问题 • 2 人关注 • 2 个回复 • 56 次浏览 • 2017-06-16 15:40 • 来自相关话题

sqoop导出hive到mysql问题

回复

hive wangxiaolei 回复了问题 • 5 人关注 • 6 个回复 • 2518 次浏览 • 2017-06-02 11:31 • 来自相关话题

hive avro格式的表可以添加字段吗?

回复

hadoop fish 回复了问题 • 2 人关注 • 1 个回复 • 64 次浏览 • 2017-05-27 16:35 • 来自相关话题

OutOfMemoryError: PermGen space 问题

回复

hive 煢煢&菡萏 回复了问题 • 6 人关注 • 5 个回复 • 664 次浏览 • 2017-05-26 10:19 • 来自相关话题

升级hive2.1.1后语法异常

回复

hive fish 回复了问题 • 2 人关注 • 1 个回复 • 61 次浏览 • 2017-05-22 10:46 • 来自相关话题

sqoop 从hive导入mysql中文出现乱码。

回复

hive 叶落秋无声 回复了问题 • 4 人关注 • 2 个回复 • 1264 次浏览 • 2017-05-21 16:19 • 来自相关话题

求一个数据量很大的文件,行与行中某一个字段(列)的交集数

回复

hive 开心就好_kxjh 回复了问题 • 2 人关注 • 2 个回复 • 94 次浏览 • 2017-05-17 14:29 • 来自相关话题

sql查询

回复

hive 赵波 回复了问题 • 2 人关注 • 2 个回复 • 84 次浏览 • 2017-05-10 14:25 • 来自相关话题

大家使用spark thriftserver,用hive jdbc 连接发觉每一次执行sql,zk连接都不释放

回复

hive fish 回复了问题 • 3 人关注 • 2 个回复 • 100 次浏览 • 2017-05-09 09:38 • 来自相关话题

sqoop 从mysql导入hive hive 表锁问题

回复

sqoop fish 回复了问题 • 2 人关注 • 1 个回复 • 78 次浏览 • 2017-05-07 12:07 • 来自相关话题

hive-0.13.1-cdh5.2.0升级到 apache-hive-2.1.1后,启动hive报异常提示

回复

hive BingClouds 发起了问题 • 1 人关注 • 0 个回复 • 73 次浏览 • 2017-05-04 17:05 • 来自相关话题

本地运行Spark,创建HiveContext的时候报UnsatisfiedLinkError

回复

hadoop wangxiaolei 回复了问题 • 2 人关注 • 1 个回复 • 91 次浏览 • 2017-05-04 12:23 • 来自相关话题

hive从csv文件导入hive表,数据行数不对应的问题。

回复

hive wangxiaolei 回复了问题 • 2 人关注 • 1 个回复 • 90 次浏览 • 2017-04-24 15:41 • 来自相关话题

hive 非等值关联

回复

hive jsh0401 发起了问题 • 1 人关注 • 0 个回复 • 80 次浏览 • 2017-04-15 10:32 • 来自相关话题

启动hiveserver2后的问题

回复

hive fish 回复了问题 • 3 人关注 • 2 个回复 • 140 次浏览 • 2017-03-31 19:36 • 来自相关话题

hive的启动问题。

回复

hadoop fish 回复了问题 • 4 人关注 • 4 个回复 • 261 次浏览 • 2017-03-24 12:51 • 来自相关话题

第八课《8 数据分析引擎 Hive(第二部分)》

回复

hive 李虎翼 回复了问题 • 12 人关注 • 14 个回复 • 291 次浏览 • 2017-03-11 14:41 • 来自相关话题

hive1.2升级到hive2.1

回复

hive 李虎翼 回复了问题 • 2 人关注 • 1 个回复 • 157 次浏览 • 2017-03-11 14:40 • 来自相关话题

sqoop使用create-hive-table命令

回复

hive fish 回复了问题 • 2 人关注 • 2 个回复 • 275 次浏览 • 2017-02-09 10:29 • 来自相关话题

Impala与Hive的比较

impala 唐半张 发表了文章 • 0 个评论 • 766 次浏览 • 2015-10-10 09:25 • 来自相关话题

1. Impala架构        Impala是Cloudera在受到Google的Dremel启发下开发的实时交互SQL大数据查询工具,Impala没有再使用缓慢的Hive+MapReduce批处理,而是通过使用与商用并行关系数据库中类似的分布...
查看更多

Hive安装之本地独立模式

hive 唐半张 发表了文章 • 0 个评论 • 525 次浏览 • 2015-10-09 10:27 • 来自相关话题

本地独立模式:在本地安装mysql数据库,然后hive将元数据存放在mysql中。实验前提条件:已经成功安装了hadoop集群(不管是伪分布式还是完全分布式)。 本人实验的hadoop版本为1.2.1,其安装目录为/usr/hadoop-1.2.1 ,并...
查看更多

order by && sort by && distribute by && cluster by 区分

hive 唐半张 发表了文章 • 0 个评论 • 692 次浏览 • 2015-10-09 09:37 • 来自相关话题

order by 1、order by会对输入做全局排序,因此只有一个reducer(多个reducer无法保证全局有序);     只有一个reducer,会导致当输入规模较大时,需要较长的计算时间,速度会非常慢; 2、hive.mapred....
查看更多

Hive的数据类型

hive 唐半张 发表了文章 • 0 个评论 • 605 次浏览 • 2015-10-09 09:36 • 来自相关话题

Hive的内置数据类型可以分为两大类:(1)、基础数据类型;(2)、复杂数据类型。其中,基础数据类型包括: TINYINT,SMALLINT,INT,BIGINT,BOOLEAN,FLOAT,DOUBLE,STRING,BINARY,TIMESTAMP,DEC...
查看更多

Hive自定义UDF和聚合函数UDAF

hive 唐半张 发表了文章 • 0 个评论 • 682 次浏览 • 2015-10-07 09:40 • 来自相关话题

Hive是一种构建在Hadoop上的数据仓库,Hive把SQL查询转换为一系列在Hadoop集群中运行的MapReduce作业,是MapReduce更高层次的抽象,不用编写具体的MapReduce方法。Hive将数据组织为表,这就使得HDFS上的数据有了结构...
查看更多

Hive的优化

hive 唐半张 发表了文章 • 0 个评论 • 657 次浏览 • 2015-10-06 10:01 • 来自相关话题

Hive的优化策略及优化控制选项主要有以下几个方面: (1)列裁剪 需设置参数hive.optimize.cp=true (2)分区裁剪 需设置参数hive.optimize.pruner=true (3)Joni操作 应该将条目少的...
查看更多

hive QL(HQL)简明指南

hive 唐半张 发表了文章 • 0 个评论 • 685 次浏览 • 2015-09-30 11:18 • 来自相关话题

1. 基本数据类型 tinyint , smallint, int, bigint, float, double, boolean: true/false, string 2. 基础运算符与函数 A IS NULL         空 A IS NOT...
查看更多

hive中的时间处理函数

hive 唐半张 发表了文章 • 0 个评论 • 726 次浏览 • 2015-09-30 11:15 • 来自相关话题

日期函数UNIX时间戳转日期函数: from_unixtime语法:   from_unixtime(bigint unixtime[, string format]) 返回值: string 说明: 转化UNIX时间戳(从1970-01-01 00:00:0...
查看更多

Hadoop Hive与Hbase整合

hadoop 唐半张 发表了文章 • 0 个评论 • 652 次浏览 • 2015-09-29 11:08 • 来自相关话题

用hbase做数据库,但由于hbase没有类sql查询方式,所以操作和计算数据非常不方便,于是整合hive,让hive支撑在hbase数据库层面 的 hql查询.hive也即 做数据仓库  1. 基于Hadoop+Hive架构对海量数据进行查询:htt...
查看更多

hive 数据导入mysql

hive 夕阳丶一抹红颜 发表了文章 • 0 个评论 • 708 次浏览 • 2015-09-22 11:44 • 来自相关话题

下面是我将 hive中数据导入到mysql 中的方案,但这套方案性能速度上不是很好,想听听大家有没有更好些的方案? 目前我是在hive中有一张page_visit表,每天产生1500w数据,然后执行指定时间段内(一般三天,大概四、五千万行)的数据:...
查看更多

Hive Tunning 补充 关于bucket

hive cenyuhai 发表了文章 • 0 个评论 • 548 次浏览 • 2015-09-11 14:40 • 来自相关话题

在前面的几篇文章当中一直有一个概念bucketing不清楚到底是怎么回事。   网友南京-李先森给了他收集的一些资料,如下:   Buckets 对指定列计算 hash,根据 hash 值切分数据,目的是为了并行,每一个 Bucket 对应一个文件。如将 us...
查看更多

Hbase 学习(十一)使用hive往hbase当中导入数据

hbase cenyuhai 发表了文章 • 0 个评论 • 514 次浏览 • 2015-09-11 14:38 • 来自相关话题

 我们可以有很多方式可以把数据导入到hbase当中,比如说用map-reduce,使用TableOutputFormat这个类,但是这种方式不是最优的方式。   Bulk的方式直接生成HFiles,写入到文件系统当中,这种方式的效率很高。   一般的步骤有两步...
查看更多

Hive Tuning(五) 标准调优清单

hive cenyuhai 发表了文章 • 0 个评论 • 554 次浏览 • 2015-09-11 14:28 • 来自相关话题

=mediumHive的标准调优清单,我们可以对照着来做我们的查询优化! =medium http://images.cnitblog.com/blog/477362/201307/31205654-9c6ba110ff4243daafbfc039cbe6a...
查看更多

Hive Tunning(三) 最佳实践

hive cenyuhai 发表了文章 • 0 个评论 • 492 次浏览 • 2015-09-11 14:28 • 来自相关话题

=medium在上一讲的基础上,我们来做来一个实际的例子来展示如何在实操中进行高效的hive查询作业。=medium(1)首先我们建立一个表 =mediumCREATE EXTERNAL TABLE pos_staging( txnid STRING, txn...
查看更多

Hive Tuning(四) 从查询计划看hive.auto.convert.join的好处

hadoop cenyuhai 发表了文章 • 0 个评论 • 1150 次浏览 • 2015-09-11 14:23 • 来自相关话题

今天我们来讲一下如何看懂Hive的查询计划。 hive的执行计划包括三部分 – Abstract syntax tree – 可以直接忽略 – Stage dependencies – 依赖 – Stage plans – hive如何执行任务的信息. h...
查看更多

Hive Tunning(二)优化存储

hive cenyuhai 发表了文章 • 0 个评论 • 645 次浏览 • 2015-09-11 14:22 • 来自相关话题

接着上一章我们讲的hive的连接策略,现在我们讲一下hive的数据存储。 下面是hive支持的数据存储格式,有我们常见的文本,JSON,XML,这里我们主要讲一下ORCFile。 Built-in Formats: – ORCFile – RCFile – A...
查看更多

Hive Tuning(一) 连接策略

hadoop cenyuhai 发表了文章 • 0 个评论 • 565 次浏览 • 2015-09-11 14:21 • 来自相关话题

群里共享了一本hive调优的书记,名叫《Hive Tunning》,就忍不住开始看了,也顺便记录一下自己学到的东西,备忘! 首先,这是hive的数据摘要,别问我什么意思,我也没看懂。 http://images.cnitblog.com/blog/4773...
查看更多

hadoop 1.1.2和 hive 0.10 和hbase 0.94.9整合

hadoop cenyuhai 发表了文章 • 0 个评论 • 650 次浏览 • 2015-09-11 14:17 • 来自相关话题

今天弄了一下hive0.10和hbase0.94.9整合,需要设置的并不多,但是也遇到了一些问题。   1.复制jar包   拷贝hbase-0.94.9.jar,zookeeper-3.4.5.jar,protobuf-java-2.4.0a.jar到hiv...
查看更多

hive thrift 开机启动

hadoop cenyuhai 发表了文章 • 0 个评论 • 486 次浏览 • 2015-09-11 14:16 • 来自相关话题

这个问题困扰我很久,之前redis的时候,也出现了这个问题,从网上找的thrift脚本没有一个好使的,最后通过修改/etc/rc.d/rc.local来执行一些非服务的命令,这样子就不需要像写服务那样写start,stop方法啦,不过修改这个配置文件要小心,命...
查看更多
Hive是Hadoop上事实的、功能最强大的SQL和元数据标准。也是Hadoop的MR, Spark, Tez作业的常用提交工具。