hive

hive

第八课《8 数据分析引擎 Hive(第二部分)》

hive yolandaray 回复了问题 • 11 人关注 • 13 个回复 • 95 次浏览 • 2017-01-16 14:06 • 来自相关话题

使用beeline问题

hive tankkyo 回复了问题 • 3 人关注 • 9 个回复 • 40 次浏览 • 2017-01-11 19:49 • 来自相关话题

beeline配置使用问题

hive 带刀锦衣卫 回复了问题 • 2 人关注 • 8 个回复 • 42 次浏览 • 2017-01-10 14:49 • 来自相关话题

hive配置hdfs地址问题

hive 带刀锦衣卫 回复了问题 • 2 人关注 • 2 个回复 • 24 次浏览 • 2017-01-09 17:05 • 来自相关话题

执行hive HQL语句,报错,感觉应该是内存不够了,请老师帮忙看看,怎么调整内存啊?

hive IT_Angel 回复了问题 • 2 人关注 • 7 个回复 • 53 次浏览 • 2017-01-04 13:17 • 来自相关话题

第七课《7 数据分析引擎 Hive(第一部分)》

hive V5555555 回复了问题 • 11 人关注 • 18 个回复 • 106 次浏览 • 2017-01-04 11:17 • 来自相关话题

hive导入数据后只能显示第一列的内容

回复

hive zj220223 回复了问题 • 2 人关注 • 1 个回复 • 35 次浏览 • 2016-12-28 11:43 • 来自相关话题

hive 执行transform时 map任务进度总是0%

hive wangxiaolei 回复了问题 • 2 人关注 • 6 个回复 • 65 次浏览 • 2016-12-27 19:03 • 来自相关话题

hive 的一些疑问?

hive fish 回复了问题 • 2 人关注 • 1 个回复 • 49 次浏览 • 2016-12-26 10:44 • 来自相关话题

进入hive输入任何命令报错

hive wangxiaolei 回复了问题 • 2 人关注 • 1 个回复 • 59 次浏览 • 2016-12-23 15:09 • 来自相关话题

hive 创建表的时候报错

hive IT_Angel 回复了问题 • 3 人关注 • 14 个回复 • 87 次浏览 • 2016-12-22 15:50 • 来自相关话题

hive的insert into

hive Kong 回复了问题 • 3 人关注 • 3 个回复 • 52 次浏览 • 2016-12-20 20:49 • 来自相关话题

hive序列器

回复

hive 方_方 发起了问题 • 2 人关注 • 0 个回复 • 34 次浏览 • 2016-12-16 19:49 • 来自相关话题

hadoop explain left join 语句在执行计划变成了 Inner Join ,求大神解惑!

回复

hadoop YLLL 回复了问题 • 2 人关注 • 1 个回复 • 49 次浏览 • 2016-12-16 10:42 • 来自相关话题

关于Hive的测试数据

hive 朱月军 回复了问题 • 4 人关注 • 8 个回复 • 94 次浏览 • 2016-12-15 22:05 • 来自相关话题

OutOfMemoryError: PermGen space 问题

hive FredHu 回复了问题 • 5 人关注 • 4 个回复 • 98 次浏览 • 2016-12-14 11:09 • 来自相关话题

通过hiveserver2执行 “truncate table 表名”报错,在cli中执行正常

hive scott_duan 回复了问题 • 3 人关注 • 2 个回复 • 58 次浏览 • 2016-12-12 17:57 • 来自相关话题

win7下eclipse中jdbc访问hive内表没问题,映射hbase的表要报错,如下。但在linux的hive shell中都正常

回复

hive scott_duan 发起了问题 • 2 人关注 • 0 个回复 • 46 次浏览 • 2016-12-12 07:54 • 来自相关话题

hive中union all的问题

hive jevons 回复了问题 • 2 人关注 • 2 个回复 • 59 次浏览 • 2016-12-11 21:07 • 来自相关话题

hive通过hiveserver即席查询多个值反而比单个值要快,为什么?

hive 李虎翼 回复了问题 • 2 人关注 • 1 个回复 • 55 次浏览 • 2016-12-10 16:57 • 来自相关话题

条新动态, 点击查看
fish

fish 回答了问题 • 2015-10-22 09:54 • 18 个回复 不感兴趣

hive server2启动报错

赞同来自:

Cannot find hadoop installation: $HADOOP_HOME or $HADOOP_PREFIX must be set or hadoop must be in the path
是执行什么的时候报的错? 显示全部 »
Cannot find hadoop installation: $HADOOP_HOME or $HADOOP_PREFIX must be set or hadoop must be in the path
是执行什么的时候报的错?
fish

fish 回答了问题 • 2015-10-25 00:27 • 4 个回复 不感兴趣

使用sqoop从mysql导入数据到Hive报错

赞同来自:

这是apache hive1.1.1版本的一个问题: https://issues.apache.org/jira/browse/HIVE-10831
将你机器上的hive拷贝到我的环境中执行也会发生同样的问题。
 
换用apache hive 1.2.1 ... 显示全部 »
这是apache hive1.1.1版本的一个问题: https://issues.apache.org/jira/browse/HIVE-10831
将你机器上的hive拷贝到我的环境中执行也会发生同样的问题。
 
换用apache hive 1.2.1 或者 CDH版本的就可以正常工作。

第八课《8 数据分析引擎 Hive(第二部分)》

回复

hive yolandaray 回复了问题 • 11 人关注 • 13 个回复 • 95 次浏览 • 2017-01-16 14:06 • 来自相关话题

使用beeline问题

回复

hive tankkyo 回复了问题 • 3 人关注 • 9 个回复 • 40 次浏览 • 2017-01-11 19:49 • 来自相关话题

beeline配置使用问题

回复

hive 带刀锦衣卫 回复了问题 • 2 人关注 • 8 个回复 • 42 次浏览 • 2017-01-10 14:49 • 来自相关话题

hive配置hdfs地址问题

回复

hive 带刀锦衣卫 回复了问题 • 2 人关注 • 2 个回复 • 24 次浏览 • 2017-01-09 17:05 • 来自相关话题

执行hive HQL语句,报错,感觉应该是内存不够了,请老师帮忙看看,怎么调整内存啊?

回复

hive IT_Angel 回复了问题 • 2 人关注 • 7 个回复 • 53 次浏览 • 2017-01-04 13:17 • 来自相关话题

第七课《7 数据分析引擎 Hive(第一部分)》

回复

hive V5555555 回复了问题 • 11 人关注 • 18 个回复 • 106 次浏览 • 2017-01-04 11:17 • 来自相关话题

hive导入数据后只能显示第一列的内容

回复

hive zj220223 回复了问题 • 2 人关注 • 1 个回复 • 35 次浏览 • 2016-12-28 11:43 • 来自相关话题

hive 执行transform时 map任务进度总是0%

回复

hive wangxiaolei 回复了问题 • 2 人关注 • 6 个回复 • 65 次浏览 • 2016-12-27 19:03 • 来自相关话题

hive 的一些疑问?

回复

hive fish 回复了问题 • 2 人关注 • 1 个回复 • 49 次浏览 • 2016-12-26 10:44 • 来自相关话题

进入hive输入任何命令报错

回复

hive wangxiaolei 回复了问题 • 2 人关注 • 1 个回复 • 59 次浏览 • 2016-12-23 15:09 • 来自相关话题

hive 创建表的时候报错

回复

hive IT_Angel 回复了问题 • 3 人关注 • 14 个回复 • 87 次浏览 • 2016-12-22 15:50 • 来自相关话题

hive的insert into

回复

hive Kong 回复了问题 • 3 人关注 • 3 个回复 • 52 次浏览 • 2016-12-20 20:49 • 来自相关话题

hive序列器

回复

hive 方_方 发起了问题 • 2 人关注 • 0 个回复 • 34 次浏览 • 2016-12-16 19:49 • 来自相关话题

hadoop explain left join 语句在执行计划变成了 Inner Join ,求大神解惑!

回复

hadoop YLLL 回复了问题 • 2 人关注 • 1 个回复 • 49 次浏览 • 2016-12-16 10:42 • 来自相关话题

关于Hive的测试数据

回复

hive 朱月军 回复了问题 • 4 人关注 • 8 个回复 • 94 次浏览 • 2016-12-15 22:05 • 来自相关话题

OutOfMemoryError: PermGen space 问题

回复

hive FredHu 回复了问题 • 5 人关注 • 4 个回复 • 98 次浏览 • 2016-12-14 11:09 • 来自相关话题

通过hiveserver2执行 “truncate table 表名”报错,在cli中执行正常

回复

hive scott_duan 回复了问题 • 3 人关注 • 2 个回复 • 58 次浏览 • 2016-12-12 17:57 • 来自相关话题

win7下eclipse中jdbc访问hive内表没问题,映射hbase的表要报错,如下。但在linux的hive shell中都正常

回复

hive scott_duan 发起了问题 • 2 人关注 • 0 个回复 • 46 次浏览 • 2016-12-12 07:54 • 来自相关话题

hive中union all的问题

回复

hive jevons 回复了问题 • 2 人关注 • 2 个回复 • 59 次浏览 • 2016-12-11 21:07 • 来自相关话题

hive通过hiveserver即席查询多个值反而比单个值要快,为什么?

回复

hive 李虎翼 回复了问题 • 2 人关注 • 1 个回复 • 55 次浏览 • 2016-12-10 16:57 • 来自相关话题

Impala与Hive的比较

impala 唐半张 发表了文章 • 0 个评论 • 491 次浏览 • 2015-10-10 09:25 • 来自相关话题

1. Impala架构        Impala是Cloudera在受到Google的Dremel启发下开发的实时交互SQL大数据查询工具,Impala没有再使用缓慢的Hive+MapReduce批处理,而是通过使用与商用并行关系数据库中类似的分布...
查看更多

Hive安装之本地独立模式

hive 唐半张 发表了文章 • 0 个评论 • 412 次浏览 • 2015-10-09 10:27 • 来自相关话题

本地独立模式:在本地安装mysql数据库,然后hive将元数据存放在mysql中。实验前提条件:已经成功安装了hadoop集群(不管是伪分布式还是完全分布式)。 本人实验的hadoop版本为1.2.1,其安装目录为/usr/hadoop-1.2.1 ,并...
查看更多

order by && sort by && distribute by && cluster by 区分

hive 唐半张 发表了文章 • 0 个评论 • 538 次浏览 • 2015-10-09 09:37 • 来自相关话题

order by 1、order by会对输入做全局排序,因此只有一个reducer(多个reducer无法保证全局有序);     只有一个reducer,会导致当输入规模较大时,需要较长的计算时间,速度会非常慢; 2、hive.mapred....
查看更多

Hive的数据类型

hive 唐半张 发表了文章 • 0 个评论 • 401 次浏览 • 2015-10-09 09:36 • 来自相关话题

Hive的内置数据类型可以分为两大类:(1)、基础数据类型;(2)、复杂数据类型。其中,基础数据类型包括: TINYINT,SMALLINT,INT,BIGINT,BOOLEAN,FLOAT,DOUBLE,STRING,BINARY,TIMESTAMP,DEC...
查看更多

Hive自定义UDF和聚合函数UDAF

hive 唐半张 发表了文章 • 0 个评论 • 454 次浏览 • 2015-10-07 09:40 • 来自相关话题

Hive是一种构建在Hadoop上的数据仓库,Hive把SQL查询转换为一系列在Hadoop集群中运行的MapReduce作业,是MapReduce更高层次的抽象,不用编写具体的MapReduce方法。Hive将数据组织为表,这就使得HDFS上的数据有了结构...
查看更多

Hive的优化

hive 唐半张 发表了文章 • 0 个评论 • 479 次浏览 • 2015-10-06 10:01 • 来自相关话题

Hive的优化策略及优化控制选项主要有以下几个方面: (1)列裁剪 需设置参数hive.optimize.cp=true (2)分区裁剪 需设置参数hive.optimize.pruner=true (3)Joni操作 应该将条目少的...
查看更多

hive QL(HQL)简明指南

hive 唐半张 发表了文章 • 0 个评论 • 478 次浏览 • 2015-09-30 11:18 • 来自相关话题

1. 基本数据类型 tinyint , smallint, int, bigint, float, double, boolean: true/false, string 2. 基础运算符与函数 A IS NULL         空 A IS NOT...
查看更多

hive中的时间处理函数

hive 唐半张 发表了文章 • 0 个评论 • 519 次浏览 • 2015-09-30 11:15 • 来自相关话题

日期函数UNIX时间戳转日期函数: from_unixtime语法:   from_unixtime(bigint unixtime[, string format]) 返回值: string 说明: 转化UNIX时间戳(从1970-01-01 00:00:0...
查看更多

Hadoop Hive与Hbase整合

hadoop 唐半张 发表了文章 • 0 个评论 • 498 次浏览 • 2015-09-29 11:08 • 来自相关话题

用hbase做数据库,但由于hbase没有类sql查询方式,所以操作和计算数据非常不方便,于是整合hive,让hive支撑在hbase数据库层面 的 hql查询.hive也即 做数据仓库  1. 基于Hadoop+Hive架构对海量数据进行查询:htt...
查看更多

hive 数据导入mysql

hive 夕阳丶一抹红颜 发表了文章 • 0 个评论 • 518 次浏览 • 2015-09-22 11:44 • 来自相关话题

下面是我将 hive中数据导入到mysql 中的方案,但这套方案性能速度上不是很好,想听听大家有没有更好些的方案? 目前我是在hive中有一张page_visit表,每天产生1500w数据,然后执行指定时间段内(一般三天,大概四、五千万行)的数据:...
查看更多

Hive Tunning 补充 关于bucket

hive cenyuhai 发表了文章 • 0 个评论 • 402 次浏览 • 2015-09-11 14:40 • 来自相关话题

在前面的几篇文章当中一直有一个概念bucketing不清楚到底是怎么回事。   网友南京-李先森给了他收集的一些资料,如下:   Buckets 对指定列计算 hash,根据 hash 值切分数据,目的是为了并行,每一个 Bucket 对应一个文件。如将 us...
查看更多

Hbase 学习(十一)使用hive往hbase当中导入数据

hbase cenyuhai 发表了文章 • 0 个评论 • 381 次浏览 • 2015-09-11 14:38 • 来自相关话题

 我们可以有很多方式可以把数据导入到hbase当中,比如说用map-reduce,使用TableOutputFormat这个类,但是这种方式不是最优的方式。   Bulk的方式直接生成HFiles,写入到文件系统当中,这种方式的效率很高。   一般的步骤有两步...
查看更多

Hive Tuning(五) 标准调优清单

hive cenyuhai 发表了文章 • 0 个评论 • 412 次浏览 • 2015-09-11 14:28 • 来自相关话题

=mediumHive的标准调优清单,我们可以对照着来做我们的查询优化! =medium http://images.cnitblog.com/blog/477362/201307/31205654-9c6ba110ff4243daafbfc039cbe6a...
查看更多

Hive Tunning(三) 最佳实践

hive cenyuhai 发表了文章 • 0 个评论 • 365 次浏览 • 2015-09-11 14:28 • 来自相关话题

=medium在上一讲的基础上,我们来做来一个实际的例子来展示如何在实操中进行高效的hive查询作业。=medium(1)首先我们建立一个表 =mediumCREATE EXTERNAL TABLE pos_staging( txnid STRING, txn...
查看更多

Hive Tuning(四) 从查询计划看hive.auto.convert.join的好处

hadoop cenyuhai 发表了文章 • 0 个评论 • 791 次浏览 • 2015-09-11 14:23 • 来自相关话题

今天我们来讲一下如何看懂Hive的查询计划。 hive的执行计划包括三部分 – Abstract syntax tree – 可以直接忽略 – Stage dependencies – 依赖 – Stage plans – hive如何执行任务的信息. h...
查看更多

Hive Tunning(二)优化存储

hive cenyuhai 发表了文章 • 0 个评论 • 452 次浏览 • 2015-09-11 14:22 • 来自相关话题

接着上一章我们讲的hive的连接策略,现在我们讲一下hive的数据存储。 下面是hive支持的数据存储格式,有我们常见的文本,JSON,XML,这里我们主要讲一下ORCFile。 Built-in Formats: – ORCFile – RCFile – A...
查看更多

Hive Tuning(一) 连接策略

hadoop cenyuhai 发表了文章 • 0 个评论 • 386 次浏览 • 2015-09-11 14:21 • 来自相关话题

群里共享了一本hive调优的书记,名叫《Hive Tunning》,就忍不住开始看了,也顺便记录一下自己学到的东西,备忘! 首先,这是hive的数据摘要,别问我什么意思,我也没看懂。 http://images.cnitblog.com/blog/4773...
查看更多

hadoop 1.1.2和 hive 0.10 和hbase 0.94.9整合

hadoop cenyuhai 发表了文章 • 0 个评论 • 485 次浏览 • 2015-09-11 14:17 • 来自相关话题

今天弄了一下hive0.10和hbase0.94.9整合,需要设置的并不多,但是也遇到了一些问题。   1.复制jar包   拷贝hbase-0.94.9.jar,zookeeper-3.4.5.jar,protobuf-java-2.4.0a.jar到hiv...
查看更多

hive thrift 开机启动

hadoop cenyuhai 发表了文章 • 0 个评论 • 341 次浏览 • 2015-09-11 14:16 • 来自相关话题

这个问题困扰我很久,之前redis的时候,也出现了这个问题,从网上找的thrift脚本没有一个好使的,最后通过修改/etc/rc.d/rc.local来执行一些非服务的命令,这样子就不需要像写服务那样写start,stop方法啦,不过修改这个配置文件要小心,命...
查看更多
Hive是Hadoop上事实的、功能最强大的SQL和元数据标准。也是Hadoop的MR, Spark, Tez作业的常用提交工具。