Hive

Hive

hive中表数据导出到本地,想做一个配置文件,给一个表名,直接读取配置文件,导出数据,这样可行吗

Hive macg 回复了问题 • 3 人关注 • 2 个回复 • 32 次浏览 • 2018-02-24 13:08 • 来自相关话题

求解中文乱码问题

Hive macg 回复了问题 • 2 人关注 • 1 个回复 • 19 次浏览 • 2018-02-24 13:03 • 来自相关话题

请教个问题,使用sqoop把mysql的表导入到hive中。

Hive macg 回复了问题 • 3 人关注 • 2 个回复 • 12 次浏览 • 2018-02-24 12:57 • 来自相关话题

hive.cli.print.header

Hive 张晓慧 回复了问题 • 2 人关注 • 1 个回复 • 11 次浏览 • 2018-02-22 20:00 • 来自相关话题

要关联一个小表

Hive 史晓江 回复了问题 • 3 人关注 • 3 个回复 • 15 次浏览 • 2018-02-22 18:24 • 来自相关话题

日志文件导入 hive 时的需要做文本截取 操作,是用 map keys 么?

回复

Hive 贾婷婷 发起了问题 • 1 人关注 • 0 个回复 • 13 次浏览 • 2018-02-21 22:39 • 来自相关话题

hive不同分区数据,load overwirte会覆盖吗

回复

Hive 史晓江 发起了问题 • 1 人关注 • 0 个回复 • 15 次浏览 • 2018-02-21 22:38 • 来自相关话题

beeline连接hive on spark提交作业无返回结果

Hive snowyghost 回复了问题 • 2 人关注 • 6 个回复 • 81 次浏览 • 2018-02-12 22:44 • 来自相关话题

亲们,我刚刚启用了 NN HA,HDFS 可用,但是 hive 查询时报错,有碰到过的吗?

回复

Hive 封尘 发起了问题 • 1 人关注 • 0 个回复 • 34 次浏览 • 2018-02-08 16:24 • 来自相关话题

各位大神将hive里面的表导出到关系型数据库一般都是怎么做的啊?

Hive 银河系管理员 回复了问题 • 2 人关注 • 1 个回复 • 23 次浏览 • 2018-02-08 15:45 • 来自相关话题

hive启动报错

Hive Tomguluson 回复了问题 • 2 人关注 • 1 个回复 • 84 次浏览 • 2018-01-17 22:19 • 来自相关话题

mapreduce.map.memory.mb 参数问题

Hive fish 回复了问题 • 2 人关注 • 3 个回复 • 77 次浏览 • 2018-01-11 18:26 • 来自相关话题

hive on spark 动态分区异常

Hive fish 回复了问题 • 4 人关注 • 3 个回复 • 69 次浏览 • 2018-01-11 16:38 • 来自相关话题

Hive export分区表,再导入时报错(因为分区目录中的子目录),如何处理?

回复

Hive Grissom 发起了问题 • 1 人关注 • 0 个回复 • 70 次浏览 • 2018-01-06 16:48 • 来自相关话题

hive拒绝连接

Hive fish 回复了问题 • 2 人关注 • 1 个回复 • 54 次浏览 • 2018-01-05 09:36 • 来自相关话题

通过hive cli创建的function 在beeline和hue中无法使用,重启hive后就可以使用了

Hive fish 回复了问题 • 2 人关注 • 2 个回复 • 99 次浏览 • 2017-12-18 19:57 • 来自相关话题

hive metastore在启动时,一直moved,10多个小时一直起不来。

Hive fish 回复了问题 • 2 人关注 • 1 个回复 • 103 次浏览 • 2017-11-28 19:00 • 来自相关话题

hivesql语句

Hive fish 回复了问题 • 2 人关注 • 1 个回复 • 211 次浏览 • 2017-09-29 18:14 • 来自相关话题

hive支持多线程并发插入嘛?为啥并发插入的会少数据

Hive fish 回复了问题 • 2 人关注 • 1 个回复 • 193 次浏览 • 2017-09-29 17:25 • 来自相关话题

条新动态, 点击查看
fish

fish 回答了问题 • 2015-10-22 09:54 • 18 个回复 不感兴趣

hive server2启动报错

赞同来自:

Cannot find hadoop installation: $HADOOP_HOME or $HADOOP_PREFIX must be set or hadoop must be in the path
是执行什么的时候报的错? 显示全部 »
Cannot find hadoop installation: $HADOOP_HOME or $HADOOP_PREFIX must be set or hadoop must be in the path
是执行什么的时候报的错?
fish

fish 回答了问题 • 2015-10-25 00:27 • 4 个回复 不感兴趣

使用sqoop从mysql导入数据到Hive报错

赞同来自:

这是apache hive1.1.1版本的一个问题: https://issues.apache.org/jira/browse/HIVE-10831
将你机器上的hive拷贝到我的环境中执行也会发生同样的问题。
 
换用apache hive 1.2.1 ... 显示全部 »
这是apache hive1.1.1版本的一个问题: https://issues.apache.org/jira/browse/HIVE-10831
将你机器上的hive拷贝到我的环境中执行也会发生同样的问题。
 
换用apache hive 1.2.1 或者 CDH版本的就可以正常工作。

hive中表数据导出到本地,想做一个配置文件,给一个表名,直接读取配置文件,导出数据,这样可行吗

回复

Hive macg 回复了问题 • 3 人关注 • 2 个回复 • 32 次浏览 • 2018-02-24 13:08 • 来自相关话题

求解中文乱码问题

回复

Hive macg 回复了问题 • 2 人关注 • 1 个回复 • 19 次浏览 • 2018-02-24 13:03 • 来自相关话题

请教个问题,使用sqoop把mysql的表导入到hive中。

回复

Hive macg 回复了问题 • 3 人关注 • 2 个回复 • 12 次浏览 • 2018-02-24 12:57 • 来自相关话题

hive.cli.print.header

回复

Hive 张晓慧 回复了问题 • 2 人关注 • 1 个回复 • 11 次浏览 • 2018-02-22 20:00 • 来自相关话题

要关联一个小表

回复

Hive 史晓江 回复了问题 • 3 人关注 • 3 个回复 • 15 次浏览 • 2018-02-22 18:24 • 来自相关话题

日志文件导入 hive 时的需要做文本截取 操作,是用 map keys 么?

回复

Hive 贾婷婷 发起了问题 • 1 人关注 • 0 个回复 • 13 次浏览 • 2018-02-21 22:39 • 来自相关话题

hive不同分区数据,load overwirte会覆盖吗

回复

Hive 史晓江 发起了问题 • 1 人关注 • 0 个回复 • 15 次浏览 • 2018-02-21 22:38 • 来自相关话题

beeline连接hive on spark提交作业无返回结果

回复

Hive snowyghost 回复了问题 • 2 人关注 • 6 个回复 • 81 次浏览 • 2018-02-12 22:44 • 来自相关话题

亲们,我刚刚启用了 NN HA,HDFS 可用,但是 hive 查询时报错,有碰到过的吗?

回复

Hive 封尘 发起了问题 • 1 人关注 • 0 个回复 • 34 次浏览 • 2018-02-08 16:24 • 来自相关话题

各位大神将hive里面的表导出到关系型数据库一般都是怎么做的啊?

回复

Hive 银河系管理员 回复了问题 • 2 人关注 • 1 个回复 • 23 次浏览 • 2018-02-08 15:45 • 来自相关话题

hive启动报错

回复

Hive Tomguluson 回复了问题 • 2 人关注 • 1 个回复 • 84 次浏览 • 2018-01-17 22:19 • 来自相关话题

mapreduce.map.memory.mb 参数问题

回复

Hive fish 回复了问题 • 2 人关注 • 3 个回复 • 77 次浏览 • 2018-01-11 18:26 • 来自相关话题

hive on spark 动态分区异常

回复

Hive fish 回复了问题 • 4 人关注 • 3 个回复 • 69 次浏览 • 2018-01-11 16:38 • 来自相关话题

Hive export分区表,再导入时报错(因为分区目录中的子目录),如何处理?

回复

Hive Grissom 发起了问题 • 1 人关注 • 0 个回复 • 70 次浏览 • 2018-01-06 16:48 • 来自相关话题

hive拒绝连接

回复

Hive fish 回复了问题 • 2 人关注 • 1 个回复 • 54 次浏览 • 2018-01-05 09:36 • 来自相关话题

通过hive cli创建的function 在beeline和hue中无法使用,重启hive后就可以使用了

回复

Hive fish 回复了问题 • 2 人关注 • 2 个回复 • 99 次浏览 • 2017-12-18 19:57 • 来自相关话题

hive metastore在启动时,一直moved,10多个小时一直起不来。

回复

Hive fish 回复了问题 • 2 人关注 • 1 个回复 • 103 次浏览 • 2017-11-28 19:00 • 来自相关话题

hivesql语句

回复

Hive fish 回复了问题 • 2 人关注 • 1 个回复 • 211 次浏览 • 2017-09-29 18:14 • 来自相关话题

hive支持多线程并发插入嘛?为啥并发插入的会少数据

回复

Hive fish 回复了问题 • 2 人关注 • 1 个回复 • 193 次浏览 • 2017-09-29 17:25 • 来自相关话题

Impala与Hive的比较

impala 唐半张 发表了文章 • 0 个评论 • 1096 次浏览 • 2015-10-10 09:25 • 来自相关话题

1. Impala架构        Impala是Cloudera在受到Google的Dremel启发下开发的实时交互SQL大数据查询工具,Impala没有再使用缓慢的Hive+MapReduce批处理,而是通过使用与商用并行关系数据库中类似的分布...
查看更多

Hive安装之本地独立模式

Hive 唐半张 发表了文章 • 0 个评论 • 741 次浏览 • 2015-10-09 10:27 • 来自相关话题

本地独立模式:在本地安装mysql数据库,然后hive将元数据存放在mysql中。实验前提条件:已经成功安装了hadoop集群(不管是伪分布式还是完全分布式)。 本人实验的hadoop版本为1.2.1,其安装目录为/usr/hadoop-1.2.1 ,并...
查看更多

order by && sort by && distribute by && cluster by 区分

Hive 唐半张 发表了文章 • 0 个评论 • 993 次浏览 • 2015-10-09 09:37 • 来自相关话题

order by 1、order by会对输入做全局排序,因此只有一个reducer(多个reducer无法保证全局有序);     只有一个reducer,会导致当输入规模较大时,需要较长的计算时间,速度会非常慢; 2、hive.mapred....
查看更多

Hive的数据类型

Hive 唐半张 发表了文章 • 0 个评论 • 964 次浏览 • 2015-10-09 09:36 • 来自相关话题

Hive的内置数据类型可以分为两大类:(1)、基础数据类型;(2)、复杂数据类型。其中,基础数据类型包括: TINYINT,SMALLINT,INT,BIGINT,BOOLEAN,FLOAT,DOUBLE,STRING,BINARY,TIMESTAMP,DEC...
查看更多

Hive自定义UDF和聚合函数UDAF

Hive 唐半张 发表了文章 • 0 个评论 • 923 次浏览 • 2015-10-07 09:40 • 来自相关话题

Hive是一种构建在Hadoop上的数据仓库,Hive把SQL查询转换为一系列在Hadoop集群中运行的MapReduce作业,是MapReduce更高层次的抽象,不用编写具体的MapReduce方法。Hive将数据组织为表,这就使得HDFS上的数据有了结构...
查看更多

Hive的优化

Hive 唐半张 发表了文章 • 0 个评论 • 916 次浏览 • 2015-10-06 10:01 • 来自相关话题

Hive的优化策略及优化控制选项主要有以下几个方面: (1)列裁剪 需设置参数hive.optimize.cp=true (2)分区裁剪 需设置参数hive.optimize.pruner=true (3)Joni操作 应该将条目少的...
查看更多

hive QL(HQL)简明指南

Hive 唐半张 发表了文章 • 0 个评论 • 932 次浏览 • 2015-09-30 11:18 • 来自相关话题

1. 基本数据类型 tinyint , smallint, int, bigint, float, double, boolean: true/false, string 2. 基础运算符与函数 A IS NULL         空 A IS NOT...
查看更多

hive中的时间处理函数

Hive 唐半张 发表了文章 • 0 个评论 • 1233 次浏览 • 2015-09-30 11:15 • 来自相关话题

日期函数UNIX时间戳转日期函数: from_unixtime语法:   from_unixtime(bigint unixtime[, string format]) 返回值: string 说明: 转化UNIX时间戳(从1970-01-01 00:00:0...
查看更多

Hadoop Hive与Hbase整合

Hadoop 唐半张 发表了文章 • 0 个评论 • 863 次浏览 • 2015-09-29 11:08 • 来自相关话题

用hbase做数据库,但由于hbase没有类sql查询方式,所以操作和计算数据非常不方便,于是整合hive,让hive支撑在hbase数据库层面 的 hql查询.hive也即 做数据仓库  1. 基于Hadoop+Hive架构对海量数据进行查询:htt...
查看更多

hive 数据导入mysql

Hive 夕阳丶一抹红颜 发表了文章 • 0 个评论 • 1034 次浏览 • 2015-09-22 11:44 • 来自相关话题

下面是我将 hive中数据导入到mysql 中的方案,但这套方案性能速度上不是很好,想听听大家有没有更好些的方案? 目前我是在hive中有一张page_visit表,每天产生1500w数据,然后执行指定时间段内(一般三天,大概四、五千万行)的数据:...
查看更多

Hive Tunning 补充 关于bucket

Hive cenyuhai 发表了文章 • 0 个评论 • 791 次浏览 • 2015-09-11 14:40 • 来自相关话题

在前面的几篇文章当中一直有一个概念bucketing不清楚到底是怎么回事。   网友南京-李先森给了他收集的一些资料,如下:   Buckets 对指定列计算 hash,根据 hash 值切分数据,目的是为了并行,每一个 Bucket 对应一个文件。如将 us...
查看更多

Hbase 学习(十一)使用hive往hbase当中导入数据

HBase cenyuhai 发表了文章 • 0 个评论 • 834 次浏览 • 2015-09-11 14:38 • 来自相关话题

 我们可以有很多方式可以把数据导入到hbase当中,比如说用map-reduce,使用TableOutputFormat这个类,但是这种方式不是最优的方式。   Bulk的方式直接生成HFiles,写入到文件系统当中,这种方式的效率很高。   一般的步骤有两步...
查看更多

Hive Tuning(五) 标准调优清单

Hive cenyuhai 发表了文章 • 0 个评论 • 773 次浏览 • 2015-09-11 14:28 • 来自相关话题

=mediumHive的标准调优清单,我们可以对照着来做我们的查询优化! =medium http://images.cnitblog.com/blog/477362/201307/31205654-9c6ba110ff4243daafbfc039cbe6a...
查看更多

Hive Tunning(三) 最佳实践

Hive cenyuhai 发表了文章 • 0 个评论 • 720 次浏览 • 2015-09-11 14:28 • 来自相关话题

=medium在上一讲的基础上,我们来做来一个实际的例子来展示如何在实操中进行高效的hive查询作业。=medium(1)首先我们建立一个表 =mediumCREATE EXTERNAL TABLE pos_staging( txnid STRING, txn...
查看更多

Hive Tuning(四) 从查询计划看hive.auto.convert.join的好处

Hadoop cenyuhai 发表了文章 • 0 个评论 • 1467 次浏览 • 2015-09-11 14:23 • 来自相关话题

今天我们来讲一下如何看懂Hive的查询计划。 hive的执行计划包括三部分 – Abstract syntax tree – 可以直接忽略 – Stage dependencies – 依赖 – Stage plans – hive如何执行任务的信息. h...
查看更多

Hive Tunning(二)优化存储

Hive cenyuhai 发表了文章 • 0 个评论 • 874 次浏览 • 2015-09-11 14:22 • 来自相关话题

接着上一章我们讲的hive的连接策略,现在我们讲一下hive的数据存储。 下面是hive支持的数据存储格式,有我们常见的文本,JSON,XML,这里我们主要讲一下ORCFile。 Built-in Formats: – ORCFile – RCFile – A...
查看更多

Hive Tuning(一) 连接策略

Hadoop cenyuhai 发表了文章 • 0 个评论 • 798 次浏览 • 2015-09-11 14:21 • 来自相关话题

群里共享了一本hive调优的书记,名叫《Hive Tunning》,就忍不住开始看了,也顺便记录一下自己学到的东西,备忘! 首先,这是hive的数据摘要,别问我什么意思,我也没看懂。 http://images.cnitblog.com/blog/4773...
查看更多

hadoop 1.1.2和 hive 0.10 和hbase 0.94.9整合

Hadoop cenyuhai 发表了文章 • 0 个评论 • 825 次浏览 • 2015-09-11 14:17 • 来自相关话题

今天弄了一下hive0.10和hbase0.94.9整合,需要设置的并不多,但是也遇到了一些问题。   1.复制jar包   拷贝hbase-0.94.9.jar,zookeeper-3.4.5.jar,protobuf-java-2.4.0a.jar到hiv...
查看更多

hive thrift 开机启动

Hadoop cenyuhai 发表了文章 • 0 个评论 • 660 次浏览 • 2015-09-11 14:16 • 来自相关话题

这个问题困扰我很久,之前redis的时候,也出现了这个问题,从网上找的thrift脚本没有一个好使的,最后通过修改/etc/rc.d/rc.local来执行一些非服务的命令,这样子就不需要像写服务那样写start,stop方法啦,不过修改这个配置文件要小心,命...
查看更多
Hive是Hadoop上事实的、功能最强大的SQL和元数据标准。也是Hadoop的MR, Spark, Tez作业的常用提交工具。