HBase Hive 集成 - 错误

     2023-04-18     263

关键词:

【中文标题】HBase Hive 集成 - 错误【英文标题】:HBase Hive Integration - Error 【发布时间】:2015-01-20 20:08:31 【问题描述】:

当我尝试使用 Hive 逻辑表将数据从 HDFS 加载到 HBase 时,我遇到了以下问题。我是 hadoop 新手,无法追踪错误,我正在使用 CDH4 VM,

创建一个由 Hive 管理的新 HBase 表

CREATE TABLE hive_hbasetable(key int, value string)
STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":key,cf1:val")
TBLPROPERTIES ("hbase.table.name" = "hivehbasek1");

Hbase shell 输出

hbase(main):002:0> list 
TABLE
hivebasek1
mysql_cityclimate

2 row(s) in 0.2470 seconds

我在 Hive 中创建了一个逻辑表 hive_logictable

CREATE TABLE hive_logictable (foo INT, bar STRING) row format delimited fields terminated by ',';

从 HDFS 向 hive_logictable 中插入数据。

cat TextFile.txt
100,value1
101,value2
102,value3
103,value4
104,value5
105,value6

LOAD DATA LOCAL INPATH '/home/cloudera/TextFile.txt' OVERWRITE INTO TABLE hive_logictable;

使用 Hive 将数据加载到 HBase 表中。

INSERT OVERWRITE TABLE hive_hbasetable SELECT * FROM hive_logictable;

下面是抛出的错误信息......

Total MapReduce jobs = 1
Launching Job 1 out of 1
Number of reduce tasks is set to 0 since there's no reduce operator
Starting Job = job_201501200937_0004, Tracking URL = http://0.0.0.0:50030/jobdetails.jsp?jobid=job_201501200937_0004
Kill Command = /usr/lib/hadoop/bin/hadoop job  -kill job_201501200937_0004
Hadoop job information for Stage-0: number of mappers: 1; number of reducers: 0
2015-01-20 10:38:07,412 Stage-0 map = 0%,  reduce = 0%
2015-01-20 10:38:52,822 Stage-0 map = 100%,  reduce = 100%
Ended Job = job_201501200937_0004 with errors
Error during job, obtaining debugging information...
Job Tracking URL: http://0.0.0.0:50030/jobdetails.jsp?jobid=job_201501200937_0004
Examining task ID: task_201501200937_0004_m_000002 (and more) from job job_201501200937_0004

Task with the most failures(4): 
-----
Task ID:
  task_201501200937_0004_m_000000

URL:
  http://localhost.localdomain:50030/taskdetails.jsp?jobid=job_201501200937_0004&tipid=task_201501200937_0004_m_000000
-----
Diagnostic Messages for this Task:
java.lang.RuntimeException: Error in configuring object
    at org.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.java:109)
    at org.apache.hadoop.util.ReflectionUtils.setConf(ReflectionUtils.java:75)
    at org.apache.hadoop.util.ReflectionUtils.newInstance(ReflectionUtils.java:133)
    at org.apache.hadoop.mapred.MapTask.runOldMapper(MapTask.java:413)
    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:332)
    at org.apache.hadoop.mapred.Child$4.run(Child.java:268)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:396)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1438)
    at org.apache.hadoop.mapred.Child.main(Child.java:262)
Caused by: java.lang.reflect.InvocationTargetException
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.ja

FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.MapRedTask
MapReduce Jobs Launched: 
Job 0: Map: 1   HDFS Read: 0 HDFS Write: 0 FAIL
Total MapReduce CPU Time Spent: 0 msec

错误消息结束。

【问题讨论】:

【参考方案1】:

您能否检查一下原子插入在 HIVE 表上是否正常工作?并分享结果?

【讨论】:

hbase与hive的集成操作(代码片段)

1.介绍  Hive提供了与HBase的集成,使得能够在HBase表上使用HQL语句进行查询插入操作以及进行Join和Union等复杂查询,同时也可以将hive表中的数据映射到HBase中;2.模型概念  2.1将ETL操作的数据存入HBase      2.2HBase作为Hi... 查看详情

hbase与hive集成(代码片段)

...据,不适合做关联查询,join延迟较低,高效的数据访问集成使用案例一建立Hive表,关联HBase表,插入数据到Hive表的同时能够影响HBase表在Hive中创建表同时关联HBaseCREATETABLEhive_hbase_emp_table(empnoint,enamestring,jobstring,mgrint,hiredatestring,s... 查看详情

hbase(代码片段)

续接(三)3habse(1.2)集成hive(1.2.1)===》不兼容集成,需要自己编译!!!    hive1.x与hbase0.98版本兼容    hive2.x与hbase1.x版本以上兼容    hive0.x与hbase0.98以下兼容  Hive提供了与HBase的集成,使得能够在HBase表... 查看详情

新闻实时分析系统hive与hbase集成进行数据分析

(一)Hive概述 (二)Hive在Hadoop生态圈中的位置 (三)Hive架构设计  (四)Hive的优点及应用场景 (五)Hive的下载和安装部署1.Hive下载Apache版本的Hive。Cloudera版本的Hive。这里选择下载Apache稳定版本apache-hive-0.1... 查看详情

spark集成hbase与hive数据转换与代码练习

  帮一个朋友写个样例,顺便练手啦~一直在做平台的各种事,但是代码后续还要精进啊。。。1importjava.util.Date23importorg.apache.hadoop.hbase.HBaseConfiguration4importorg.apache.hadoop.hbase.client.{Put,Scan,Result}5importorg.apache.hadoop.hbase. 查看详情

hivehbaseintegration集成

官方文档:https://cwiki.apache.org/confluence/display/Hive/HBaseIntegration 1、在hive/lib目录下找到hive-hbase-handler-1.2.1.jar,并把该文件拷贝到hbase/lib目录下。2、把hbase/lib目录下的所有*.jar文件拷贝到hive/lib目录下。3、在hive的配置文件中  查看详情

Hive INSERT OVERWRITE 显示错误

...1309:50:10【问题描述】:我正在研究将hbase-0.98.19与hive-1.2.1集成的示例。我已经使用命令在hbase中创建了一个表CREATETABLEhbase_table_emp(idint,namestring,rolestring)STOREDBY\'org.a 查看详情

如何在 HBase 和 Impala 中提取给定日期而不与 hive 集成的星期几?

】如何在HBase和Impala中提取给定日期而不与hive集成的星期几?【英文标题】:HowtoextractdayofweekgivenadateinHBaseandImpalawithoutintegrationwithhive?【发布时间】:2019-08-0900:24:34【问题描述】:例如,2019-08-09是星期五。但是在Impaladocumentation... 查看详情

新闻网大数据实时分析可视化系统项目——12hive与hbase集成进行数据分析

(一)Hive概述(二)Hive在Hadoop生态圈中的位置(三)Hive架构设计(四)Hive的优点及应用场景(五)Hive的下载和安装部署1.Hive下载Apache版本的Hive。Cloudera版本的Hive。这里选择下载Apache稳定版本apache-hive-0.13.1-bin.tar.gz,并上传至b... 查看详情

hive教程---整合hbase

目录6.4.1HBase与Hive的对比6.4.2HBase与Hive集成使用6.4.1HBase与Hive的对比Hive(1)数据仓库Hive的本质其实就相当于将HDFS中已经存储的文件在Mysql中做了一个双射关系,以方便使用HQL去管理查询。(2)用于数据分析、清洗Hive适用于离线的数据... 查看详情

hive整合hbase

摘要Hive提供了与HBase的集成,使得能够在HBase表上使用HQL语句进行查询插入操作以及进行Join和Union等复杂查询、同时也可以将hive表中的数据映射到Hbase中。??应用场景2.1将ETL操作的数据存入HBase???? ???2.2HBase作为Hive的数据源?? ??2.3... 查看详情

数据库与数据仓库的比较hbase——hive

...仓库(DataWarehouse)是一个面向主题的(SubjectOriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,用于支持管理决策。(1)面向主题:指数据仓库中的数据是按照一定的主题域进行... 查看详情

新闻实时分析系统hive与hbase集成进行数据分析clouderahue大数据可视化分析

1.Hue概述及版本下载1)概述Hue是一个开源的ApacheHadoopUI系统,最早是由ClouderaDesktop演化而来,由Cloudera贡献给开源社区,它是基于PythonWeb框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析... 查看详情

Pentaho 中的 Hive 数据集成错误

】Pentaho中的Hive数据集成错误【英文标题】:HiveDataIntegrationerrorinPentaho【发布时间】:2014-08-2707:25:51【问题描述】:我正在使用BigdataLite3.0、Pentaho5.1、CDH5.0。我想使用Pentaho连接Hive表。尝试连接时,出现以下错误。Errorconnectingtodat... 查看详情

hbase(代码片段)

...duce将本地数据导入到HBase4.3.3自定义HBase-MapReduce4.4与Hive的集成4.4.1HBase与Hive的对比4.4.2HBase与Hive集成使用5HBase优化5.1高可用5.2预分区5.3RowKey设计5.4内存优化5.5基础优化6HBase实战之谷粒微博总结#1HBase简介1.1HBase定义HBase是一种分布式... 查看详情

Spark 2.3.0 SQL 无法将数据插入 hive hbase 表

...发布时间】:2018-06-0411:51:09【问题描述】:使用与hive2.2.0集成的Spark2.3thriftserver。从火花直线运行。尝试将数据插入hivehbase表(以hbase作为存储的hive表)。插入hive本机表是可以的。插入hivehba 查看详情

SparkSQL+Hive+Hbase+HbaseIntegration 不起作用

...9-0205:59:14【问题描述】:当我尝试连接配置单元表时出现错误(正在在spark中通过HbaseIntegration创建)我遵循的步骤:Hive表创建代码:CREATETABLEtest.sample(idstr 查看详情

sparksql同步hbase数据到hive表

...本地环境版本一定要与依赖包版本保持一直,不然报如下错误java.lang.IllegalArgumentException:UnrecognizedHadoopmajorversionnumber:3.1.1hbase1.X与2.X有很大差距,所以再看案例参考是一定要结合自己的hbase版本。笔者程序编译中遇到CannotResolvesymbo... 查看详情