hive系统性学习笔记

@SmartSi @SmartSi     2022-12-11     756

关键词:

1. 基础

1.1 DDL

1.2 DML

1.3 函数

1.4 服务

2. 原理

3. 调优

4. 实战

学习笔记hive——hive安装配置(代码片段)

一、环境介绍环境描述4个Linux操作系统虚拟机使用centos7镜像配置安装java1.8以上版本安装Hadoop2.6.5以上版本安装MySQL5.1以上版本二、安装MySQL(这里我是CentOs7)安装教程链接:https://www.jb51.net/article/150557.htm1、安装完成... 查看详情

hive学习笔记

Hive学习笔记1、Hive安装(只在主节点上安装) (1)下载安装包到/usr/app/目录下 (2)解压 (3)修改配置文件/etc/profile(添加 exportHIVE_HOME=/usr/local/hive-0.9.0-bin exportHADOOP_HOME=/usr/local/hadoop-0.20.2-cdh3u 查看详情

hive学习笔记——crud

1.首先需要安装Hadoop和HiveHadoop和Hive的own和grp都是HadoopHive的安装很简单,在清华镜像站下载Hive的二进制文件,然后解压到/usr/local目录下修改own和grp就行2.启动hive之前需要先启动Hadoop,启动后显示hive>  查看详情

hive学习笔记_hive的表创建

创建hive表注意事项一、表分隔符必须与读取的数据文件一致,比如例子的分隔符为 ‘ ‘(制表符),hive下默认分隔符是制表符。二、最好指定分区作为数据之间的区分。三、创建完表可以desc+表明进行查看,字段名称(fiel... 查看详情

hadoop-hive学习笔记

createtablehive_1(idstring,namestring,genderstring)rowformatdelimitedfieldsterminatedby‘,‘storedasTEXTFILE;loaddatalocalinpath‘/luozt/hive_001.txt‘intotablehive_1;createEXTERNALtablehive_2(idstring,na 查看详情

hive学习笔记(启动方式,内置服务)

一、Hive介绍  Hive是基于Hadoop的一个数据仓库,Hive能够将SQL语句转化为MapReduce任务进行运行。  Hive架构图分为以下四部分。     1、用户接口   Hive有三个用户接口:命令行接口(CLI):以命令行的形式输入SQL语... 查看详情

hive学习笔记

摘要:  Hive 是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简... 查看详情

学习笔记hive——hive简介

一、Hive设计思想(了解)Facebook用户社交数据存储与处理Facebook是美国的一个社交网站,于2004年2月4日上线。主要创始人为美国人马克·扎克伯格。Facebook是世界排名领先的照片分享站点。根据Comscore咨询公司的数据显... 查看详情

学习笔记hive——hive简介

一、Hive设计思想(了解)Facebook用户社交数据存储与处理Facebook是美国的一个社交网站,于2004年2月4日上线。主要创始人为美国人马克·扎克伯格。Facebook是世界排名领先的照片分享站点。根据Comscore咨询公司的数据显... 查看详情

学习笔记hive——hive应用——hive查询(代码片段)

五、Hive查询5.1、创建职工信息表任务实现:1、创建表dept,emp和salgrade2、导入数据将数据emp.txt导入到表emp#emp.txt7369,SMITH,CLERK,7902,1980-12-17,800.00,,207499,ALLEN,SALESMAN,7698,1981-2-20,1600.00,300.00,307521,WARD,SALE 查看详情

hive学习笔记(代码片段)

安装配置安装hive下载hive解压重命名添加环境变量Vi/etc/proflie使环境变量生效Source/etc/profile修改配置文件cphive-env.sh.templatehive-env.shHiveMetastore配置将自带的derby数据库替换为mysql数据库参考文章https://my.oschina.net/u/4292373/blog/3497563登录... 查看详情

hive自定义函数的学习笔记

 前言:   hive本身提供了丰富的函数集,有普通函数(求平方sqrt),聚合函数(求和sum),以及表生成函数(explode,json_tuple)等等.但不是所有的业务需求都能涉及和覆盖到,因此hive提供了自定义函数的接口,方便用户扩展.   自己好像... 查看详情

学习笔记hive——hive应用——hive导入及导出数据(代码片段)

四、Hive导入及导出数据通过HDFS直接导入导出通过Hive命令导入导出4.1、Hive导入数据的语法LOADDATA[LOCAL]INPATH'filepath'[OVERWRITE]INTOTABLEtablename[PARTITION(partcol1=val1,partcol2=val2...)]LOCAL:导入语句带有LOCALÿ 查看详情

hive学习笔记-表操作

Hive数据类型基本数据类型tinyint,smallint,int,biging,float,double,decimal,char,varchar,string,binary,boolean,timestamp,date,引用数据类型Array:同样数据类型组合的数组,使用array[1]訪问MAP:Key-value键值对,通过键进行訪问,使用map[‘key‘]訪问STRUCT:... 查看详情

hive编程指南_学习笔记01

第四章:HQl的数据定义1:创建数据库 createdatabasefinancials; createdatabase ifnotexistsfinancials;2:查看数据库 showdatabases;  模糊查询数据库 showdatabaseslike‘h.*‘;3:创建数据库改动数据库的默认位置 &nbs 查看详情

学习笔记hive——hive开发应用(代码片段)

一、任务1.1、商品零售购物篮分析现代商品种类繁多,顾客往往会由于需要购买的商品众多而变得疲于选择,且顾客并不会因为商品选择丰富而选择购买更多的商品。繁杂的选购过程往往会给顾客疲惫的购物体验。1.2、... 查看详情

60分钟内从零起步驾驭hive实战学习笔记

 本博文的主要内容是:  1. Hive本质解析  2. Hive安装实战  3. 使用Hive操作搜索引擎数据实战   SparkSQL前身是Shark,Shark强烈依赖于Hive。Spark原来没有做SQL多维度数据查询工具,后来开发了Shark,Shark依... 查看详情

hive学习笔记——保存select结果,join,多重插入

1.保存select查询结果的几种方式:1、将查询结果保存到一张新的hive表中createtablet_tmpasselect*fromt_p;2、将查询结果保存到一张已经存在的hive表中(用load的时候,可以是into或者overwriteinto,这里是into或者overwrite)insertinto/overwritetablet_tmp... 查看详情