死,这是第二遍总结了,第一遍刚总结完,就被臭宝给直接退出了,无语,再来一次。
首先简单的说一下hive是个什么东西,能用来在做什么。hive其实就是一个数据库,在大数据时代,常用来构建数据仓库。简称数仓,当然,我以前也做过数据仓库的项目,但是都是用oracle来写的。既然是数据库,那么也离不开sql,hive中的sql又叫hql,所以排除API编写和底层原理的话,学习起来的学习成本不是很高。那么就再总结一次hive常用命令吧,之余hive的性能调优,之前也写了一部分,有兴趣的伙伴可以去瞅瞅哈。
就从最简单的增删改查来写吧。
1 创建数据库
有两种创建方法,如果不指定创建路径的话,会默认存放再HDFS上
1.1 默认创建数据库
create database db_hive;
默认创建hive数据库存放的位置
1.2 指定路径创建数据库:
create database db_hive2 location '/db_hive2.db';
效果如下:
1.3 查看创建数据库的信息,包括存储位置等;
show create database db_hive;
1.4 修改数据库信息(暂不支持修改数据库名称):
用户可以使用ALTER DAT