
Hbase
文章平均质量分 56
HBase 是一种分布式、可扩展、支持海量数据存储的 NoSQL 数据库
莫叫石榴姐
10多年IT经验,数仓及SQL领域教练及专家,曾作为主面试官,面试多个候选人
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Spark读写数据demo
读HBase数据import org.apache.hadoop.hbase.HBaseConfigurationimport org.apache.hadoop.hbase.mapreduce.TableInputFormatimport org.apache.hadoop.hbase.util.Bytesimport org.apache.spark._object HbaseSparkRead { def main(args: Array[String]): Unit = {原创 2021-04-25 11:36:33 · 292 阅读 · 0 评论 -
HBase块缓存
块缓存HBase提供了两种不同的BlockCache实现,来缓存从HDFS中读取的数据:默认的on-heapLruBlockCache和BucketCache(通常是off-heap)。本节讨论每个实现的优点和缺点、如何选择适当的选项以及每种配置选项。缓存选择LruBlockCache是原始实现,完全在Java堆内。BucketCache是可选的,主要用于保持块缓存数据脱离堆,尽管BucketCache也可以是文件支持的缓存。当您启用BucketCache时,您将启用两层缓存系统。我...转载 2021-02-01 14:07:39 · 1027 阅读 · 0 评论 -
HBase经典面试常问问题汇总
1 每天百亿数据存入HBase,如何保证数据的存储正确和在规定的时间里全部录入完毕,不残留数据答:看到这个题目的时候我们要思考的是它在考查什么知识点?我们来看看要求:1)百亿数据:证明数据量非常大2)存入HBase:证明是跟HBase的写入数据有关3)保证数据的正确:要设计正确的数据结构保证正确性4)在规定时间内完成:对存入速度是有要求的那么针对以上的四个问题我们来一一分析1)数据量百亿条,什么概念呢?假设一整天60x60x24 = 86400秒都在写入数据,那么每秒的写入条数高达100原创 2021-01-27 10:38:27 · 1614 阅读 · 1 评论