【大数据&AI人工智能】HBase 高可用、高性能原理讲解:LSM Tree / 数据压缩 Minor Compaction和Major Compaction / Bloom Filter/Cache
文章目录
HBase 简介
HBase是一个开源的分布式非关系型(NoSQL)数据库,专为处理大规模数据存储和实时查询而设计。它参考了Google的BigTable模型,并作为Apache Hadoop项目的一部分,实现语言为Java。HBase运行在Hadoop Distributed File System(HDFS)之上,为Hadoop提供类BigTable的服务。以下是HBase的一些关键特性:
关键特性
- 分布式存储:HBase利用Hadoop的分布式文件系统HDFS,将数据分布在多个节点上,提供水平扩展的能力。
- 列式存储:与关系型数据库的行式存储不同,HBase的数据模型是面向列的。这允许更高效地压缩和访问同一列族的数据,从而减少磁盘I/O,并提供大规模数据下的查询性能。