028-86763871

精品课程

Hadoop NoSQL中的HBase是什么?

  • 来源:
  • 2020-10-16 17:05
  • 阅读()
  • 分享
HBase是面向列的数据存储,位于Hadoop分布式文件系统之上,并为大数据顾问提供随机数据查找和更新。Hadoop分布式文件系统基于“多次写入”架构,这意味着一次写入HDFS存储层的文件不能被修改,只能被读取多次。但是,HBase在HDFS文件之上提供了一个架构,可以多次访问和更新这些文件。

HBase特性
 
 
强大的一致性
HBase为读/写提供了强大的一致性,这意味着您将始终在读操作中获取最新数据,并且除非所有副本都已更新,否则写操作将不会完成。

水平可扩展
HBase使用区域概念提供自动分片,这些概念分布在整个群集中。每当表大小太大而无法容纳数据时,表都会自动分片并分布在多台计算机之间。

容错
HBase在发生故障时提供自动区域故障转移。

HDFS / MapReduce集成
HBase基于HDFS,可以与MapReduce程序集成以充当源和接收器。

Java API / Rest / Thrift API
HBase为非Java端点提供Java API以及Rest / Thrift API

查询优化
HBase具有内置的块缓存和Bloom过滤器,用于查询优化。

什么时候不使用HBase?
当您的数据不够大时。HBase适用于无法以传统RDBMS数据库容纳的数十亿行表示的数据。
当您的数据以恒定的速率增长并且将来不会增长时。
当您不关心事务控制,触发器,二级索引以及传统数据库支持的许多其他功能时。

HBase架构
HBase具有Master-Slave体系结构,其中我们有一个HBase Master(也称为HMaster)和多个从属(称为区域服务器或HRegionServers)。
区域:HBase中的表分为多个区域,这些区域分布在集群中的多台计算机上。
HBase主站:HBase负责将区域分配给区域服务器,提供管理控制台(以创建,更新和删除表)并控制故障。在读取请求的情况下,HMaster接收客户端请求并将其转发到适当的区域服务器。
区域服务器从站:区域服务器在所有工作节点上运行,并服务于一组区域。区域服务器由块缓存组成,该块缓存包含频繁访问的数据,以更有效地满足读取请求。区域服务器还包含内存存储区,该内存存储区是写缓存,用于缓存尚未写入磁盘的新数据。数据被写入区域服务器磁盘上的多个Hfile。
ZooKeeper:HBase使用Zookeeper进行协调和故障恢复。Zookeeper包含有关HBase主服务器和区域服务器的配置信息。客户端必须首先访问zookeeper才能与HBase群集连接。ZKquoram是一个Zookeeper守护程序,它监视故障并修复故障节点。因此Zookeeper是HBase体系结构不可或缺的一部分,该体系结构维护HBase集群中的所有协调和同步。

HBase数据模型
 
HBase表:它是行的集合,并且这些表分布在分布式区域中。
HBase行:表示HBase表中的单个实体。
行键:就像主键一样,用于唯一标识HBase表中的每一行。
列:列代表实体的属性。例如,在客户HBase表中,列可以是客户名称、年龄、电话号码等。
列族:所有表现出某些相同性质的列都可以合并到同一列族中,并且这些列作为Hfile存储在Hadoop分布式文件系统中。

HBase入门
我们将使用HBase shell命令,然后使用Java API,创建名为雇员的下表。雇员表有两个列族,即“个人列族”(代表姓名,年龄等个人信息)和“专业列族”(代表职业信息,如薪水和职务)。
 
 
HBase Shell命令
 
 
Java API
建立表格
 
放入数据
 
更新表
 
读取数据
 
修改表
 
结论
 
当您的大数据已经存储在Hadoop上时,HBase是理想的选择。HBase通过提供随机的读/写和更新来减轻HDFS系统的缺点。它是一个分布式的、水平可伸缩的、容错的数据存储,与Hadoop Cluster配合得很好。

课程好礼申请领取
您的姓名
您的电话
意向课程
 

优越学院

官方QQ

扫描上方二维码或点击一键加群,免费领取价值599元网课,加群暗号:599。 一键加群

下一篇:没有了

上一篇:Hadoop术语:20个最重要的Hadoop术语

推荐阅读

优越学院:youyue-college

关注优越学院官方微信

  • 关注微信回复关键词“大礼包”,领80G学习资料
QQ交流群
领取免费网课
(加群备注“网站”)
IT培训交流群 加入群聊 +
软件测试 加入群聊 +
全链路UI/UE设计 加入群聊 +
Python+人工智能 加入群聊 +
Java开发 加入群聊 +
大前端 加入群聊 +
大数据 加入群聊 +
Linux云计算 加入群聊 +
优越学院官方微信
扫码回复关键词“大礼包”
领取80G学习资料