当前位置: 首页 / 技术干货 / 正文
[2019好程序员大数据教程]6天如何玩转HBase?(57集视频+源码+笔记)

2019-11-22

BigData 大数据培训 大数据 教程 好程序员

[2019好程序员大数据教程]6天如何玩转HBase?(57集视频+源码+笔记)

1、什么是HBase?

 

HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。

 

就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。

 

2、HBase体系架构(图)

图片1

3、HBase具有哪些优点

1)写入性能高,且几乎可以无限扩展。

2)海量数据下(100TB级别表)的查询依然能保持在5ms级别。

3)存储容量大,不需要做分库分表,切勿维护简单。

4)表的列可以灵活配置,1行可以有多个非固定的列。

 

4、2019好程序员大数据教程-6天如何玩转HBase

1)课程简介

在本课程中,主要讲述了HBase详细的架构原理及特点、HBase内部各个角色的详细介绍、安装配置、HBase的Shell操作、新旧版本的读写数据详细流程、HBase的API操作等等。

2)哪些人适合学习:

具有一定大数据基础的人群

3)课程目录:

day1

 

01.HBase是什么

02.HBase的作用

03.HBase的表结构

04.HBase的内部结构原理

05.HBase各个节点之间的关联

06.HBase各个节点之间的映射关系

 

day2

 

07.HBase的单机节点安装前准备

08.HBase的单机节点安装

09.HBase的单机测试与启动

10.HBase的伪分布式安装介绍

11.HBase的伪分布式安装以及配置说明

12.HBase的全分布式安装说明

13.HBase的全分布式安装以及配置说明

14.HBase全分布式启动与测试

 

day3

 

15.ddl:namespace

16.ddl建表

17.ddl表的其他操作

18.dml:put

19.dml:scan

20.dml:get

21.dml修改数据和删除

22.dml:count

23.JAVA API 连接HBase服务

 

day4

 

24.封装连接工具类

25.封装模板类

26.Namespace的CRUD

27.Table的创建

28.查询表中所有列簇

29.修改表

30 删除表中的列簇

31 删除表

32 进一步重构工具类

33 添加记录

34.获取行键指定的列簇信息

35.批量查询Get

36.scan查询

37.再次重构工具类

38.删除表数据

 

day5

 

39.单列过滤器

40.过滤器链进行列值查询

41.重构工具类

42.RegexStringComparator

43.SubstringComparator

44.BinaryPrefixComparator

45.BinaryComparator

46.FamilyFilter

47.QualifierFilter

48.ColumnPrefixFilter

49.MultipleColumnPrefixFilter

50.RowFilter

 

day6

 

51.布隆过滤器

52.HBase的寻址机制

53.HBase2HDFS

54.HBase2HDFS的文件格式问题

55.HDFS2HBase

56.Hive2HBase

57.HBase2Hive测试

尾注:

精心整理,实属不易,手动点赞,以示鼓励

想获取更多WEB相关学习资源(视频+工具+面试题+技术文档+源码+……+整合项目)加裙:645186603

关注作者vx公众号“好程序员”,回复“DT2”即可领取57集的“6天玩转HBase”视频+源码+笔记!想学习大数据的小伙伴抓紧时间领取!

好程序员公众号

  • · 剖析行业发展趋势
  • · 汇聚企业项目源码

好程序员开班动态

More+
  • HTML5大前端 <高端班>

    开班时间:2021-04-12(深圳)

    开班盛况

    开班时间:2021-05-17(北京)

    开班盛况
  • 大数据+人工智能 <高端班>

    开班时间:2021-03-22(杭州)

    开班盛况

    开班时间:2021-04-26(北京)

    开班盛况
  • JavaEE分布式开发 <高端班>

    开班时间:2021-05-10(北京)

    开班盛况

    开班时间:2021-02-22(北京)

    开班盛况
  • Python人工智能+数据分析 <高端班>

    开班时间:2021-07-12(北京)

    预约报名

    开班时间:2020-09-21(上海)

    开班盛况
  • 云计算开发 <高端班>

    开班时间:2021-07-12(北京)

    预约报名

    开班时间:2019-07-22(北京)

    开班盛况
IT培训IT培训
在线咨询
IT培训IT培训
试听
IT培训IT培训
入学教程
IT培训IT培训
立即报名
IT培训

Copyright 2011-2023 北京千锋互联科技有限公司 .All Right 京ICP备12003911号-5 京公网安备 11010802035720号