一:课程简介:
Hadoop是当下云计算大数据的王者。
Hadoop不仅是一个大数据的计算框架,同时也是大数据的存储平台。
使用Hadoop,用户可以在不了解分布式底层细节的情况下开发出分布式程序,从而可以使用众多廉价的计算设备的集群的威力来高速的运算和存储,而且Hadoop的运算和存储是可靠的、高效的、可伸缩的,能够使用普通的社区服务器出来PB级别的数据,是分布式大数据处理的存储的理想选择
使用Hadoop可以主要完成:
1,构建离线处理平台,完成海量离线数据的存储分析,相对于传统的关系型数据库而言,Hadoop可以处理规模更大,处理逻辑更加复杂的内容,现在企业内部多使用以Hive为中心的处理模式;
2,基于Hadoop的子项目HBase可以完成准实时的数据处理;
“云计算分布式大数据Hadoop最佳实践”基于实务经验萃取而成,从Hadoop开发环境的搭建到到图片服务器、WordCount实现、HBase微博系统、话单查询与统计、Hive数据统计案例、电商业日志流量分析项目理论结合实际案例,祝你轻松驾驭Hadoop以满足大数据的分布式处理与存储。
课程以MapReduce、HBase、Hive为主轴,想理解和使用Hadoop,就必须掌握这三大核心。
尤其值得注意的是,在该课程的最新版本中加入了很多Hadoop框架本身的源码内核解析,这直接为成为Hadoop奠定坚实的基础。
二:课程特色
Hadoop领域4个开创先河
1,全程覆盖Hadoop的所有核心内容
2,全程注重动手实作,循序渐进中掌握Hadoop企业级实战技术
3,在授课的过程中会对Hadoop的核心源码进行深度剖析,使得学员具有改造Hadoop框架的能力
4,具备掌握Hadoop完整项目的分析、开发、部署的全过程的能力
三:适合对象:
1, 云计算大数据从业者;
2, 软件工程师;
3, 数据库开发人员;
4, 数据库开发人员;
5, 运维人员;
6, 系统架构师、系统分析师、高级程序员、资深开发人员;
7, 牵涉到大数据处理的数据中心运行、规划、设计负责人;
8, 政府机关,金融保险、移动和互联网等大数据来源单位的负责人;
9, 高校、科研院所涉及到大数据与分布式数据处理的项目负责人;
10, 数据仓库管理人员、建模人员,分析和开发人员、系统管理人员、数据库管理人员以及对数据仓库感兴趣的其他人员;
四:基础要求
了解Linux系统;
了解网络;
了解Java;
五:王家林老师(邮箱[email protected] 电话18610086859QQ:1740415547)
中国目前唯一的移动互联网和云计算大数据集大成者;
云计算大数据Spark亚太研究院院长和首席专家;
Spark亚太研