Hive源码解析与开发实战

(2人)

249.50 元 5 折

全场5折优惠,咨询QQ810476411

课程介绍

开源力量课程 -  Hive源码解析与开发实战


课程背景

  • Hadoop系列大数据课程在开源力量已经运行了快1年了,通过这段时间的课程运行,我们积累了不少经验。现在隆重推出新版“大数据从入门到精通课程”。大数据课程由贾老师和王老师采用线上联合授课的方式,贾老师负责讲授Hive的内容,王老师讲授Hbase的内容,两位老师身处不同的公司,行业背景完全不同,但是在大数据领域都有着自己不同的研究侧重点与项目经验。王老师还会负责hadoop课程的授课,贾老师将承担后期的Spark,mahout,sqoop,storm部分。所以说,通过本课程一门课程的学习,不仅可以学习到大数据领域中Hadoop、hive、hbase,spark,storm,mahout、sqoop等在不同技术与行业应用,同时也可以了解两位老师所处的不同行业在大数据开发与应用方面的实战经验。

课程学习法



    学习方式,更详细说明见这里:http://www.osforce.cn/page/onlineedu (六维学习法)


    • 视频滚动学习,终身有效
    • 老师指导实战练习辅导
    • 24小时讨论区回答
    • 每周视频坐班直播互动答疑
    • 开源力量结业考试
    • QQ同学会交流

课程系列

  • 整套课程从hadoop入门开始,由浅入深,内置“Hive开发实战”,“hadoop源码解析与企业应用开发实战”,“Hbase开发实战”,“Spark,mahout,sqoop,storm诸模块开发实战”。因为这个课程有多个板块组成,所以学员可以按照自己的实际情况选择学习。例如,选择“Hive开发实战”您将学习到Hadoop数据仓库的使用,或选择其他学习模块,而不必4个板块从头开始学。
    特点1:真正做到从0开始,从入门到精通
    特点2:适合不同基础的学员学习
    特点3:阶梯式课程,每个阶段都有明确的主题和目标

知识基础

  • 有Hadoop的基础知识
    有JAVA语言编程基础

课程大纲

  • 学习内容

    第一部分:Hive的环境搭建、基本操作、存储类型与复合数据类型
    主要介绍: Hive的安装、Hive的负载均衡搭建、Hive的访问方式、Hive的数据类型、Hive的CLI操作介绍;TextFile、Sequence
    File、RCFile、Hive的自定输入格式、数据结构;Hive表的创建,内部表和外部表,表的分区,删除表,修改表,查询语句以及where语句
    实战:搭建hive环境;不同数据格式的存储,自定义输入格式并使用;使用不同方式创建内表、外表,新建表分区,编写查询语句
    收获内容:了解hive相关知识,学会搭建hive环境,了解元数据存储以及hive基本操作;学会使用hive不同数据存储格式,并学会如何自定义输入格式并在hive中使用;了解hive不同表之间的区别,学会对表的一些操作,了解hive分区,以及分区的操作

    第二部分:数据加载、修改表属性以及Hive高级查询语句
    主要介绍: Hive加载数据,hive导出数据,修改列属性,修改表的元数据,buckets;group by、Join、Order by、Sort by、distribute by、cluster by、Union all、索引和视图;
    实战:使用命令为表加载数据,查看、修改表属性
    收获内容:了解hive数据实际存储格式,使用不同手段为表加载数据,了解如何查看表的属性并对其进行修改,了解bucket与并使用;学习了解hive支持的高级查询,学会编写高级hql以及了解其底层实现原理。了解视图、索引使用的环境

    第三部分:Hive的内置函数、自定义UDF和UDAF实战
    主要介绍:正则表达式使用,比较常用的内置函数,UDF,UDAF;explain,队列设置,Join优化,本地模式和并行执行,设置Mapper和Reducer的个数,JVM重用,动态分区调整,推测执行,Hive的debug调试
    实战:学会正则表达式在hql中的使用,学习一些比较常用的内置函数,学会编写UDF、UDAF
    收获内容:内置函数使用,学会编写自定义UDF和UDAF

    第四部分Hive调优与安全,Hive原理与体系结构
    主要介绍:查看hive执行计划,进行hql优化,同时进行hive的优化;Hive的Hadoop安全的整合,使用Hive进行验证,Hive的权限管理,分区级别的权限,自动授权;了解
    Hive的基本原理,体系结构与编译执行流程
    实战:学会hive调优方法;进行用户、组、角色的权限管理
    收获内容:了解如何查看hive的执行计划,并根据执行计划优化hql,学会hive中一些优化方法;了解hive和Hadoop权限之间的关系,学会如何设置用户、组、角色的权限进行权限管理

    第五部分Hive的集成与案例实战
    主要介绍:日志处理实战,了解某公司的数据仓库集群架构
    实战:进行日志分析处理工作,搭建自己的数据仓库架构
    收获内容:学习目前日志分析的常规工作,了解企业现有的一些架构,并搭建数据仓库

本期嘉宾


    本期嘉宾:贾杰
  • Hadoop工程师
  • 目前就职于国内第一大网络视频公司,主要从事大数据分析工作,有多年工作经验与hadoop实战经验。对Hadoop及其相关技术有较深入的研究,参与多个分布式云计算项目的研究和实施,对hive有着丰富的实践经验,对于数据挖掘和推荐系统也有深刻的认识。

互动平台

  • ↓↓↓ 扫开源力量微信二维码并关注,不会遗漏开源力量每周免费公开课及最新课程信息


更多常见问题:请点击我~

课时列表

授课老师

Hadoop工程师

学员动态

ygmin 开始学习课时 hive综述
ygmin 学完了课时 免费试听
ygmin 开始学习课时 免费试听
ygmin 开始学习课时 HIVE 实战-第五周
ygmin 开始学习课时 实战案例_flume和kafk...

QQ客服: 810476411

QQ咨询: 810476411

QQ吐槽: 810476411

服务时间: 9:00 - 21:00

刘老师: 18516031455

微信公众号:开源力量