• 文章介绍
  • 评价建议

  • 大数据学习笔记手打版《Hadoop学习文档》简介

    这是一本关于大数据学习记录的手册,主要针对初学者.做为一个老IT工作者,学习是一件很辛苦的事情.希望这本手册对帮助大家快速的学习与认识大数据(特指HadoopSpark),为了不让初学者一下接触爆炸式的新概念,我们会以实验先行,概念跟进的方式进行课程学习,这样有利于大家快速进入状态,而不至于一直深陷逻辑概念出不来,但是每个人的学习方式不一样,仁者见仁智者见智吧

    大数据学习笔记手打版《Hadoop学习文档》精彩内容分享

    Hadoop

    Apache Tez – 它是一个针对Hadoop数据处理应用程序的新分布式执行框架,该框架基于YARN;

    SpatialHadoop – SpatialHadoop是Apache Hadoop的MapReduce扩展,专门用于处理空间数据;GIS Tools for Hadoop –用于Hadoop框架的大数据空间分析;

    Elasticsearch Hadoop – Elasticsearch与Hadoop深度集成,可用于实时搜索和分析,支持Map/Reduce、 Cascading、Apache Hive和Apache Pig;

    dumbo - Python模块,使Hadoop程序的编写和运行更为容易;

    hadoopy – 用Cython写的Python MapReduce库;

    mrjob - mrjob是一个Python2.5+程序包,可以帮助编写和运行Hadoop工作流;

    pydoop -为Hadoop提供Python API的程序包;

    hdfs-du -Hadoop分布式文件系统(HDFS)的交互可视化;

    White Elephant - Hadoop的日志聚合器和仪表板;

    Genie - Genie提供REST-ful API,以便运行Hadoop、Hive和Pig jobs,还管理多个Hadoop资源,并在它们之间进行作业提交;

    Apache Kylin –最初来自eBay公司的开源分布式分析引擎,能提供Hadoop之上的SQL查询接口及多维分析(OLAP),以支持超大规模数据集;

    Crunch -基于Go的工具包,用于在Hadoop上的ETL和特征提取;

    Apache Ignite -分布式内存平台。

    大数据学习笔记手打版《Hadoop学习文档》目录

    介绍

    第一章 概念

    第二章 云计算技术

    1 结构化数据与非结构化数据

    第三章 Hadoop是什么

    1.基本概念

    2.原理漫画

    3.技术选型

    第四章 Hadoop的安装

    1.Hadoop 2.6.2伪分布式

    2.Hadoop 2.6.2完全分布式

    3 Hadoop 2.7.2完全分布式

    4.Hadoop的组件

    5.SSH免密钥登录

    第五章 Ambari集群管理

    1.Ambari集群安装

    第六章 Hive

    1.Hive 1.1.1的安装

    2.Hive 2.1.0的安装

    3.Hive的基本使用与导入导出

    4.Hive数据类型与文件格式

    5 Hive的存储架构与HQL语法

    6 Hive的模式设计与事务性

    7 Hive综合案例实战

    8 Hive开发

    9 Hive安全

    10 FAQ

    第七章 Sqoop

    1.Sqoop2的安装

    2.Sqoop1的安装

    3.Sqooq1综合案例

    4.Sqooq2综合案例

    5.DataX性能对比

    第八章 HBASE

    1.HBASE的伪分布安装与分布式安装

    2.HBASE常用的Shell命令

    3.基于HBASE的Java开发

    4.基于HBASE的Python开发

    5.HBASE与传统数据库的区别

    6.HBASE安装疑难杂症

    7.Hive与Hbase的区别

    第九章 HBASE实战

    1.HBASE基于Java开发

    2.整合SQL引擎层

    3.基本数据迁移

    4.基于Bulk load的数据迁移

    5.使用管理工具

    6 Hbase 数据备份及恢复

    7 监控与诊断

    副录-HBase资源收集

    第十章 Spark

    1. 基YARN安装

    2.基于Mesos安装

    3.Hadoop与Spark的区别

    第十一章 CDH的发行版本

    1.基于Centos的安装

    2.基于Ubuntu的安装

    第十二章 TDH发行版本

    1.安装

    2.Inceptor-SQL使用

    3.使用JDBC、ODBC工具连接Inceptor

    4 Sqoop的使用

    5 使用JDBC、ODBC工具连接Inceptor

    6 SQL兼容测试

    7 SQL语法知识

    附录 POC前的准备工作

    第十三章 HUE安装与配置

    第十四章 数据采集与爬虫

    第十五章 Hadoop相关资源

    1 github相关资源收集

    第十五章 Hadoop100问

    第十六章 大数据框架合集

    1.电商网站架构案例

    第十七章 运维

    1.运维常用工具

    第十八章 机器学习入门

    第十九章 Centos下的Oracle安装

    第二十章 基于JFinal的大数据框架快速开发

    1 基于Gradle的项目构建

    附录 Hadoop

    免责声明:
    1. 本站资源转自互联网,源码资源分享仅供交流学习,下载后切勿用于商业用途,否则开发者追究责任与本站无关!
    2. 本站使用「署名 4.0 国际」创作协议,可自由转载、引用,但需署名原版权作者且注明文章出处
    3. 未登录无法下载,登录使用金币下载所有资源。
    IT小站 » 大神大数据学习笔记手打版《Hadoop学习文档》超高清PDF整本下载【27M 677页】

    常见问题FAQ

    没有金币/金币不足 怎么办?
    本站已开通每日签到送金币,每日签到赠送五枚金币,金币可累积。
    所有资源普通会员都能下载吗?
    本站所有资源普通会员都可以下载,需要消耗金币下载的白金会员资源,通过每日签到,即可获取免费金币,金币可累积使用。

    发表评论