封面
版权信息
作者简介
内容简介
前言
序言
第一部分 大数据概述
第1章 大数据的时代背景及应用落地
1.1 大数据与“云大物区智”的关联
1.2 大数据平台的应用优势
1.3 大数据平台的技术架构选型和产品对比
第2章 大数据系统的安装及配置
2.1 服务器及操作系统的准备
2.2 JDK、Python和Scala
2.3 Hadoop
2.4 Sqoop
2.5 Hive
2.6 ZooKeeper和HBase
2.7 Flume
2.8 Kafka
2.9 Spark
2.10 Flink
2.11 开源大数据系统各组件的组合
2.12 CDH
2.13 FusionInsight
2.14 小结
第二部分 离线大数据处理
第3章 使用Python爬虫获取数据
3.1 Python爬虫模块的安装
3.2 抓取并解析JSON数据
3.3 抓取并解析HTML中的数据
3.4 使用Python提取文章的关键字
3.5 小结
第4章 Hive在大数据中的角色
- APP免费
4.1 Hive的核心概念及配置使用
- APP免费
4.2 概要设计和物理模型的创建
- APP免费
4.3 加载爬虫数据
- APP免费
4.4 数据的合并、去重和转换
- APP免费
4.5 使用UDF实现数据的转换
- APP免费
4.6 使用Python操作Hive
- APP免费
4.7 ETL数据调度和数据治理
- APP免费
4.8 小结
- APP免费
第5章 使用HBase实现大数据存储
- APP免费
5.1 非关系型数据库及HBase
- APP免费
5.2 HBase的几个核心概念
- APP免费
5.3 HBase数据操作命令
- APP免费
5.4 使用Python操作HBase
- APP免费
5.5 把Hive数据导入HBase
- APP免费
5.6 用Hive外部表读取HBase数据
- APP免费
5.7 小结
- APP免费
第6章 Spark数据分析引擎
- APP免费
6.1 Spark简介
- APP免费
6.2 Spark集群的配置及启动
- APP免费
6.3 调用Hive数据
- APP免费
6.4 调用HBase数据
- APP免费
6.5 使用PySpark进行数据分析
- APP免费
6.6 小结
- APP免费
第7章 使用Flask实现数据展示
- APP免费
7.1 Flask框架简介及站点搭建流程
- APP免费
7.2 Flask微框架的特性
- APP免费
7.3 使用MVC模式搭建项目框架
- APP免费
7.4 检索及加载新闻数据
- APP免费
7.5 小结
- APP免费
第二部分技术点总结
- APP免费
第三部分 流式大数据处理
- APP免费
第8章 使用Flume获取网站访问日志
- APP免费
8.1 Flume的安装及数据流模型
- APP免费
8.2 核心组件的配合使用
- APP免费
8.3 各种数据组合的流动方式
- APP免费
8.4 Apache服务器的日志格式
- APP免费
8.5 合并两个网站的日志
- APP免费
8.6 小结
- APP免费
第9章 Kafka的安装、配置及其与Flume的整合
- APP免费
9.1 Kafka的特性及安装、配置
- APP免费
9.2 几种术语
- APP免费
9.3 Broker的使用方法
- APP免费
9.4 分布式生产者/消费者
- APP免费
9.5 Kafka Connector
- APP免费
9.6 Kafka和Flume的整合
- APP免费
9.7 使用Python连接Kafka
- APP免费
9.8 小结
- APP免费
第10章 Redis数据库简介
- APP免费
10.1 Redis的特点及适用场景
- APP免费
10.2 Redis的安装及命令行使用方法
- APP免费
10.3 使用Python操作Redis
- APP免费
10.4 使用Java操作Redis
- APP免费
10.5 小结
- APP免费
第11章 Flink简介及其与Kafka的整合
- APP免费
11.1 Flink概述及其与Spark的区别
- APP免费
11.2 Flink的架构、特性及工作流程
- APP免费
11.3 Flink的安装
- APP免费
11.4 Flink的作业提交方式
- APP免费
11.5 Flink-Kafka Connector
- APP免费
11.6 使用Flink统计PageView
- APP免费
11.7 小结
- APP免费
第12章 网站页面访问量的动态展示
- APP免费
12.1 百度的ECharts图表功能简介
- APP免费
12.2 页面访问量的动态统计
- APP免费
12.3 生成词云图和占比饼图
- APP免费
12.4 访问日志检索
- APP免费
12.5 小结
- APP免费
第三部分技术点总结
- APP免费
第四部分 云平台搭建
- APP免费
第13章 搭建基于云平台的容器级数据系统
- APP免费
13.1 云平台
- APP免费
13.2 基于云平台的容器集群
- APP免费
13.3 基于容器的大数据系统
- APP免费
13.4 小结
更新时间:2020-07-24 10:15:45