《大数据巨量分析与机器学习的整合与开发》讲述大数据和机器学习的基本概念,如:分类、分析、训练、建模、预测、机器学习(推荐引擎)、机器学习(二元分类)、机器学习(多元分类)、机器学习(回归分析)和数据可视化应用。为降低读者学习大数据技术的门槛,书中提供了丰富的上机实践操作和范例程序详解,展示了如何在单台Windows系统上通过Virtual Box虚拟机安装多台Linux虚拟机,如何建立Hadoop集群,再建立Spark开发环境。
第1章 大数据发展综述
1.1 大数据的发展历程
1.2 大数据国内外现状
1.3 大数据的概念
1.4 大数据系统架构
1.5 大数据分析分类
1.6 大数据基准
1.7 大数据面临的挑战
1.8 大数据科学问题
第2章 机器学习研究进展
2.1 机器学习发展简史
2.2 机器学习发展现状
2.3 机器学习策略与方法
2.4 机器学习的经典算法
第3章 大数据机器学习系统
3.1 大数据机器学习系统研究背景
3.2 大数据机器学习研究现状
3.3 大数据机器学习系统的技术特征及主要研究问题
3.4 大数据机器学习相关技术
3.5 大数据机器学习平台总体架构
第4章 大数据巨量分析与机器学习的应用领域
4.1 互联网领域
4.2 商业领域
4.3 工业领域
4.4 农业信息化建设领域
4.5 医疗行业
4.6 城市规划与建筑工程
4.7 其他研究领域
第5章 标签系统
5.1 认识标签系统
5.2 标签系统的设计
5.3 标签系统的实现
第6章 数据自助营销平台
6.1 数据自助营销平台的价值所在
6.2 数据自助营销平台的实现原则
6.3 数据自助营销平台的场景实例
第7章 基于Mahout的个性化推荐系统
7.1 Mahout的推荐引擎
7.2 规模与效率
7.3 实现一个推荐系统
第8章 图计算与社会网络
8.1 社会网络和属性图
8.2 Spark Graph X与Neo4j
8.3 使用Spark Graph X和Neo4j处理社会网络
第9章 机器学习的哲学探索
9.1 机器学习哲学前沿科学基础
9.2 机器学习的可能实现途径分析
9.3 机器学习算法及其知识发现功能
9.4 机器学习展望
参考文献