大数据计算机基础(第2版)/大数据分析统计应用丛书
定 价:75 元
丛书名:大数据分析统计应用丛书
- 作者:张延松,王成章,徐天晟 著
- 出版时间:2020/7/1
- ISBN:9787300279015
- 出 版 社:中国人民大学出版社
- 中图法分类:TP274
- 页码:527
- 纸张:胶版纸
- 版次:2
- 开本:16开
《大数据计算机基础(第2版)/大数据分析统计应用丛书》是中国人民大学、北京大学、中国科学院大学、中央财经大学、首都经济贸易大学五所高校联合培养大数据分析硕士实验班的计算机基础教材,目标是培养学生掌握大数据分析处理必备的计算机基础知识与技能。
随着信息技术的不断发展和大数据分析需求的快速增长,大数据分析处理技术成为继互联网、信息高速公路之后的又一个基础设施。大数据分析处理技术已逐渐渗透到社会应用的各个领域,建立了以数据为中心的、数据密集型的计算科学范式。面对大数据浪潮,传统的统计、人文、社会等学科需要在大数据背景下拓展传统学科的基础理论,以适应大数据生存环境并借助大数据技术开拓新的理论、应用与研究空间。
本书定位于大数据分析处理背景下的计算机基础知识教育,采用实践教学为主、理论教学为辅、案例任务驱动的教学模式,培养学生掌握必备的开源操作系统Linux、开源社区广泛应用的Python语言以及数据库分析处理技术基础理论和技能,并结合典型案例任务,让学生能够理论与实践相结合,学习和掌握以数据为中心的数据分析处理技术,为应用大数据分析处理技术打下扎实的计算机基础并掌握必备的数据分析处理知识与技能。
本书第1篇为Linux基础,主要目标是使学生了解开源社区广泛使用的Linux操作系统的基础知识、基本使用方法和基于Linux平台的文件管理及应用管理技术,使学生能够适应大数据分析处理软件使用的操作系统平台,进而完成文件管理、应用管理、Linux平台下的数据库及Hadoop软件安装与配置等任务。
本书第2篇为Python程序设计基础,主要目标是介绍开源社区中具有代表性的Python程序语言的基础知识、基本编程技能和面向数据分析处理的实践应用案例,使学生掌握使用Python语言进行数据分析处理的能力,为分布式环境下的数据分析处理打下基础。
本书第3篇为数据库基础,重点介绍与数据分析处理相关的数据库基本理论、SQL数据库分析处理技术及数据库实践应用案例,以企业级数据库案例为指导,设计企业级数据分析处理任务及应用案例,使学生了解企业级数据库设计的原理、基本原则及数据分析处理技术,学会使用数据库工具完成数据分析处理任务,并通过案例实践任务掌握企业级数据分析处理的基本技能。
在教材的组织与设计上我们采用“做减法”和“做加法”两种策略。首先,在教材的组织上,针对大数据分析处理技术计算机基础课程的教学目标裁剪出适当的教学内容,在Linux操作系统、Python程序设计和数据库基础知识三个领域保留与数据分析处理技术关系最为密切的知识结构,精简教材内容;然后在教学内容的设计上,针对大数据分析处理技术及应用需求扩展教学内容、深度与广度,设计相关的案例实践内容,使教材的知识结构和理论结构与大数据分析需求相衔接,理论与实践紧密结合,引导学生在任务实践中掌握数据分析处理的相关技能,达到服务于大数据分析处理技术所需要的使用开源操作系统、掌握开源编程语言、应用数据库分析处理技术的目标。
本书是中国人民大学、北京大学、中国科学院大学、中央财经大学、首都经济贸易大学五所高校联合培养大数据分析硕士实验班的计算机基础教材,目标是使学生掌握大数据分析处理必备的计算机基础知识与技能。Linux基础篇由首都经济贸易大学徐天晟老师编著,Python程序设计基础篇由中央财经大学王成章老师编著,数据库基础篇由中国人民大学张延松老师编著。同时,我们感谢中国人民大学统计学院吕晓玲老师对课程建设提出的宝贵意见,以及中国人民大学出版社的大力支持!
张延松,工学博士,中国人民大学信息学院副教授。主要研究方向为大数据分析技术、内存数据库、GPU数据库、数据仓库等。参与或主持了工信部核高基重大专项课题、国家863计划项目、国家自然科学基金重点项目、国家自然科学基金面上项目等多项内存数据库方向的课题研究,在国内外主要学术会议和期刊发表20多篇学术论文。出版著作5部,专著1部,教材4部。
王成章,工学博士,中央财经大学统计与数学学院副教授,研究生导师。主要研究领域:大数据分析、人工智能、机器学习、优化计算。近年来在Economic Modelling,J COMPUT CHEM, DEStech Transactions on Computer Science and Engineering,ICPR,《自动化学报》等高水平杂志和会议发表论文10余篇。参与多项国家自然科学基金、北京市自然科学基金项目。
徐天晟,工学博士,首都经济贸易大学管理工程学院教授。研究领域主要为认知科学、人工智能、系统复杂性分析、数据科学等。主持国家社科项目、教育部项目、北京市社科项目等三项,参与***及省市级项目多项;在期刊及国际会议上发表论文近20篇;出版工具书1部,专著2部;出版大数据相关教材一部。
第1篇 Linux基础
第1章 Linux概况
第1节 Linux的历史
第2节 Linux的现状
第3节 Linux的初体验
第2章 用户界面和文件管理
第1节 Linux用户界面
第2节 文件管理
第3章 编辑器及shell编程
第1节 文本编辑器
第2节 shell介绍
第3节 shell编程基础
第4章 用户权限及磁盘管理
第1节 Linux用户设置
第2节 Linux磁盘管理
第5章 系统管理及Linux基本网络配置
第1节 Linux系统管理
第2节 Linux基本网络命令
第3节 Linux软件安装方法
第4节 Hadoop环境搭建实例
第2篇 Python程序设计基础
第6章 Python基础知识
第1节 Python简介
第2节 Python编程的基本概念及基本原则
第3节 Python语言的控制结构
第4节 Python语言的基本数据结构
第5节 Python语言的输入与输出
第7章 Python语言的模块
第1节 Python语言的模块简介
第2节 Python语言常用模块简介
第3节 Python语言的函数
第8章 Python语言的类
第1节 Python语言的类简介
第2节 类的继承
第3节 Python语言的异常类
第9章 利用Python获取数据——网络爬虫介绍
第1节 Python网络爬虫的基本框架
第2节 Python语言加载网页
第3节 网页的HTML代码
第4节 Python网络爬虫定位目标数据
第5节 Python网络爬虫提取所有数据
第10章 利用Python进行数据处理
第1节 Python语言的高级数据结构
第2节 利用Python进行简单统计计算
第3节 利用Python进行数据可视化
第3篇 数据库基础
第11章 数据库基础知识
第1节 数据库的基本概念
第2节 关系数据模型
第3节 关系操作、关系代数和关系运算
第4节 数据库系统结构与组成
第5节 代表性数据库系统
第12章 数据库查询语言SQL
第1节 SQL概述
第2节 TPC-H案例数据库简介
第3节 数据定义SQL
第4节 数据查询SQL
第5节 数据更新SQL
第6节 视图的定义和使用
第7节 面向大数据管理的SQL扩展语法
第13章 数据库查询处理与查询优化技术
第1节 数据库查询处理实现技术和查询优化技术基本原理概述
第2节 内存查询优化技术
第3节 查询优化案例分析
第14章 SQL Server2017数据库分析处理案例
第1节 SQL Server2017在Windows平台的安装与配置
第2节 SQL Server数据库数据导入导出
第3节 基于TPC-H数据库的OLAP案例实践
第4节 SQL Server2017内置Python功能