本书从基础知识入手,详细讲解通过强化学习和深度学习构建AI系统所需的一切,并通过5个完整的项目实例,循序渐进展示如何使用*佳、*简单的AI编程工具(包括Python、TensorFlow、Keras和PyTorch)构建智能软件。具体内容包括AI工具包、Python基础、AI基础技巧、你的第一个AI模型、销售和广告中的AI、Q学习、物流行业中的AI、人工大脑、自动驾驶车辆中的AI、商业中的AI、深度卷积Q学习、游戏中的AI。
译者序
前言
作者简介
审校者简介
第1章 欢迎来到机器人世界1
1.1 开始你的AI旅程1
1.2 四种不同的AI模型2
1.3 学习AI可以让你做什么3
1.4 小结5
第2章 探索你的AI工具包6
2.1 GitHub源代码页面6
2.2 Colaboratory 运行环境7
2.3 小结11
第3章 Python基础——学习如何用Python编程12
3.1 显示文本13
3.2 变量和操作13
3.3 列表和数组14
3.4 if语句和条件16
3.5 for循环和while循环17
3.6 函数21
3.7 类和对象22
3.8 小结24
第4章 AI基础技巧25
4.1 什么是强化学习25
4.2 强化学习的五大原理26
4.2.1 原理#1——输入与输出系统26
4.2.2 原理#2——奖励27
4.2.3 原理#3——AI环境27
4.2.4 原理#4——马尔可夫决策过程28
4.2.5 原理#5——训练与推断28
4.3 小结30
第5章 你的第一个AI模型——小心老虎机31
5.1 多臂老虎机问题31
5.2 汤普森采样模型32
5.2.1 模型编程32
5.2.2 理解模型36
5.2.3 什么是分布37
5.2.4 应对多臂老虎机问题39
5.2.5 汤普森采样策略三步走41
5.2.6 汤普森采样模型的临门一脚42
5.2.7 汤普森采样模型与标准模型42
5.3 小结44
第6章 销售和广告中的AI——像“AI街之狼”一样销售45
6.1 待解决的问题45
6.2 用仿真构建AI环境47
6.2.1 运行仿真程序48
6.2.2 回顾50
6.3 AI解决方案及其直觉的回顾50
6.3.1 AI解决方案51
6.3.2 直觉51
6.4 技术实现52
6.4.1 汤普森采样与随机策略选择52
6.4.2 开始编程52
6.4.3 最终结果57
6.5 小结58
第7章 欢迎来到Q学习59
7.1 迷宫59
7.1.1 第一步60
7.1.2 构建环境61
7.1.3 构建AI模型64
7.2 Q学习的完整流程66
7.2.1 训练模式66
7.2.2 推断模式67
7.3 小结67
第8章 物流行业中的AI——仓库中的机器人68
8.1 构建环境69
8.1.1 状态70
8.1.2 行为70
8.1.3 奖励70
8.1.4 AI解决方案回顾70
8.2 技术实现71
8.2.1 第1部分——构建环境72
8.2.2 第2部分——用Q学习构建AI解决方案74
8.2.3 第3部分——进入推断模式75
8.2.4 改进1——自动化奖励分配77
8.2.5 改进2——加入一个中间目标80
8.3 小结82
第9章 人工大脑——深度Q学习83
9.1 预测房价83
9.1.1 上传数据集84
9.1.2 导入依赖库85
9.1.3 排除变量86
9.1.4 准备数据87
9.1.5 构建神经网络90
9.1.6 训练神经网络91
9.1.7 展示结果91
9.2 深度学习理论92
9.2.1 神经元92
9.2.2 激活函数95
9.2.3 神经网络的工作原理98
9.2.4 神经网络如何学习98
9.2.5 正向传播算法和反向传播算法99
9.2.6 梯度下降算法100
9.3 深度Q学习106
9.3.1 归一化指数方法107
9.3.2 深度Q学习回顾108
9.3.3 经验回放109
9.3.4 深度Q学习的完整算法109
9.4 小结110
第10章 自动驾驶汽车中的AI——造一辆自动驾驶汽车111
10.1 构建环境111
10.1.1 设定目标113
10.1.2 设置参数116
10.1.3 输入状态118
10.1.4 输出行为119
10.1.5 奖励120
10.2 AI解决方案回顾122
10.3 技术实现123
10.3.1 第1步——导入依赖库123
10.3.2 第2步——创造神经网络的架构124
10.3.3 第3步——实现经验回放127
10.3.4 第4步——实现深度Q学习130
10.4 演示138
10.4.1 安装Anaconda139
10.4.2 用Python 3.6创建一个虚拟环境140
10.4.3 安装PyTorch142
10.4.4 安装Kivy143
10.5 小结151
第11章 商业中的AI——用深度Q学习使成本最小化152
11.1 要解决的问题152
11.2 构建环境153
11.2.1 服务器环境中的常量和变量153
11.2.2 关于服务器环境的假设154
11.2.3 仿真155
11.2.4 整体功能156
11.2.5 定义状态157
11.2.6 定义行为158
11.2.7 定义奖励158
11.2.8 最后的仿真示例159
11.3 AI解决方案161
11.3.1 大脑162
11.3.2 技术实现163
11.4 演示191
11.5 回顾——通用AI框架/蓝图199
11.6 小结200
第12章 深度卷积Q学习201
12.1 CNN有什么用途201
12.2 CNN的工作原理202
12.2.1 第1步——卷积204
12.2.2 第2步——最大池化206
12.2.3 第3步——扁平化209
12.2.4 第4步——全连接210
12.3 深度卷积Q学习211
12.4 小结212
第13章 游戏中的AI——成为《贪吃蛇》大师213
13.1 要解决的问题213
13.2 构建环境214
13.2.1 定义状态214
13.2.2 定义行为215
13.2.3 定义奖励216
13.3 AI解决方案216
13.3.1 大脑217
13.3.2 经验回放记忆218
13.4 技术实现219
13.4.1 第1步——构建环境219
13.4.2 第2步——构建大脑226
13.4.3 第3步——构建经验回放记忆228
13.4.4 第4步——训练AI模型230
13.4.5 第5步——测试AI模型235
13.5 演示237
13.5.1 安装237
13.5.2 结果242
13.6 小结243
第14章 回顾与总结244
14.1 回顾——整体AI框架/蓝图244
14.2 探索你在AI领域的下一站245
14.2.1 不断练习246
14.2.2 社交247
14.2.3 学无止境247