本书系统地介绍了人工智能的基本原理、方法和应用技术,全面反映了国内外人工智能研究领域的最新进展和发展方向。全书共12章。第1章简要介绍了人工智能的概况。第2~6章阐述了人工智能的基本原理和方法,重点论述了知识表示、自动推理、不确定性推理、机器学习和神经网络等。第7章和第8章介绍了专家系统、自然语言处理等应用技术。第9~11 章阐述了当前人工智能的研究热点,包括分布式人工智能与智能体、智能机器人和互联网智能等。第12章探讨了类脑智能,展望人工智能的发展。
本书力求科学性、实用性和先进性,可读性强。内容由浅入深、循序渐进,条理清晰,让学生在有限的时间内掌握人工智能的基本原理与应用技术,提高对人工智能习题的求解能力。
本书可以作为高等院校计算机科学与技术、自动化、智能科学与技术等相关专业的研究生和高年级本科生的人工智能课程教材,也可以供从事人工智能研究与应用的科技人员学习参考。
本书尽可能吸收国际上最新的研究成果,反映人工智能领域在分布式人工智能、机器人、互联网智能和类脑智能等方面的最先进水平。
根据人工智能实际应用需求,安排知识表示、自动推理、机器学习、神经网络、专家系统和自然语言处理等内容,并通过大量的例题讲解解题方法。
《人工智能》自2016年出版以来,广受读者欢迎,出版社已经第9次印刷。在此期间,人工智能飞速发展。党的二十大报告指出,推动战略性新兴产业融合集群发展,构建新一代信息技术、人工智能、生物技术、新能源、新材料、高端装备、绿色环保等一批新的增长引擎。为了反映该领域的最新成果和进展,本书在第1版基础上做了重要补充和修改,修改内容如下:
1)第1章重写了人工智能发展史,将人工智能的发展史划分为形成期、符号智能和数据智能3个时期。
2) 第5章增加了联邦学习。联邦学习是一种分布式机器学习技术,其核心思想是通过在多个拥有本地数据的数据源之间进行分布式模型训练,在不需要交换本地个体或样本数据的前提下,仅通过交换模型参数或中间结果的方式,构建基于虚拟融合数据下的全局模型,从而实现数据隐私保护和数据共享计算的平衡。联邦学习是最有可能解决数据孤岛问题的技术。
3) 第8章增加了大语言模型。大语言模型通常指包含数千亿(或更多)参数的语言模型,使用大量文本数据训练,可以生成自然语言文本或理解语言文本的含义。大语言模型代表着人工智能领域的重大进步,这部分重点介绍美国OpenAI聊天机器人程序ChatGPT的关键技术。
4)第10章智能机器人,增加了基于GENISAMA 通用图灵机模型的发育机器人的介绍。与传统图灵机不同,发展网络(Development Networks,DN)学习图灵机是一种超级图灵机。GENISAMA即为接地性(Grounded)、涌现性(Emergent)、自然性(Natural)、增量性(Incremental)、技巧性(Skilled)、专注性(Attentive)、动机性(Motivated)和抽象性(Abstractive)。
5) 第12章类脑智能,删去了认知计算的有关内容,增加了中国脑科学计划的介绍。中国脑科学计划以阐释人类认知的神经基础(认识脑)为主体和核心 (一体),同时展现“两翼”:其中一翼是大力加强预防、诊断和治疗脑重大疾病的研究(保护脑);另一翼是在大数据快速发展的时代背景下,受大脑运作原理及机制的启示,通过计算和系统模拟推进人工智能的研究(模拟脑)。
自从2022年12月OpenAI发布ChatGPT以来,以通用人工智能为代表的人工智能技术变革进入了加速发展的快车道。通用人工智能(Artificial General Intelligence,AGI)指具有像人类一样的思考能力,可以从事多种工作的机器智能,以区别于当下已取得显著进展的单一能力人工智能,如语音识别、机器视觉、机器翻译等,以及近期最为火爆的ChatGPT。大模型被普遍认为是通往通用人工智能的重要途径。随着具备更优“思考”和“辨别”能力的多模态GPT-4上线,通用人工智能再次引起社会广泛关注和热烈探讨。根据目前展示出来的能力,我们离通用人工智能时代并不遥远,下一步要多考虑让大模型连接现实世界,通过自身学习、跨模态学习等,让大模型与现实世界“对齐”。虽然人工智能大模型的演进速度和智能表现令人欣喜,市场需求和投资热情空前高涨,但依然存在算法优化、算力突破、数据安全、隐私保护、伦理规范等技术和社会方面的问题,通用人工智能带来的这场变革既是挑战也是机遇,我们应积极探索通用人工智能的可能性和潜力,同时也应警惕通用人工智能带来的风险和挑战。
中科院计算所研究员 人工智能先驱代表之一
第2版前言
第1版前言
第1章绪论
11什么是人工智能
12人工智能的发展史
13人工智能研究的基本内容
131认知建模
132知识表示
133自动推理
134机器学习
14人工智能研究的主要学派
141符号主义
142连接主义
143行为主义
15人工智能的应用
16小结和展望
习题
第2章知识表示
21知识表示概述
22谓词逻辑
23产生式表示法
24语义网络
241语义网络的概念和结构
242复杂知识的表示
243常用的语义联系
25框架
251框架结构
252框架网络
253推理方法
26状态空间
27面向对象的知识表示
28脚本
281脚本描述
282概念依赖关系
29本体
210小结
习题
第3章自动推理
31自动推理概述
32三段论推理
33盲目搜索
331深度优先搜索
332宽度优先搜索
333迭代加深搜索
34回溯策略
35启发式搜索
351启发性信息和评估函数
352爬山算法
353模拟退火算法
354最好优先算法
355通用图搜索算法
356A*算法
357迭代加深A*算法
36与或图启发式搜索
361问题归约的描述
362与或图表示
363AO*算法
37博弈搜索
371极大极小过程
372α-β过程
38归结演绎推理
381子句型
382置换和合一
383合一算法
384归结式
385归结反演
386答案的提取
387归结反演的搜索策略
39产生式系统
391产生式系统的基本结构
392正向推理
393反向推理
394混合推理
310自然演绎推理
311非单调推理
3111默认推理
3112限制推理
312小结
习题
第4章不确定性推理
41不确定性推理概述
411不确定性知识分类
412不确定性推理的基本问题
413不确定性推理方法分类
42可信度方法
421建造医学专家系统时的问题
422可信度模型
423确定性方法的说明
43主观贝叶斯方法
431贝叶斯公式
432知识不确定性的表示
433证据不确定性的表示
434组合证据不确定性的计算
435不确定性的传递算法
436结论不确定性的合成
44证据理论
441假设的不确定性
442证据的组合函数
443规则的不确定性
444不确定性的组合
45模糊逻辑和模糊推理
451模糊集合及其运算
452语言变量
453模糊逻辑
454模糊推理
46小结
习题
第5章机器学习
51机器学习概述
511简单的学习模型
512什么是机器学习
513机器学习的研究概况
52归纳学习
521归纳学习的基本概念
522变型空间学习
523决策树
53类比学习
531相似性
532转换类比
533基于案例的推理
534迁移学习
54统计学习
541逻辑回归
542支持向量机
543提升方法
55强化学习
551强化学习模型
552学习自动机
553自适应动态程序设计
554Q-学习
56进化计算
561达尔文进化算法
562遗传算法
563进化策略
564进化规划
57群体智能
571蚁群算法
572粒子群优化
58联邦学习
59知识发现
510小结
习题
第6章神经网络
61神经网络概述
62神经信息处理的基本原理
63感知机
631基本神经元
632感知机模型
64前馈神经网络
641前馈神经网络模型
642误差反向传播算法
643BP算法的若干改进
65Hopfield网络
651离散 Hopfield 网络
652连续Hopfield网络
66随机神经网络
661模拟退火算法
662玻耳兹曼机
67深度学习
671人脑视觉机理
672自编码器
673受限玻耳兹曼机
674深度信念网络
675卷积神经网络
68自组织神经网络
681网络的拓扑结构
682网络自组织算法
683监督学习
69小结
习题
第7章专家系统
71专家系统概述
711什么是专家系统
712专家系统的特点
713专家系统的发展史
72专家系统的基本结构
73专家系统MYCIN
731咨询子系统
732静态数据库
733控制策略
74专家系统工具CLIPS
741概述
742CLIPS中的知识表示
743CLIPS运行
744Rete匹配算法
75专家系统工具JESS
76面向对象专家系统工具OKPS
761OKPS中的知识表示
762推理控制语言ICL
77专家系统建造
771需求分析
772系统设计
773知识库构建
774系统开发
775系统测试
78新型专家系统
781分布式专家系统
782协同式专家系统
783神经网络专家系统
784基于互联网的专家系统
79小结
习题
第8章自然语言处理
81自然语言处理概述
811什么是自然语言处理
812自然语言处理的发展
813自然语言处理的层次
82词法分析
83句法分析
831短语结构语法
832乔姆斯基形式语法
833句法分析树
834转移网络
835扩充转移网络
84语义分析
841语义文