本书主要为高等院校非计算机专业的人工智能导论课程设计编写,内容具有应用 理论的特色。针对高校学生的需求和人工智能发展的特点,本书分为引言篇、理论篇和应用篇三部分,可基于学习需求和进度,自主选择。引言篇包括绪论;理论篇包括人工智能之理论基础、人工智能之机器学习、人工智能之深度学习、人工智能之强化学习;应用篇包括人工智能开发平台和人工智能应用及展望。本书可用于普通高等学校各专业人工智能导论、医学人工智能导论等相关课程的教学,也可供对人工智能感兴趣的科研人员参考。
近年来,随着人工智能技术在人脸识别、自然语言处理等诸多实际应用中成功落地,它已经慢慢改变了人类社会的生活、生产和消费模式。新一轮Chat-GPT、SAM 及AIGC 技术的发展以及引发的相关伦理的挑战,使全世界各国更加重点关注和布局人工智能领域,旨在这一轮科技革命中占据主动位置,对于这些新技术的算法基础的了解已经成为全社会各个行业人士特别是广大中国知识界和学生的期望。
人工智能是一门有关知识的科学,也是计算机科学与技术、智能科学与技术和人工智能等专业的一门核心课程。而且,随着人工智能技术的广泛应用和交叉学科研究兴起,非计算机专业的本科生对学习人工智能技术的需求也日渐强烈。
南方科技大学作为一个新型研究型大学,一直重视交叉学科人才培养。为了顺应时代发展的需求,南方科技大学计算机科学与工程系面向全校学生特别是非计算机专业本科年级的学生开设了人工智能导论课程,目的是通过介绍人工智能算法体系和发展过程,进一步激发非计算机专业学生对人工智能学习的兴趣,引导和提高学生利用人工智能技术进行学科交叉的应用创新能力。
笔者长期从事人工智能、精准医疗、眼脑联动、手术机器人等方面的研究。从2019 年开始在南方科技大学给全校学生讲授人工智能导论课程,开课后选课学生每年成倍递增。在授课过程中,深刻感觉到以 AI AI ( 人工智能算法 人工智能技术在特定行业的特定应用)的内容编排的授课方式有助于非计算机专业的学生更好地学习人工智能的基本理论和算法,并激发他们学习和应用人工智能技术的热情。这也促使笔者在本书编写过程中通过 以人工智能实际应用引出人工智能理论和算法,即通过具体生动的实际应用实例来介绍人工智能的核心算法和理论。本书的内容分引言篇、理论篇以及应用篇三个部分,为进一步贯彻党的二十大的科技强国精神,在各个部分客观并积极地融入当代中国科技思政元素,培养学生的工匠精神,激发学生科技报国的家国情怀和使命担当,从而实现育人和育才目标的统一。
第1部分引言篇:介绍人工智能的定义,包含人工智能的定义与发展、行业发展现状及三个贯穿整本书的经典人工智能应用3 个方面。其中,本部分介绍我国在人工智能领域的自主创新,如寒武纪人工智能芯片、基于悟道 2.0诞生的中国原创虚拟学生华智冰,以及文心一言大模型,体现出我国自主研发能力的增强和科技工作人员的大国工匠精神。
第2部分理论篇:论述人工智能的核心理论与算法,包括人工智能的理论基础、机器学习、深度学习以及强化学习4 个核心部分。本书主要通过自然语言理解、智能眼科图像处理和智能棋类这三个经典应用引出人工智能的核心理论与算法,将科研和工程的求真务实和不断创新理念融入书中,培养学生应用创新能力、追求卓越的精神以及协同合作和奉献精神。
第3部分应用篇:讲解人工智能开发平台及应用,包括人工智能开发平台、人工智能应用及展望2 个主题。本书通过人工智能开发平台及应用介绍,激发当代学生科技报国的家国情怀和使命担当,从而做到情境统一、理境结合,实现全方位育人和育才。
特别在编写理论篇人工智能之机器学习、人工智能之深度学习、人工智能之强化学习这三章的内容中,在介绍每一个经典的人工智能算法小节时,针对非计算机专业学生,本书都结合 AI AI 的原则,通过一个应用来介绍每个算法,旨在帮助读者深入地理解及运用人工智能算法去解决实际应用问题。在应用篇,本书也对人工智能的经典应用进行了系统介绍并结合当下研究热点对未来研究方向进行展望。同时,本书也为各章设计对应的习题,帮助读者巩固学习到的知识点。
本书可用于普通高等学校各专业人工智能导论、医学人工智能导论等相关课程的教学。教师可根据课程计划和专业培养需要重点讲授有关内容,也可依据学生的基础设计教学进度和需求,做出适当选择。
本书由南方科技大学刘江、章晓庆、胡衍编著。本书的内容汇集了智能医疗影像处理团队 (Intelligent Medical Imaging,iMED)的集体智慧,参与本书的iMED 团队成员有章晓庆、胡衍、肖尊杰、李三仟、胡凌溪、杨冰、张慧红、张颖麟、邱忠喜、林文钧、王星月、曾娜、沈俊勇、聂秋实、郭梦杰、黎德睿、孙清扬、巫晓、张佳意、廖铭骞,在此表示感谢。也感谢为本书编写提供建议和服务的其他iMED 团队成员。
笔者在此对南方科技大学工学院院长徐政和院士关于人工智能导论课程开设的远见,致以敬意;对计算机系的姚新主任关于本书的出版给予的热情鼓励和支持,致以感谢。另外,本书的出版得到了南方科技大学教材出版资助,感谢学校的认可。
由于笔者水平有限,同时人工智能技术发展日新月异,书中内容难免会存在不足,欢迎广大读者提出宝贵建议。
刘江
2023年5月
引言篇 人工智能的定义 001
第1章 绪论 2
1.1 什么是人工智能 2
1.1.1 人工智能的起源及定义 3
1.1.2 人工智能的三个发展阶段 4
1.2 人工智能的三个主要研究方法 6
1.2.1 基于符号主义的人工智能研究方法 7
1.2.2 基于连接主义的人工智能研究方法 7
1.2.3 基于行为主义的人工智能研究方法 8
1.3 人工智能的行业发展现状 9
1.3.1 世界各国人工智能发展支持政策 9
1.3.2 人工智能产业结构 12
1.3.3 人工智能行业应用 14
1.4 人工智能的三个经典应用 17
1.4.1 自然语言理解 18
1.4.2 智能眼科医学图像处理 19
1.4.3 智能棋类 21
本章小结 23
习题 24
本章参考文献 24
理论篇 人工智能基础理论与算法 025
第2章 人工智能之理论基础 26
2.1 人工智能的数学基础 27
2.1.1 线性代数 27
2.1.2 人工智能数学基础之概率论 30
2.1.3 人工智能数学基础之微积分 32
2.2 人工智能的最优化与信息论基础 33
2.2.1 最优化理论 33
2.2.2 信息论 34
2.3 人工智能的生物学基础 36
2.3.1 生物神经元 36
2.3.2 人脑视觉与信息机理机制 37
2.3.3 人工神经元 39
2.4 人工智能的控制论基础 42
2.4.1 动态系统 43
2.4.2 人工智能之反馈控制与最优控制 44
2.4.3 控制论与强化学习 46
本章小结 47
习题 47
本章参考文献 47
第3章 人工智能之机器学习 48
3.1 机器学习概述 48
3.2 监督学习 49
3.2.1 经典算法1:线性回归 50
3.2.2 经典算法2:逻辑回归 53
3.2.3 经典算法3:感知机 56
3.2.4 经典算法4:支持向量机 58
3.2.5 经典算法5:决策树 64
3.2.6 经典算法6:集成学习 68
3.3 无监督学习 69
3.3.1 经典算法1:K-均值算法 70
3.3.2 经典算法2:主成分分析 73
3.4 弱监督学习 76
3.4.1 主动学习 77
3.4.2 半监督学习 78
3.4.3 迁移学习 80
3.4.4 多示例学习 81
本章小结 82
习题 82
本章参考文献 82
第4章 人工智能之深度学习 83
4.1 深度学习概述 84
4.1.1 前向神经网络模型 84
4.1.2 生成模型 86
4.1.3 序列模型 86
4.2 人工神经网络 87
4.2.1 概述 87
4.2.2 激活函数 91
4.2.3 损失函数 95
4.3 神经网络参数优化与学习 100
4.3.1 梯度下降 101
4.3.2 反向传播算法 102
4.4 经典神经网络 107
4.4.1 经典神经网络1:卷积神经网络 107
4.4.2 经典神经网络2:循环神经网络 117
4.4.3 经典神经网络3:生成对抗网络 124
4.4.4 经典神经网络4:注意力机制网络 128
4.5 深度学习前沿 134
4.5.1 自监督学习 134
4.5.2 可解释性深度学习 135
4.5.3 对抗攻击与防御 135
4.5.4 超大规模模型 136
本章小结 137
习题 138
本章参考文献 139
第5章 人工智能之强化学习 140
5.1 强化学习概述 141
5.2 强化学习之马尔可夫决策过程 142
5.2.1 马尔可夫过程 142
5.2.2 马尔可夫奖励过程 142
5.2.3 马尔可夫决策过程 143
5.3 强化学习中的目标函数 144
5.3.1 值函数 144
5.3.2 贝尔曼方程 144
5.4 强化学习算法 145
5.4.1 动态规划 146
5.4.2 蒙特卡罗法 148
5.4.3 时序差分法 151
5.4.4 深度Q 网络 154
5.4.5 连续动作空间深度强化学习简单示例 157
本章小结 159
习题 159
本章参考文献 159
应用篇 人工智能开发平台及应用 161
第6章 人工智能开发平台 162
6.1 Python 语言简介 162
6.1.1 Python 常用数据结构 163
6.1.2 函数 164
6.1.3 类 165
6.2 机器学习平台 165
6.2.1 NumPy 166
6.2.2 Pandas 166
6.2.3 Scikit-Learn 167
6.2.4 Scipy 168
6.2.5 应用实战 168
6.3 深度学习开发框架 172
6.3.1 总述 172
6.3.2 TensorFlow 172
6.3.3 PyTorch 174
6.3.4 飞桨(PaddlePaddle) 176
6.3.5 应用实战 177
本章小结 182
习题 182
本章参考文献 184
第7章 人工智能应用及展望 185
7.1 人工智能与自然语言处理 186
7.1.1 自然语言处理的基本概念 186
7.1.2 自然语言处理的发展历史 187
7.1.3 自然语言处理的研究方向 188
7.2 人工智能与图像处理 196
7.2.1 图像增强 197
7.2.2 图像复原 199
7.2.3 图像编码 201
7.2.4 图像分割 204
7.2.5 图像识别与分类 205
7.3 人工智能与机器人 207
7.3.1 机器人概念 207
7.3.2 根据机器人发展阶段分类 208
7.3.3 根据应用环境分类 209
7.4 人工智能与视频理解 210
7.4.1 动作识别 211
7.4.2 时序动作定位 215
7.4.3 视频向量化 217
7.5 人工智能与元宇宙 219
7.5.1 元宇宙的基本概念 219
7.5.2 元宇宙中基础技术 221
7.6 人工智能未来展望 223
7.6.1 研究热点预测 223
7.6.2 人工智能伦理与治理 226
本章小结 228
习题 228
本章参考文献 228
后记 229