AI编程班:Python×ChatGPT网络爬虫从入门到精通_李杰臣编著；颉腾文化出品_9787576333602

全书共11章，以下是各章的主要内容：

第1章：主要讲解Python编程环境的搭建方法及Python语言的基础语法知识等内容。

第2章：主要讲解AI工具的基本使用方法，以及如何在爬虫编程中利用AI工具解决技术难题和提高开发效率。

第3章：主要讲解如何对网页进行初步分析，包括查看网页源代码、剖析网页的结构、判断网页的类型等，为获取网页源代码并提取数据奠定基础。

第4、5章：分别讲解静态网页和动态网页的爬取，主要内容包括如何使用Requests模块和Selenium模块获取网页源代码，如何使用正则表达式和BeautifulSoup模块从网页源代码中提取所需数据。

第6章：主要讲解如何使用pandas等模块对获取的数据进行清洗、处理和分析，以提高数据的质量，并从数据中提取有价值的信息。

第7章：进一步探索Python网络爬虫的进阶技术，例如，用pandas模块爬取网页表格数据、用数据接口爬取数据、开发带图形用户界面的爬虫程序等。

第8～11章：通过一系列实际应用场景来实践并强化之前所学的知识。这些场景涵盖了财经、社交媒体、电商等多个领域的数据爬取，以及媒体文件的下载。读者将深入体会如何灵活运用爬虫技术解决实际问题，在遇到困难时如何借助AI工具见招拆招，从而踏上编程能力的持续自我提升之路。

◆前言 ◆

网络爬虫是一种高效的数据采集工具，然而对于许多初学者而言，这项技术似乎遥不可及，需要具备高深的编程技能才能掌握。本书旨在探讨如何通过简洁易懂的Python编程语言与先进AI工具的强强联手，降低爬虫技术的学习门槛，让学习过程变得轻松愉快。

◎内容结构

全书共11章，以下是各章的主要内容：

第1章：主要讲解Python编程环境的搭建方法及Python语言的基础语法知识等内容。

第2章：主要讲解AI工具的基本使用方法，以及如何在爬虫编程中利用AI工具解决技术难题和提高开发效率。

第3章：主要讲解如何对网页进行初步分析，包括查看网页源代码、剖析网页的结构、判断网页的类型等，为获取网页源代码并提取数据奠定基础。

第6章：主要讲解如何使用pandas等模块对获取的数据进行清洗、处理和分析，以提高数据的质量，并从数据中提取有价值的信息。

第7章：进一步探索Python网络爬虫的进阶技术，例如，用pandas模块爬取网页表格数据、用数据接口爬取数据、开发带图形用户界面的爬虫程序等。

◎读者对象

本书适合需要在网络数据的采集、处理与分析方面提高效率的职场人士和办公人员阅读，也可供Python编程爱好者参考。

由于AI技术和编程技术的更新和升级速度很快，加之编者水平有限，本书难免有不足之处，恳请广大读者批评指正。