
Python网络爬虫:从入门到精通
吕云翔主编教材教辅/研究生/本科/专科教材· 11.2万字
更新时间:2023-10-25 19:34:57
最新章节:参考文献开会员,本书8折购 >
本书主要介绍如何使用Python语言进行网络爬虫程序的开发,从Python语言的基本特性入手,详细介绍Python网络爬虫开发的多个方面,涉及HTTP、HTML、正则表达式、JavaScript、自然语言处理、数据处理与科学计算等不同领域的内容。全书共12章,包括基础篇、进阶篇、提高篇和实战篇4个部分。基础篇包括第1、2、3章,分别为Python基础及网络爬虫、静态网页抓取、数据存储。进阶篇包括第4、5、6章,分别为JavaScript与动态内容、模拟登录与验证码、爬虫数据的分析与处理。提高篇包括第7、8、9章,分别为爬虫的灵活性和多样性、Selenium模拟浏览器与网站测试、爬虫框架Scrapy与反爬虫。实战篇提供了3个实战项目供读者学习参考。本书内容覆盖网络数据抓取与爬虫编程中的主要知识和前沿技术。同时,本书在重视理论基础的前提下,从实用性和丰富度出发,结合实例演示爬虫程序编写的核心流程,将理论与实践结合,力求提高读者的网络爬虫实操技能。本书可作为高等院校数据科学、统计学、计算机科学、软件工程等相关专业课程的教材,也可作为Python语言初学者、网络爬虫技术爱好者的参考书。
品牌:人邮图书
上架时间:2023-07-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行
Python网络爬虫:从入门到精通最新章节
查看全部- 参考文献
- 12.2.3 运行并查看结果
- 12.2.2 代码编写
- 12.2.1 前置准备
- 12.2 爬虫编写
- 12.1.2 将数据保存到数据库
- 12.1.1 网页分析
- 12.1 程序设计
- 第12章 实战:北京大兴国际机场航班出发时间数据抓取
- 11.2 绘制热力图
吕云翔主编
主页
同类热门书
最新上架
- 会员
互联网产品开发(微课版)
当前,互联网产品已经融入社会生产生活的方方面面,越来越深刻地影响着人们的学习、工作和生活。与此同时,互联网产品开发也已成为互联网从业人员及创业者关注的热点领域。本书系统阐述了互联网产品开发的相关知识,主要内容包括互联网产品概述、互联网产品开发流程和工具、产品需求分析、产品规划、产品原型设计、产品开发和测试、产品发布和推广、产品迭代等。本书内容覆盖面广,各项目既相互关联又相对独立,理论讲解与案例实操教材教辅8.5万字 - 会员
公共经济学
公共经济学主要研究和分析公共部门从事的经济活动的主要后果及其与社会目标之间的关系,其研究内容关乎政府公共产品和服务行为研究。本书为公共管理专业的基础课程教材,书稿的第一部分主要介绍了公共经济学的基本定义、研究对象与研究任务;第二部分主要介绍了本书的逻辑线索、基本框架与主要内容,从而对全书的阅读和学习起到导读的作用;第三部分详细讲述了公共经济学的产生与发展历程;第四部分主要介绍了作为一个交叉学科,公教材教辅18.6万字 - 会员
简明神经网络
本书是神经网络课程的入门教材,用通俗易懂的语言讲解神经网络的相关知识。本书共6章,第1章对神经网络领域进行概述,包括其历史和应用;第2章深入探讨神经元的数学模型,包括其输入、权值、偏置和激活函数;第3章介绍感知机的概念,讨论感知机的结构,并解释如何用它来解决简单的分类问题;第4章介绍多层感知机的概念,讲述如何使用前馈传播和反向传播,同时详细介绍了反向传播中用到的链式法则;第5章涵盖训练神经网络时使教材教辅12.1万字 - 会员
20世纪中国乡土文学综论
乡土是永远的文化母题,中国的20世纪则更是土地问题的世纪。作为学术专题,本书以“20世纪中国乡土文学”为研究对象,纵横结合,点面兼顾,较为系统地梳理、探究了“乡土文学”自身本质特征问题,乡土小说、乡土诗、乡土散文、乡土戏剧与影视等本体问题,20世纪中国乡土文学的精神脉络、典型实证、文本风格、地域文化影响、艺术表现成就等实际创作问题。作为课程教材,本书是中国现代文学史必修课程的有效拓展与合理延伸,是教材教辅22.9万字 - 会员
中文核心期刊要目总览(2023年版)
本书使用分学科、多指标综合评价,以及定量评价与定性评价相结合的研究方法,从我国正在出版的中文期刊中评选出1987种核心期刊,具有较高的学术水平和使用价值。教材教辅63.3万字 - 会员
新编英国文学史教程
《新编英国文学史教程》的编写针对现行同类教材语言生涩、内容繁杂的现状,以知识性和易读性为宗旨,以我国英语专业本科教学大纲为指导,充分考虑我国英语专业本科学生的英语语言实际水平,兼顾部分高校英国文学课程开设时间较短的现实,把握英国文学史整体框架,以文学发展不同时期为单位,把历史背景、文学运动、文学流派和作家作品的介绍凝练化、条理化,利于学生在有限的时间里构建一个比较系统完整的英国文学知识体系。同时,教材教辅23.3万字 - 会员
Spark SQL入门与数据分析实践
Spark?SQL是Spark用于处理结构化数据的一个模块。本书共8章内容,由浅入深地讲解Spark?SQL的基础知识、安装部署、编程基础、编程进阶、函数、性能调优技巧以及编程实践等知识。通过本书的学习,读者能够掌握Spark?SQL核心技术。本书每章安排了习题和总结,以便使读者能更好地学习和更牢固地掌握Spark?SQL编程方法。此外,本书还提供了PPT教学课件、源代码等配套资源,供使用本书的读教材教辅7.1万字 新媒体技术:理论、案例与应用(全彩微课版)
本书从新媒体与新媒体技术的基础理论出发,系统地介绍了新媒体行业中常用的技术、软件和工具。全书共8章,主要内容包括新媒体与新媒体技术、图像处理、视频编辑与制作、音频编辑与处理、动画制作、H5设计与制作、AI工具应用,以及综合性的商业设计案例,以提升读者对新媒体技术的了解和应用,并能独立完成各项新媒体设计工作。本书内容全面、图文并茂、资源丰富、实用性强,可以作为高等院校新媒体类相关专业课程的教学用书,教材教辅13.7万字- 会员
Hadoop数据仓库实战
本书以Hive为开发平台,主要介绍了如何使用HiveQL来查询和分析存储在Hadoop分布式文件系统上的大数据集合,具体内容包括Hive入门、Hive数据库及表操作、Hive元数据、Hive高级操作、Hive函数与Streaming、Hive视图与索引、Hive调优、Hive与HBase集成、数据迁移框架Sqoop等。本书介绍的每个任务都运用了大量案例,紧密结合实际应用,融入了含金量十足的开发经验教材教辅8万字
同类书籍最近更新
新媒体技术:理论、案例与应用(全彩微课版)
本书从新媒体与新媒体技术的基础理论出发,系统地介绍了新媒体行业中常用的技术、软件和工具。全书共8章,主要内容包括新媒体与新媒体技术、图像处理、视频编辑与制作、音频编辑与处理、动画制作、H5设计与制作、AI工具应用,以及综合性的商业设计案例,以提升读者对新媒体技术的了解和应用,并能独立完成各项新媒体设计工作。本书内容全面、图文并茂、资源丰富、实用性强,可以作为高等院校新媒体类相关专业课程的教学用书,高教教材13.7万字- 会员
计算机系统导论实践教程
本书作为主教材《计算机系统导论》配套的程序设计与调试实践教材,内容包括基础级验证性实验和模块级分析性实验。本书中设计的基础级验证性实践项目包括实验系统的安装和工具软件的使用、程序调试命令和指令系统基础相关实验、数据的机器级表示实验、数据的基本运算实验、程序的机器级表示实验;模块级分析性实践项目包括二进制程序分析与逆向工程实验、程序的链接与ELF目标文件实验。本书为《计算机系统导论》主教材提供了系统高教教材13万字 - 会员
公共经济学
公共经济学主要研究和分析公共部门从事的经济活动的主要后果及其与社会目标之间的关系,其研究内容关乎政府公共产品和服务行为研究。本书为公共管理专业的基础课程教材,书稿的第一部分主要介绍了公共经济学的基本定义、研究对象与研究任务;第二部分主要介绍了本书的逻辑线索、基本框架与主要内容,从而对全书的阅读和学习起到导读的作用;第三部分详细讲述了公共经济学的产生与发展历程;第四部分主要介绍了作为一个交叉学科,公高教教材18.6万字