阡陌居

 找回密码
 立即注册
搜索
热搜: 新人报到
查看: 32|回复: 0

[计算机科学] 《用Python写网络爬虫(第2版)》作者:Katharine Jarmul【EPUB】

[复制链接]

用户组:侍讲

Vengeful Gladiator

重建论坛勋章

      UID
1509
      积分
20399
      回帖
784
      主题
3205
      发书数
2874
      威望
15530
      铜币
29241
      贡献
0
      阅读权限
90
      注册时间
2025-3-1
      在线时间
257 小时
      最后登录
2025-5-17
发表于 2025-3-30 14:04 | 显示全部楼层 |阅读模式


  内容简介
  本书包括网络爬虫的定义以及如何爬取网站,如何使用几种库从网页中抽取数据,如何通过缓存结果避免重复下载的问题,如何通过并行下载来加速数据抓取,如何利用不同的方式从动态网站中抽取数据,如何使用叔叔及导航等表达进行搜索和登录,如何访问被验证码图像保护的数据,如何使用 Scrapy 爬虫框架进行快速的并行抓取,以及使用 Portia 的 Web 界面构建网路爬虫。



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|阡陌居

GMT+8, 2025-5-17 10:17 , Processed in 0.120076 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表