AAA教育论坛

 找回密码
 立即注册
查看: 7071|回复: 0
打印 上一主题 下一主题

菜鸟学习网络爬虫的最佳路线是什么?

[复制链接]

4

主题

4

帖子

8

积分

贵宾

积分
8
跳转到指定楼层
楼主
发表于 2018-3-7 18:00:34 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
总结一下:
  • 需要 Python的基础
  • 需要了解HTML+CSS,会用Firebug分析网页
  • 需要了解一点网络通信,会抓包分析网络请求
  • 学习使用urllib库访问网站(推荐学习使用requests库)
  • 学习写正则表达式
  • 学习使用beautifulsoup库
(再往大往远说的话,可以去看一些设计性的、理念性的东西,或者去看一些大的项目是如何实现的,搜索引擎原理什么的,看你兴趣了)

如果说还有什么建议的话,我推荐的做法是给自己构造一个情境、一个需求,然后带着目的去做,去学。




回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|  

©2019|www.aaa-cg.com.cn 北京漫动者教育科技有限公司|备案号:京ICP备12034770号|监督电话:400-0100-444

快速回复 返回顶部 返回列表