AAA教育论坛
标题:
菜鸟学习网络爬虫的最佳路线是什么?
[打印本页]
作者:
江山老师
时间:
2018-3-7 18:00
标题:
菜鸟学习网络爬虫的最佳路线是什么?
总结一下:
需要 Python的基础
需要了解HTML+CSS,会用Firebug分析网页
需要了解一点网络通信,会抓包分析网络请求
学习使用urllib库访问网站(推荐学习使用requests库)
学习写正则表达式
学习使用beautifulsoup库
(再往大往远说的话,可以去看一些设计性的、理念性的东西,或者去看一些大的项目是如何实现的,搜索引擎原理什么的,看你兴趣了)
如果说还有什么建议的话,我推荐的做法是给自己构造一个情境、一个需求,然后带着目的去做,去学。
欢迎光临 AAA教育论坛 (https://bbs.aaa-cg.com.cn/)
X3.2