如果你正在学习编程,那么“爬虫”绝对是你不可忽视的。那么,学习python爬虫之前需要哪些工具?
代码编辑运行环境: 个人推荐PyCharm社区版,当然,Python自带的IDLE也行,Notepad++亦可,只要自己使用得习惯。 F12 开发者工具 看源代码:快速定位元素分析xpath:1、此处建议谷歌系浏览器,可以在源码界面直接右键看 抓包工具 推荐httpfox,火狐浏览器下的插件,比起谷歌火狐是自带的F12工具都要好,可以方便查看网站收包发包的信息 XPATH CHECKER (火狐插件) 非常不错的xpath测试工具,不过也有几个小缺点,: xpath checker生成的是绝对路径,遇到一些动态生成的图标(常见的有列表翻页按钮等),飘忽不定的绝对路径很有可能造成错误,所以这里建议在真正分析的时候,只是作为参考记得把如下图xpath框里的“x:”去掉,貌似这个是早期版本xpath的语法,目前已经和一些模块不兼容(比如scrapy),还是删去避免报错。 正则表达测试工具 在线正则表达式测试 ,拿来多练练手,也辅助分析!里面有很多现成的正则表达式可以用,也可以进行参考! (责任编辑:yang) |