Python3网络爬虫课程7.3对接其他浏览器

对接 Firefox

将其驱动 GeckoDriver 添加到 Windows 环境变量,然后将代码中的

browser = webdriver.Chrome()

更改为

browser = webdriver.Firefox()

对接 PhantomJS

将 PhantomJS.exe 添加到 Windows 环境变量,然后将代码中的

browser = webdriver.Chrome()

更改为

browser = webdriver.PhantomJS(),

它还支持命令行配置,如设置缓存和禁用图片加载.

对接 Chrome headless

Chrome60 及以上版本都支持 Chrome headless 模式,这样爬取的时候就不会弹出浏览器了.