python爬虫js用什么库，python爬javascript

小程序：扫一扫查出行
【扫一扫了解最新限行尾号】
复制小程序

Python写爬虫都用到什么库

1、Python爬虫网络库Python爬虫网络库主要包括：urllib、requests、grab、pycurl、urllibhttplibRoboBrowser、MechanicalSoup、mechanize、socket、Unirest for Python、hyper、PySocks、treq以及aiohttp等。

2、请求库 requests requests 类库是第三方库，比 Python 自带的 urllib 类库使用方便和 selenium 利用它执行浏览器动作，模拟操作。 chromedriver 安装chromedriver来驱动chrome。

3、requests 这个库是爬虫最常用的一个库 Selenium Selenium 是一个自动化测试工具，利用它我们可以驱动浏览器执行特定的动作，如点击、下拉等操作对于一些用JS做谊染的页面来说，这种抓取方式是非常有效的。

4、基础爬虫：（1）基础库：urllib模块/requests第三方模块首先爬虫就是要从网页上把我们需要的信息抓取下来的，那么我们就要学习urllib/requests模块，这两种模块是负责爬取网页的。

python爬虫用什么库

1、urllib-网络库(stdlib) 。requests-网络库。grab-网络库(基于py curl) 。py curl-网络库(绑定libcurl) 。urllib 3-Python HTTP库，安全连接池、支持文件post 、可用性高。httplib 2-网络库。

2、pyspider是一个用python实现的功能强大的网络爬虫系统，能在浏览器界面上进行脚本的编写，功能的调度和爬取结果的实时查看，后端使用常用的数据库进行爬取结果的存储，还能定时设置任务与任务优先级等。

3、Python爬虫网络库Python爬虫网络库主要包括：urllib、requests、grab、pycurl、urllibhttplibRoboBrowser、MechanicalSoup、mechanize、socket、Unirest for Python、hyper、PySocks、treq以及aiohttp等。

4、requests requests库应该是现在做爬虫最火最实用的库了，非常的人性化。有关于它的使用我之前也写过一篇文章一起看看Python之Requests库，大家可以去看一下。

5、Gevent：Gevent是一个基于协程的网络库，可以实现高并发的网络爬取。它可以与其他爬虫框架结合使用，提高爬取效率。

6、requests requests 类库是第三方库，比 Python 自带的 urllib 类库使用方便和 selenium 利用它执行浏览器动作，模拟操作。 chromedriver 安装chromedriver来驱动chrome。