python爬虫失败，python爬虫没反应

小程序：扫一扫查出行
【扫一扫了解最新限行尾号】
复制小程序

使用python抓取百度搜索结果时不成功,怎么回事?

1、百度的搜索结果第一个展示，和下面的9个结果不同，html源码结构不同，另外百度自身产品的html结构也有所不同，除非你的正则能完整匹配。

2、百度因为竞价排名的原因，搜索出来的结果有很多广告的成分，所以有时候要翻好几页才能看到一条相关的答案，有些甚至要翻几十页。因为百度搜索使用的是SEO技术，即普通用户可以通过优化网站内容来提升关键词排名。

3、打开文件的调用不使用模块搜索路径当你在Python中调用open()来访问一个外部的文件时，Python不会使用模块搜索路径来定位这个目标文件。它会使用你提供的绝对路径，或者假定这个文件是在当前工作目录中。

4、从降低爬取频率的角度来说，可以设置一个随机数，每次爬取之后，让爬虫休眠这个随机数的时间。如果能更清楚百度的防御机制就有其他方法了。

5、在你的第5行代码当中，确实执行了打印语句，而且整个程序也没有报其它错误。

1、未正确设置cookie，cookie过期或失效，网站的反爬虫机制。未正确设置cookie：在进行页面访问之前，需要确保正确设置了cookie，可以通过在请求头中添加Cookie字段来设置cookie。

2、网络请求限制：一些网站会对频繁的网络请求进行限制，如设置访问频率限制、并发连接数限制等，这些限制可能会导致爬虫无法正常获取数据。

3、这是python种错误的跟踪信息。调用f1()出错了，错误出现在文件XXX.py的第8行代码，错误来源第4行：File XXX.py， line 4， in f1 return 1 / int(s)return 1 / int(s)出错了，找到了错误的源头。

1、这种问题如果代码没写错的话，估计是网站做了反爬处理，如果说是反爬的话你可以用python里面的urllib2模块试试看，这是一个进阶爬虫模块。

2、错误是一种在网站访问过程中常见的错误提示，表示资源不可用，拒绝访问。通常是由于服务器上文件或目录的权限设置导致，比如IIS或者apache设置了访问权限不当。

3、是禁止访问，就是服务器不让你访问他的网站。爬B站需要添加虚拟的浏览器信息，让服务器以为你是真人而不是解析器。

4、Forbidden 是HTTP协议中的一个状态码(Status Code)。可以简单的理解为没有权限访问此站。该状态表示服务器理解了本次请求但是拒绝执行该任务，该请求不该重发给服务器。

关于python爬虫失败和python爬虫没反应的介绍到此就结束了，不知道你从中找到你需要的信息了吗？如果你还想了解更多这方面的信息，记得收藏关注本站。