Python爬虫报错11001，python爬虫不报错也不出结果

小程序：扫一扫查出行
【扫一扫了解最新限行尾号】
复制小程序

求Python大佬解决爬虫乱码

1、使用Python编写网络爬虫程序的一般步骤如下：导入所需的库：使用import语句导入所需的库，如BeautifulSoup、Scrapy和Requests等。发送HTTP请求：使用Requests库发送HTTP请求，获取网页的HTML源代码。

2、执行python脚本出现乱码的解决方法：首先把中文解码为unicode，具体方法如：【decode(utf-8)】；然后再转化为gbk即可，具体方法如：【encode(gbk)】。

3、对于Python+requests爬取网站遇到中文乱码的问题，您可以：设置编码：在使用requests库发送请求时，可以通过设置`response.encoding`来指定网页的编码方式，例如`response.encoding = utf-8`。

4、这个问题主要是编码问题，一般需要检查系统设置、ide设置、python代码里的编码，一致改成utf8一般就没问题。

5、Python写程序原则是所有进来的字符串(读文件，爬网页)，一进来就decode，处理完之后在要输出的地方在encode。

python爬虫问题:这个IndexError到底错在哪里

1、第一种可能情况：list[index]， index超出范围，也就是常说的数组越界。第二种可能情况：list是一个空的，没有一个元素，进行list[0]就会出现该错误，在爬虫问题中很常见，比如有个列表爬去下来为空，统一处理就会报错。

2、list index out of range 这是你list[i]，索引值（i）超出了。意思就是，list只有4个值，list[0]， list[1]，list[2]，list[3]，而你非要取第五个list[4]。

3、array is empty. There is no array[0] when a list is empty.数组是空的，问题在这里。len(text_list) 这个是没有删除之前的 text_list数组维数。

4、y = np.array([0，0，0])啊，也就是说len(y) = 3，所以说后面train这个函数里面for k in range(4)明显出界，所以会在k=3的时候报错，因为y根本没有y[3]，最大就是y[2]，改成for k in range(3)就好。

5、分析思路：报错信息里面已经提示了第12有误。提示为数组index越界，而12行的代码中tmp[0]涉及数组。找到tmp的定义，是split函数分解之后的内容，应当为一个list列表。

Python爬虫爬取图片这个报错怎么处理?

1、你好！你的错误原因在于html页面获取到的img标签src属性中的链接，可能是因为src中的url格式是这样的：这样获取到的链接都没有带上协议：http或者https。而导致程序抛出ValueError的错误异常。

2、这个错误，一般是服务器返回数据为空导致的。

3、因为一开始我的header里只有User-Agent，再加上Accept，Accept-Encoding，Content-Type，Host，Origin，Proxy-Connection，Referer，Upgrade-Insecure-Requests就行了，这些都可以从chrome的开发者工具里直接看，或者用fiddler等工具看。

4、其实只要把爬取的速度放慢一点就好了。比如读取一条记录或几条记录后适当添加上time.sleep(10)，这样就基本上不会出现503错误了。

5、路径有问题。Python是一种跨平台的计算机程序设计语言，是ABC语言的替代品，属于面向对象的动态类型语言，python爬取图片时在指定的文件为空是因为路径有问题，需要重新选择路径进行操作。

6、给你贴一下我前一段时间回答的类似问题，用的soup，还有一个用的正则就不贴了，手机不太方便，如下。