python爬虫中文变unicode，python27 unicode编码转换中文

小程序：扫一扫查出行
【扫一扫了解最新限行尾号】
复制小程序

求Python大佬解决爬虫乱码

第一种是，通过浏览器打开你写的html之后，找到浏览器中的文字编码修改，将编码改为Unicode编码，即可修复。

http：//python.jobbole.com/85482/ 同时，对于网页的中文乱码，建立使用requests模块代替urllib\urllib2 requests的content方法，对中文编码，支持比较好，基本不会出现乱码。

对于Python+requests爬取网站遇到中文乱码的问题，您可以：设置编码：在使用requests库发送请求时，可以通过设置`response.encoding`来指定网页的编码方式，例如`response.encoding = utf-8`。

这个问题主要是编码问题，一般需要检查系统设置、ide设置、python代码里的编码，一致改成utf8一般就没问题。

以requests为例：r = r.content.decode(gbk).encode(utf-8)出现编码问题时，仔细分析错误的类型。看是decode（解码）错误还是encode（转码）错误。搞清自己处理的字符串是什么类型的。

ASCII编码。根据查询CSDN官网可知，python中字符采用单字节编码是ASCII编码是1个字节，而Unicode编码通常是2个字节。字母A用ASCII编码是十进制的65，二进制的01000001；字符0用ASCII编码是十进制的48，二进制的00110000。

第一种：ASCII码。是基于拉丁字母的一套电脑编码系统，主要用于显示现代英语和其他西欧语言，它是现今最通用的单字节编码系统，并等同于国际标准IS/IEC 646。

python程序采用unicode编码，一个中文字符对应两个字节。Unicode编码中，一个英文等于两个字节，一个中文（含繁体）等于两个字节。

1、要从键盘输入一个汉字并显示该汉字的unicode编码，可以按下Windows操作系统的“开始”按钮，在搜索框中输入“字符映射表”，并打开该应用程序。

2、F60 100 1111 0110 0000 你去下载个单片机小精灵，什么字都可查了。

3、输入print(hello，name)，然后回车。输出是：hellomymy。

1、import sys sys.getdefaultencoding()ascii解决方法：在IDLE中执行的时候去掉字符串前面的u字符，也不要加#coding这一行。先import sys，然后reload(sys)，再使用sys.setdefaultencoding(utf-8)。

2、答按惯例都在(序列化)输出时才转换成本地编码。比如 file.write(GBK的中文.encode(GBK))python环境内字符串用str.encode(GBK)方法输出成字节串用于和其他环境交流。

3、执行python脚本出现乱码的解决方法：首先把中文解码为unicode，具体方法如：【decode(utf-8)】；然后再转化为gbk即可，具体方法如：【encode(gbk)】。

4、【解决方法2】懒人法，适用只含简体中文的文件用记事本打开，点击另存为，右下角编码方式选择“ANSI”，这个过程是把这个文件改成gbk编码格式，excel就是默认用gbk方式打开的。

1、decode的作用是将其他编码的字符串转换成unicode编码，如strdecode(gb2312)，表示将gb2312编码的字符串转换成unicode编码。

2、用decode()就行。decode()方法必须传入一个参数，这个参数就是当前待转码的编码，此函数方法的用意就是将当前编码为Unicode编码。比如就你这提问的此页面：用的编码是gbk，那么你解码为Unicode的方法就是：decode(gbk)。

3、定义一个字符串man，并打印该字符串结果值。声明一个变量stu并赋值20，利用str()函数将stu转换成字符串并赋值sv，使用type()函数查看sv的数据类型，并打印sv结果。

代码第一行（如果有脚本标记则是第二行）可以按照PEP8形式指定本代码文件的编码类型。

在windows下使用非idle的其他ide编辑器，会碰到这个问题。对抓取到的网页内容进行先解码再编码即可。以requests为例：r = r.content.decode(gbk).encode(utf-8)出现编码问题时，仔细分析错误的类型。

抓的不是乱码，只是你打印出来编程乱码了，需要进行字符编码转换，一般就是gbk或者utf-8之前转就可以。

python爬虫中文变unicode的介绍就聊到这里吧，感谢你花时间阅读本站内容，更多关于python27 unicode编码转换中文、python爬虫中文变unicode的信息别忘了在本站进行查找喔。