有一次报错如下:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb3 in position 0:
invalid start byte
编码问题:f = open(txtPath,'r',encoding='utf-8') 改为:f =
open(txtPath,'r',encoding='gbk')即可 print(f.read())
又有一次读取CSV文件时报错: 
import pandas as pd content = pd.read_csv('news.csv',encoding='utf-8')
print(content.head())
报错如下:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xba in position 0:
invalid start byte

这里我将编码问题 utf-8 改为 gbk,还是报错。。。。报错如下:

UnicodeDecodeError: 'gbk' codec can't decode byte 0xa2 in position 93: illegal
multibyte sequence

最后当我把程序改为:
import pandas as pd content = pd.read_csv('news.csv',encoding='gb18030')
print(content.head())
即读取成功: 

这类问题都是文件编码问题,至于文件到底是什么类型的编码,谁都不知道,只能用最常用的编码格式一个去试一下。这里我将文件编码格式改为gb18030,是偶尔看到有这种格式试出来的。。。。不知道现在有没有软件能够检测文件是什么类型就好了。。

 

技术
今日推荐
阅读数 169685
下载桌面版
GitHub
百度网盘(提取码:draw)
Gitee
云服务器优惠
阿里云优惠券
腾讯云优惠券
华为云优惠券
站点信息
问题反馈
邮箱:ixiaoyang8@qq.com
QQ群:766591547
关注微信