UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd7 in position 0: invalid continuation byte

网友投稿 312 2022-09-14

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd7 in position 0: invalid continuation byte

UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd7 in position 0: invalid continuation byte

代码

# 1、读取数据并存为一个名叫 job_info 的数据框。job_info = pd.read_csv(r'G:\Projects\pycharmeProject\大数据比赛\泰迪智能科技\data\job_info.csv')print(job_info.head())

报错:

​​UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd7 in position 0: invalid continuation byte​​

分析:

报错信息翻译为:​​​UnicodeDecodeError:“utf-8”编解码器无法解码位置0中的字节0xd7:连续字节无效​​原因:在读取csv文件的时候,源文件的字符编码集可能是二进制形式,而当前编译工具在读取数据时无法进行转换的二进制数据 ,编码字符集形式不匹配造成。

解决方案:

# 1、读取数据并存为一个名叫 job_info 的数据框。job_info = pd.read_csv(r'G:\Projects\pycharmeProject\大数据比赛\泰迪智能科技\data\job_info.csv',encoding='gbk')print(job_info.head())

在读取csv文件的时候,指定字符编码集,设定​​encoding参数​​即可。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:DoMarketing-营销智库:铁打的公司流水的PR:十件事判断一个品牌营销人的水平!
下一篇:[leetcode] 383. Ransom Note
相关文章

 发表评论

暂时没有评论,来抢沙发吧~