python读文件时UnicodeDecodeError的处理
python中通过open打开文件后,当文件中有中文fd.readline()时会抛出UnicodeDecodeError的异常。基本上可以确定是读入文件的编码问题。因为读入的文件是用VS来写的C++的代码,而vs默认保存的编码是gb2312。当将文件编码转换成UTF-8时正常。根本解决方法是将那些VS写的代码统一成UTF-8的编码,但是这部分代码不是我来维护,并且代码还在增加,其他开发人员通过VS快速的建立C++类,要求他们使用高级保存选项另存为UTF-8貌似还有写难度,只能通过自己来暂时性解决这个问题。
open函数的原型:
通过指定encoding参数来指定打开文件的编码。encoding的值默认是UTF-8,通过fd.encoding可以获得它的值。
如果需要自动获得文件的编码格式需要chardet模块支持才行。
解决方法,默认还是使用utf-8方式来读入文件,当有UnicodeDecodeError异常时,with open(fn, "r") as fd块的会自动把fd关闭,所以,直接在except中使用gbk编码重新打开文件就可以了。
补充:Web开发 , Python ,