GBK-utf8-GBK转换问题
一个大的文本中包含多种编码的文本段落,读取并将各段分别保存到其他文件,如何防止乱码 --------------------编程问答-------------------- 一个文本还有不同的编码方法?你是怎么做到的? --------------------编程问答-------------------- 把所有编码格式设为一致不就行了吗 --------------------编程问答--------------------
假如是 文本文件,例如:TXT --> 同好奇…… 不理解
但是 : 是 world文件的话,还是可以的 例如:在同一个world里面既有中文,也有日文,也有英文,个人觉得还是可以的
至于怎么防止乱码,我还真不清楚。
不过我有一个想法:
在同一个文本中读取的时候,你用编码:UTF-8或者GBK来判断,只有一个个的去判断了,无法从长度来确定
一句话: 有些纠结
自己慢慢试试吧,帮顶 --------------------编程问答--------------------
是抓取的网页,不同网页有不同的编码,存在同一个txt文件中,因此打开txt时,必然有一部分是乱码的,现在需要把他们区分开来,全部转为gb2312 --------------------编程问答--------------------
这个文本文件不是我们自己弄的,是由别人提供的,见4楼解释 --------------------编程问答-------------------- 有日文、有英文、有中文就是混合字符编码了?
呵呵,我太孤寡了! --------------------编程问答-------------------- 一个文本中不可能有多种编码方式啊,一个文本在保存的时候都是有一种存储方式的,要么是二进制文件,要么是字符文件。然后字符文件的编码有GBK ,UTF-8等,但只能是其中一种
补充:Java , Java SE