当前位置:编程学习 > JAVA >>

GBK-utf8-GBK转换问题

一个大的文本中包含多种编码的文本段落,读取并将各段分别保存到其他文件,如何防止乱码 --------------------编程问答-------------------- 一个文本还有不同的编码方法?

你是怎么做到的? --------------------编程问答-------------------- 把所有编码格式设为一致不就行了吗 --------------------编程问答--------------------
引用 1 楼  的回复:
一个文本还有不同的编码方法?

你是怎么做到的?


假如是  文本文件,例如:TXT  -->  同好奇……  不理解

但是 :  是  world文件的话,还是可以的   例如:在同一个world里面既有中文,也有日文,也有英文,个人觉得还是可以的

至于怎么防止乱码,我还真不清楚。

不过我有一个想法:

在同一个文本中读取的时候,你用编码:UTF-8或者GBK来判断,只有一个个的去判断了,无法从长度来确定

一句话: 有些纠结

自己慢慢试试吧,帮顶 --------------------编程问答--------------------
引用楼主  的回复:
一个大的文本中包含多种编码的文本段落,读取并将各段分别保存到其他文件,如何防止乱码

是抓取的网页,不同网页有不同的编码,存在同一个txt文件中,因此打开txt时,必然有一部分是乱码的,现在需要把他们区分开来,全部转为gb2312 --------------------编程问答--------------------
引用 3 楼  的回复:
引用 1 楼  的回复:

一个文本还有不同的编码方法?

你是怎么做到的?


这个文本文件不是我们自己弄的,是由别人提供的,见4楼解释 --------------------编程问答-------------------- 有日文、有英文、有中文就是混合字符编码了?

呵呵,我太孤寡了! --------------------编程问答-------------------- 一个文本中不可能有多种编码方式啊,一个文本在保存的时候都是有一种存储方式的,要么是二进制文件,要么是字符文件。然后字符文件的编码有GBK ,UTF-8等,但只能是其中一种
补充:Java ,  Java SE
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,