GBK-utf8-GBK转换问题

一个大的文本中包含多种编码的文本段落，读取并将各段分别保存到其他文件，如何防止乱码 --------------------编程问答-------------------- 一个文本还有不同的编码方法？

你是怎么做到的？ --------------------编程问答-------------------- 把所有编码格式设为一致不就行了吗 --------------------编程问答--------------------

引用 1 楼的回复:

一个文本还有不同的编码方法？

你是怎么做到的？

假如是文本文件，例如：TXT --> 同好奇…… 不理解

但是：是 world文件的话，还是可以的例如：在同一个world里面既有中文，也有日文，也有英文，个人觉得还是可以的

至于怎么防止乱码，我还真不清楚。

不过我有一个想法：

在同一个文本中读取的时候，你用编码：UTF-8或者GBK来判断，只有一个个的去判断了，无法从长度来确定

一句话：有些纠结

自己慢慢试试吧，帮顶

--------------------编程问答--------------------

引用楼主的回复:

一个大的文本中包含多种编码的文本段落，读取并将各段分别保存到其他文件，如何防止乱码

是抓取的网页，不同网页有不同的编码，存在同一个txt文件中，因此打开txt时，必然有一部分是乱码的，现在需要把他们区分开来，全部转为gb2312 --------------------编程问答--------------------

引用 3 楼的回复:

引用 1 楼的回复:

一个文本还有不同的编码方法？

你是怎么做到的？

这个文本文件不是我们自己弄的，是由别人提供的，见4楼解释 --------------------编程问答-------------------- 有日文、有英文、有中文就是混合字符编码了？

呵呵，我太孤寡了！ --------------------编程问答-------------------- 一个文本中不可能有多种编码方式啊，一个文本在保存的时候都是有一种存储方式的，要么是二进制文件，要么是字符文件。然后字符文件的编码有GBK ，UTF-8等，但只能是其中一种

补充：Java ,  Java SE