当前位置:编程学习 > JAVA >>

java获取txt文件编码格式

在工作中遇到了一个特浪费时间的事,为了读取txt文档的时候不出现乱码,所以需要对txt文档进行编码转换。将txt文档打开另存为需要的编码格式。如果txt文档小,这样转换还不算太慢,但是如果文档太大,打开的时候就会出现程序假死现象,很不方便。所以就想到能不能用程序写一个转换工具,不需要打开文档,点ok就可以自动转换?于是就用c#写了一个程序。

现在开始做java,闲暇无聊,就想用java能不能也做一个类似的程序呢?

首先对java中得编码格式进行了研究。发现在java中

 

java编码与txt编码对应

java

txt

unicode

unicode big endian

utf-8

utf-8

utf-16

unicode

gb2312

ANSI

java读取txt文件,如果编码格式不匹配,就会出现乱码现象。所以读取txt文件的时候需要设置读取编码。txt文档编码格式都是写在文件头的,在程序中需要先解析文件的编码格式,获得编码格式后,在按此格式读取文件就不会产生乱码了。

  1. InputStream inputStream = new FileInputStream("E:/1.txt");  
  2.         byte[] head = new byte[3];  
  3.         inputStream.read(head);   
  4.         String code = "";  
  5.    
  6.             code = "gb2312";  
  7.         if (head[0] == -1 && head[1] == -2 )  
  8.             code = "UTF-16";  
  9.         if (head[0] == -2 && head[1] == -1 )  
  10.             code = "Unicode";  
  11.         if(head[0]==-17 && head[1]==-69 && head[2] ==-65)  
  12.             code = "UTF-8";  
  13.           
  14.         System.out.println(code); 

这样就获得了txt的编码格式了。

本文出自  “TinyKing”
 

补充:软件开发 , Java ,
CopyRight © 2022 站长资源库 编程知识问答 zzzyk.com All Rights Reserved
部分文章来自网络,