java獲取文件的progid,java獲取文件的編碼格式

本文目錄一覽：

1、Java如何獲取文件的內容類型
2、java實現opc連接中ProgId是什麼
3、java 怎麼獲得文件編碼格式
4、java如何獲取文件信息？
5、用Java實現獲取文件類型的方法。

Java如何獲取文件的內容類型

如果是要獲取文件的類型格式的，先取得文件的名字，然後通過字元串截取（從最後一一個點開始截取）。

File file =new File(“”);

String fileName=File.getName();

fileName.subString(fileName.lastIndexOf(“.”));

java實現opc連接中ProgId是什麼

第一種：用utgard連接opc。

第二種：使用jOpc連接 opc伺服器，只支持32位的。

java 怎麼獲得文件編碼格式

java課程設計例子

Java如何獲取文件編碼格式

1：簡單判斷是UTF-8或不是UTF-8，因為一般除了UTF-8之外就是GBK，所以就設置默認為GBK。

按照給定的字符集存儲文件時，在文件的最開頭的三個位元組中就有可能存儲著編碼信息，所以，基本的原理就是只要讀出文件前三個位元組，判定這些位元組的值，就可以得知其編碼的格式。其實，如果項目運行的平台就是中文操作系統，如果這些文本文件在項目內產生，即開發人員可以控制文本的編碼格式，只要判定兩種常見的編碼就可以了：GBK和UTF-8。由於中文Windows默認的編碼是GBK，所以一般只要判定UTF-8編碼格式。

對於UTF-8編碼格式的文本文件，其前3個位元組的值就是-17、-69、-65，所以，判定是否是UTF-8編碼格式的代碼片段如下：

File file = new File(path);

InputStream in= new java.io.FileInputStream(file);

byte[] b = new byte[3];

in.read(b);

in.close();

if (b[0] == -17 b[1] == -69 b[2] == -65)

System.out.println(file.getName() + “：編碼為UTF-8”);

else

System.out.println(file.getName() + “：可能是GBK，也可能是其他編碼”);

2：若想實現更複雜的文件編碼檢測，可以使用一個開源項目cpdetector，它所在的網址是：。它的類庫很小，只有500K左右，cpDetector是基於統計學原理的，不保證完全正確，利用該類庫判定文本文件的代碼如下：

讀外部文件(先利用cpdetector檢測文件的編碼格式，然後用檢測到的編碼方式去讀文件):

/**

* 利用第三方開源包cpdetector獲取文件編碼格式

* @param path

* 要判斷文件編碼格式的源文件的路徑

* @author huanglei

* @version 2012-7-12 14:05

public static String getFileEncode(String path) {

* detector是探測器，它把探測任務交給具體的探測實現類的實例完成。

* cpDetector內置了一些常用的探測實現類，這些探測實現類的實例可以通過add方法加進來，如ParsingDetector、

* JChardetFacade、ASCIIDetector、UnicodeDetector。

* detector按照「誰最先返回非空的探測結果，就以該結果為準」的原則返回探測到的

* 字符集編碼。使用需要用到三個第三方JAR包：antlr.jar、chardet.jar和cpdetector.jar

* cpDetector是基於統計學原理的，不保證完全正確。

CodepageDetectorProxy detector = CodepageDetectorProxy.getInstance();

* ParsingDetector可用於檢查HTML、XML等文件或字元流的編碼,構造方法中的參數用於

* 指示是否顯示探測過程的詳細信息，為false不顯示。

detector.add(new ParsingDetector(false));

* JChardetFacade封裝了由Mozilla組織提供的JChardet，它可以完成大多數文件的編碼

* 測定。所以，一般有了這個探測器就可滿足大多數項目的要求，如果你還不放心，可以

* 再多加幾個探測器，比如下面的ASCIIDetector、UnicodeDetector等。

detector.add(JChardetFacade.getInstance());// 用到antlr.jar、chardet.jar

// ASCIIDetector用於ASCII編碼測定

detector.add(ASCIIDetector.getInstance());

// UnicodeDetector用於Unicode家族編碼的測定

detector.add(UnicodeDetector.getInstance());

java.nio.charset.Charset charset = null;

File f = new File(path);

try {

charset = detector.detectCodepage(f.toURI().toURL());

} catch (Exception ex) {

ex.printStackTrace();

}

if (charset != null)

return charset.name();

else

return null;

}

String charsetName = getFileEncode(configFilePath);

System.out.println(charsetName);

inputStream = new FileInputStream(configFile);

BufferedReader in = new BufferedReader(new InputStreamReader(inputStream, charsetName));

讀jar包內部資源文件(先利用cpdetector檢測jar內部的資源文件的編碼格式，然後以檢測到的編碼方式去讀文件)：

/**

* 利用第三方開源包cpdetector獲取URL對應的文件編碼

* @param path

* 要判斷文件編碼格式的源文件的URL

* @author huanglei

* @version 2012-7-12 14:05

public static String getFileEncode(URL url) {

* detector是探測器，它把探測任務交給具體的探測實現類的實例完成。

* cpDetector內置了一些常用的探測實現類，這些探測實現類的實例可以通過add方法加進來，如ParsingDetector、

* JChardetFacade、ASCIIDetector、UnicodeDetector。

* detector按照「誰最先返回非空的探測結果，就以該結果為準」的原則返回探測到的

* 字符集編碼。使用需要用到三個第三方JAR包：antlr.jar、chardet.jar和cpdetector.jar

* cpDetector是基於統計學原理的，不保證完全正確。

CodepageDetectorProxy detector = CodepageDetectorProxy.getInstance();

* ParsingDetector可用於檢查HTML、XML等文件或字元流的編碼,構造方法中的參數用於

* 指示是否顯示探測過程的詳細信息，為false不顯示。

detector.add(new ParsingDetector(false));

* JChardetFacade封裝了由Mozilla組織提供的JChardet，它可以完成大多數文件的編碼

* 測定。所以，一般有了這個探測器就可滿足大多數項目的要求，如果你還不放心，可以

* 再多加幾個探測器，比如下面的ASCIIDetector、UnicodeDetector等。

detector.add(JChardetFacade.getInstance());// 用到antlr.jar、chardet.jar

// ASCIIDetector用於ASCII編碼測定

detector.add(ASCIIDetector.getInstance());

// UnicodeDetector用於Unicode家族編碼的測定

detector.add(UnicodeDetector.getInstance());

java.nio.charset.Charset charset = null;

try {

charset = detector.detectCodepage(url);

} catch (Exception ex) {

ex.printStackTrace();

}

if (charset != null)

return charset.name();

else

return null;

}

URL url = CreateStationTreeModel.class.getResource(“/resource/” + “配置文件”);

URLConnection urlConnection = url.openConnection();

inputStream=urlConnection.getInputStream();

String charsetName = getFileEncode(url);

System.out.println(charsetName);

BufferedReader in = new BufferedReader(new InputStreamReader(inputStream, charsetName));

3：探測任意輸入的文本流的編碼，方法是調用其重載形式：

charset=detector.detectCodepage(待測的文本輸入流,測量該流所需的讀入位元組數);

上面的位元組數由程序員指定，位元組數越多，判定越準確，當然時間也花得越長。要注意，位元組數的指定不能超過文本流的最大長度。

4：判定文件編碼的具體應用舉例：

屬性文件(.properties)是Java程序中的常用文本存儲方式，象STRUTS框架就是利用屬性文件存儲程序中的字元串資源。它的內容如下所示：

#注釋語句

屬性名=屬性值

讀入屬性文件的一般方法是：

FileInputStream ios=new FileInputStream(「屬性文件名」);

Properties prop=new Properties();

prop.load(ios);

String value=prop.getProperty(「屬性名」);

ios.close();

利用java.io.Properties的load方法讀入屬性文件雖然方便，但如果屬性文件中有中文，在讀入之後就會發現出現亂碼現象。發生這個原因是load方法使用位元組流讀入文本，在讀入後需要將位元組流編碼成為字元串，而它使用的編碼是「iso-8859-1」,這個字符集是ASCII碼字符集，不支持中文編碼，

方法一：使用顯式的轉碼：

String value=prop.getProperty(「屬性名」);

String encValue=new String(value.getBytes(「iso-8859-1″),」屬性文件的實際編碼」);

方法二：象這種屬性文件是項目內部的，我們可以控制屬性文件的編碼格式，比如約定採用Windows內定的GBK，就直接利用」gbk」來轉碼，如果約定採用UTF-8，就使用」UTF-8″直接轉碼。

方法三：如果想靈活一些，做到自動探測編碼，就可利用上面介紹的方法測定屬性文件的編碼，從而方便開發人員的工作

補充：可以用下面代碼獲得Java支持編碼集合：

Charset.availableCharsets().keySet();

可以用下面的代碼獲得系統默認編碼：

Charset.defaultCharset();

java如何獲取文件信息？

File 類是對文件和文件夾的抽象，包含了對文件和文件夾的多種屬性和操作方法。File類的常用方法如下表：

方法

說明

String getName 獲取文件名稱

String getParent 獲取文件的父路徑字元串

String getPath 獲取文件的相對路徑字元串

String getAbsolutePath 獲取文件的絕對路徑字元串

boolean exists 判斷文件或者文件夾是否存在

boolean isFile 判斷是不是文件類型

boolean isDirectory 判斷是不是文件夾類型

boolean delete 刪除文件或文件夾，如果刪除成功返回結果為true

boolean mkdir 創建文件夾，創建成功返回true

boolean setReadOnly 設置文件或文件夾的只讀屬性

long length 獲取文件的長度

long lastModified 獲取文件的最後修改時間

String[ ] list 獲取文件夾中的文件和子文件夾的名稱，並存放到字元串數組中

用Java實現獲取文件類型的方法。

主要以下幾種方法：

這個MimetypesFileMap類會映射出一個file的Mime Type，這些Mime Type類型是在activation.jar包裡面的資源文件中定義的

import javax.activation.MimetypesFileTypeMap;

import java.io.File;

class GetMimeType {

public static void main(String args[]) {

File f = new File(“test.gif”);

System.out.println(“Mime Type of ” + f.getName() + ” is ” +

new MimetypesFileTypeMap().getContentType(f));

// expected output :

// “Mime Type of test.gif is image/gif”

}

使用 java.net.URL

警告：這個方法非常慢

與上面所說的匹配後綴名類似。後綴名和mime-type的映射關係被定義在[jre_home]\lib\content-types.properties這個文件中

import java.net.*;

public class FileUtils{

public static String getMimeType(String fileUrl)

throws java.io.IOException, MalformedURLException

{

String type = null;

URL u = new URL(fileUrl);

URLConnection uc = null;

uc = u.openConnection();

type = uc.getContentType();

return type;

}

public static void main(String args[]) throws Exception {

System.out.println(FileUtils.getMimeType(“”));

// output : text/plain

}

還有一種方式：就是取文件名最後一個「.」後的內容，通過人來判斷如

String fileName = “aaa.txt”;

String fileType =「txt」//通過方法取出方法類型為

String type = “”;

if( fileTyep.equals(“txt”)){

type = “記事本”;

}else if(fileTyep.equals(“img”)){

type = “img圖片”;

}。。。。。

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-tw/n/230709.html

java獲取文件的progid,java獲取文件的編碼格式

本文目錄一覽：

Java如何獲取文件的內容類型

java實現opc連接中ProgId是什麼

java 怎麼獲得文件編碼格式

java如何獲取文件信息？

用Java實現獲取文件類型的方法。

相關推薦

發表回復