如何在Groovy中檢查文件中的UTF-8 BOM？

Question

我不想將整個文件加載到內存中
我不想對底層操作系統做任何假設。

我剩下這個：

echo it, "Checking file.. ${file.absolutePath}"
def fis = new FileInputStream(file)
def openingBytes = new byte[3]
try {
    fis.read(openingBytes)

    if (openingBytes.encodeHex() =~ /^efbbbf/) {
        errors << file.path + " - File needs to be converted from UTF-8 BOM to UTF-8 without BOM"
    }
} catch (Exception e) {
    errors << "Encountered an error trying to check " + file.path + " for BOMs."
} finally {
    fis.close()
}

但這似乎非常冗長且類似於Java。 :-(

Answer 1

怎么樣：

file.withInputStream { fis ->
    byte[] openingBytes = new byte[3]
    fis.read( openingBytes )
    if( openingBytes != [ 0xEF, 0xBB, 0xBF ] as byte[] ) {
        errors << file.path + " - File needs to be converted from UTF-8 BOM to UTF-8 without BOM"
    }
}

Answer 2

好吧，Groovy使用Java庫，對此有一個Java解決方案：Apache Common IO。

您可以看一下該線程的答案：

讀取UTF-8-BOM標記

該線程中與Apache Common IO的鏈接不再起作用，這是正確的鏈接：

http://commons.apache.org/proper/commons-io/apidocs/org/apache/commons/io/input/BOMInputStream.html

如何在Groovy中檢查文件中的UTF-8 BOM？

問題描述

2 個解決方案

解決方案1
1 已采納 2013-11-20 20:07:16

解決方案2
0 2014-12-23 11:39:14

如何在Groovy中檢查文件中的UTF-8 BOM？

問題描述

2 個解決方案

解決方案1 1 已采納 2013-11-20 20:07:16

解決方案2 0 2014-12-23 11:39:14

解決方案1
1 已采納 2013-11-20 20:07:16

解決方案2
0 2014-12-23 11:39:14