[英]How to get Sub-type MIME of an Office document, instead of getting OOXML in Tika
我正在使用 Tika 來驗證文件類型,並確保沒有人試圖以真實文件為幌子發送惡意或偽造文件。 為此,我使用 Apache Tika。 但是,即使我將 InputStream 包裝到 TikaInputStream 中,或者使用 OOXMLParser 或 OfficeParser,它仍然返回 application/x-tika-ooxml 而不是 application/vnd.openxmlformats-officedocument.wordprocessingml.document。 我如何訪問或讓它返回子類型?
public static boolean isValidFileMimeType(TikaInputStream stream, String[] validMimes) {
Tika tika = new Tika();
try {
Metadata meta = new Metadata();
tika.detect(stream, meta);
String mimetype = meta.get("Content-Type");
logger.debug("MIME type from TIKA is : [" + mimetype +"]");
logger.debug(meta.toString());
//return isValidFileMimeType(mimetype, validMimes);
return true;
} catch (Exception e) {
logger.error("Error validating InputStream: ", e);
return false;
}
public static boolean isValidFileMimeType(MultipartFile file, String[] mimeTypes) {
TikaInputStream in = null;
boolean isValidFile = false;
try {
in = TikaInputStream.get(file.getInputStream());
isValidFile = DataValidator.isValidFileMimeType(in, mimeTypes);
} catch (IOException e) {
logger.error("Error while validating file mime type: ", e);
} finally {
if (in != null) {
try {
in.close();
} catch (IOException e2) {
logger.error("Error while closing InputStream: ", e2);
}
}
}
return isValidFile;
}
只需導入/使用 Tika 解析器
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.