繁体   English   中英

如何检测PPTX文件的编码?

[英]How to detect the encoding of a PPTX file?

我的问题是, 如何获取Java中pptx文件的编码? (我正在使用apache poi)

   File f = new File(filename);
   XMLSlideShow ppt = new XMLSlideShow(new FileInputStream(f));

我需要知道编码的原因是,稍后,我发布了已保存在json字符串中的文件的一些数据,这是在此阶段发生的问题。

当执行http POST时,编码已更改,并且我认为如果我知道json字符串中数据的编码,则可以解决此问题。 然后,我可以在HTTP POST中设置此编码。

编辑/说明:

问题是瑞典字母å,ä和ö。

å变成Ã¥

ä变成¤¤

ö变成¶

除了Java和POI,要获取PowerPoint PPTX文件的编码,您必须检查幻灯片的基础XML:

  1. 解压缩pptx文件(要手动查找,可以使用7-zip之类的任何zip实用程序)。
  2. 在zip根目录下,找到ppt / slides目录。
  3. 通常,每张幻灯片都是slide#.xml; 打开您要检查的那个。
  4. 阅读第一行: <?xml version="1.0" encoding="UTF-8" standalone="yes"?>

在大多数情况下,我希望所有幻灯片的编码都相同(这意味着您可以使用根级“ [Content_Types] .xml”文件作为整个档案编码的代理)。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM