繁体   English   中英

有没有一种方法可以使用Java从PostScript(.ps,.eps)文件中提取文本?

[英]Is there a way to extract text from PostScript (.ps , .eps) files using Java?

我正在寻找与Apache Box的PDF相似的PDFBox解决方案,但是对于PS文件。

谢谢。

您可以使用Ghostscript转换为pdf, http://www.osalt.com/ghostscript ,然后有各种库可以处理pdf。

这样做的好处是,您仅从PDF中提取数据,因此您可以处理其他格式,只要您可以将它们转换为PDF。

就像詹姆斯·布莱克(James Black)所说,最好只是转换为PDF并使用您熟悉的工具。

但是,确实存在pstotext ,例如在自己的软件包中的Ubuntu Universe中可用。

Ghostscript本身也带有ps2txt和ps2ascii,它们也可以做到这一点。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM