繁体 English 中英

PDFBox提取的文本不包含国际（非英语）字符

[英]Text extracted by PDFBox does not contain international (non-English) characters

原文 2012-07-15 23:08:06 6 1 java/ internationalization/ pdfbox

我正在使用Apache PDFBox从多个PDF文件提取文本。 这些文件使用波兰语，并且包含波兰语字符。 不幸的是，当我打印提取的文本时，我一直得到 （问号），而不是这些字符。

1 个解决方案

假设您提取的文本存储在String中，我假设您当前正在使用它来打印-

System.out.println(s);

我建议您使用此代码段正确打印出波兰字符-

java.io.PrintStream p = new java.io.PrintStream(System.out,false,"UTF-8");
p.println(s);

这应该工作吗？ 不会出现在打印的文本中。

如何按包含非英文字符的字段按字母顺序对 ArrayList 进行排序？ Java

[英]How to sort ArrayList alphabetically by fields that contain non-english characters? Java

非英文字符显示为？分数

[英]Non-English characters appear as ? marks

找到非英语字符的unicode

[英]finding unicode for non-english characters

使用Spring 4 + Hibernate 4插入DB非英语字符

[英]Insert into DB non-English characters with Spring 4 + Hibernate 4

从http get请求读取非英语字符

[英]Read non-english characters from http get request

为什么Java String创建非英语字符，例如“ square”

[英]Why java String creates non-english characters like 'square'

如何正确处理非英文字符？

[英]How do I handle non-English characters properly?

检索MySQL数据库中非英语字符插入的值

[英]Retrieving non-English characters inserted values in MySQL database

GluonConnect REST库处理JSON字符串中的非英语字符

[英]GluonConnect REST library mangles non-English characters in a JSON string

WebView.findAll找不到非英文字符

[英]WebView.findAll doesnt find non-english characters

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何按包含非英文字符的字段按字母顺序对 ArrayList 进行排序？ Java 非英文字符显示为？分数找到非英语字符的unicode 使用Spring 4 + Hibernate 4插入DB非英语字符从http get请求读取非英语字符为什么Java String创建非英语字符，例如“ square” 如何正确处理非英文字符？检索MySQL数据库中非英语字符插入的值 GluonConnect REST库处理JSON字符串中的非英语字符 WebView.findAll找不到非英文字符

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM