[英]How to extract text from marathi, hindi pdf files using itextpdf in android
[英]How can a extract text from Hindi PDF file in Android
我正在嘗試閱讀印地語 PDF 的內容。 我已經使用itext7庫來讀取 PDF 文件。
它適用於英語 PDF 並且也可以獲取確切的字符但是當我嘗試使用任何印地語(本地)語言 PDF 時,值的格式不可讀。
我得到文本的不可讀格式
d d d daaaah h eeh h ee aaaa
這是閱讀 PDF 頁面的示例代碼。
val pdfReader = PdfReader("pdfPath")
PdfDocument(pdfReader).use { doc ->
pdfContent = PdfTextExtractor.getTextFromPage(doc.getPage(1))
}
pdfReader.close()
我是否需要將語言參數傳遞給 itext7 庫才能獲得確切的內容?
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.