簡體 English 中英

如何使用 fop 將 Tesseract 軟件輸出（hocr）轉換為純 txt 文件（生成零輸出）？

[英]How to convert Tesseract software output (hocr) into plain txt file with fop (generates zero output)?

原文 2022-05-28 02:51:57 2 1 xml/ xpath/ xslt/ apache-fop/ hocr

結果輸出：一個帶有空行的 txt 文件。

預期輸出：一個 txt 文件，其中包含“Привет Мир! Это я, обычный неработающий текст или рыба”文本。

我究竟做錯了什么？ 嘗試嵌套的 xsl:for-each 代碼會給出相同的行為。

1 個解決方案

我在您的嘗試中發現了 2 個問題：

您的指示：

 <xsl:for-each select="//div [@class='ocr_page'] /div [@class='ocr_carea'] / p [@class='ocr_par'] / span[@class='ocr_line'] / span [@class='ocrx_word']">

什么都不選擇，因為您的輸入 XML 將其所有元素都放在一個命名空間中。 請參閱此處如何解決此問題。

一旦你讓它工作，這個指令將把你放在span的上下文中。 在這種情況下，您的下一條指令：
```
 <xsl:value-of select="normalize-space(span [@class='ocrx_word'])" disable-output-escaping="yes"/>
```
也沒有選擇任何內容，因為span不是它自己的孩子。 它應該是：
```
 <xsl:value-of select="normalize-space(.)"/>
```
而且我懷疑您是否想在生成 XML 結果的樣式表中禁用輸出轉義。

HTML：如何輸出到.txt或xml文件

[英]HTML: How to output to .txt or xml file

如何在python中將xml文件轉換為csv輸出？

[英]How to convert xml file to csv output in python?

使用XSLT從XML轉換為txt文件時，如何在輸出中顯示文件創建日期？

[英]How can I display File creation date in output when converting from XML to txt file using XSLT?

getNodeSet 返回零輸出

[英]getNodeSet returns zero output

如何將PHP轉換為XML輸出

[英]How to convert PHP to XML output

如何將我的 python 輸出從 XML 文件保存到 txt

[英]how can I save my python output from XML file to txt

使用xsl輸出純文本

[英]use xsl to output plain text

如何以純字符串輸出整個php數組以在XML中使用

[英]How to output whole php array in plain string to use in XML

如何使用Nginx在XSL轉換的樣式表上獲取“文本/純文本”輸出？

[英]How to get a “text/plain” output on a XSL transformed stylesheet with nginx?

Python、pandas、numpy 輸出轉換為excel文件

[英]Python, pandas, numpy output convert to excel file

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 HTML：如何輸出到.txt或xml文件如何在python中將xml文件轉換為csv輸出？使用XSLT從XML轉換為txt文件時，如何在輸出中顯示文件創建日期？ getNodeSet 返回零輸出如何將PHP轉換為XML輸出如何將我的 python 輸出從 XML 文件保存到 txt 使用xsl輸出純文本如何以純字符串輸出整個php數組以在XML中使用如何使用Nginx在XSL轉換的樣式表上獲取“文本/純文本”輸出？ Python、pandas、numpy 輸出轉換為excel文件

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM