簡體   English   中英

從mht中提取文本

[英]extract text from mht

我有一個mht文件,我希望得到mht的所有文本。 我考慮使用正則表達式,但除了英語之外我還有mht中的其他語言,所以文本本身包含A7 = A98 = D6之類的東西......

選擇瀏覽器中查看的文件的所有文本,然后將其復制並粘貼到記事本中 - 這就是我需要的。

謝謝。

在Internet Explorer中打開該文件並將其另存為純文本(UTF-8)。 :)如果您需要自動化解決方案,請為您的平台或編程語言尋找mht to txt轉換器。

實際上,您也可以在Powershell中自動執行此操作:

$ie = New-Object -ComObject "InternetExplorer.Application"
$ie.Navigate2("file:///C:/MyFile.mht")
$text = $ie.Document.documentElement.innerText

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM