[英]Diff 2 Open XML Word Documents
在此先感謝您的幫助和幫助。
我試圖找到一些實用性/方向,以便最好地比較兩個單詞docx文件(原始版本和修改版本)的差異,然后突出顯示c#中修改版本的更改。
再次感謝您提供的任何幫助。
OpenXML SDK 2.0 Toolkit附帶了一個可以執行此操作的工具。 它叫做OpenXMLDiff。 您還可以閱讀此處工具包提供的其他內容: Open XML SDK 2.0簡介 。
如果這不是您所需要的,那么您將不得不瀏覽Open XML文檔的每個包並確定它們之間的差異。
您可以使用屬於MS'XML Diff and Patch Tool'的XMLDiff.exe實用程序。
有關MSDN文章“ 在應用程序中使用XML差異和修補工具 ”的更多信息,請參閱。
下載鏈接: Xmldiffpatch.exe (也是在MSDN文章的最開頭)。
我會稍微刷新一下這個話題。 目前,“Open XML SDK 2.5 Productivity Tool”可以做到這一點。 我發現它在不同的pptx \\ docx \\ xlsx文件中非常有用。 打開XML SDK 2.5
如果您使用的是Visual Studio,則還應考慮添加此插件: Visual Studio的Open XML Package Editor 。 當您快速查看文件或更改內容時,它非常有用。
docx文件是重命名的zip文件。 您可以將其重命名為.zip並將其解壓縮。
但是,docx不是單個文件的zip ...它是一個包含xml文件的文件夾層次結構。 因此,您可以將其解壓縮並編寫比較實用程序(如Beyond Compare)以獲取差異。
我不確定你會如何表達這些差異? 您想直觀地顯示Word文檔中的差異嗎? 例如,第二個檔案中缺少此段落等。
文檔內容是XML標記的,並根據在保存之間添加/修改/刪除的任何選項,更改,強調等進行細分。 像添加和刪除換行這樣簡單的事情可能會導致不同的物理XML結構。 最終的實際內容不會有任何差異,但XML可能會有所不同。
究竟什么是你想要識別的“差異”? 這將決定您需要對內部結構進行多少解析,以及可以使用哪些技術或工具來識別差異。
有列出了一些OpenXML的差異工具在這里 。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.