[英]How to get text by page from word file (.Docx) using Microsoft.Office.Interop.Word in C#
[英]How to get paragraphs and shapes from word file using microsoft.office.interop.word c#
我正在尝试从word文件中读取段落内容和形状文本。
我写了以下代码:
foreach (Microsoft.Office.Interop.Word.Shape shape in document.Shapes)
{
ParaInfo.Add(new ParaInfo{Text = shape.TextFrame.TextRange.Text});
}
foreach (Microsoft.Office.Interop.Word.Paragraph para in document.Paragraphs)
{
ParaInfo.Add(new ParaInfo{Text = para.Range.Text});
}
但是,这将改变段落和形状的顺序。 我想让它们与word文档中出现的顺序相同。
如何使用Interop word实现此目的?
Word文档中没有序列,您无法按照要求获得结构。 请参阅如何使用office interop API枚举word文档?
你得到序列“改变”的原因是因为你只枚举形状然后只列举表格。 当您只获得文本内容时,尝试使用document.Content.Text
可能是有意义的,看看是否可以构建任何“结构”。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.