[英]how to extract text from ppt, pptx file except footer, slide number using apache poi?
我知道如何使用apache poi從ppt文件中提取文本
InputStream fis=new FileInputStream("abcd.ppt");
HSLFSlideShow show=new HSLFSlideShow(fis);
SlideShow ss=new SlideShow(show);
Slide[] slides=ss.getSlides();
StringBuilder builder = new StringBuilder();
for(int x=0; x < slides.length; x++)
{
TextRun[] runs = slides[x].getTextRuns();
for(int j=0; j<runs.length; j++) {
TextRun run = runs[j];
if(run != null) {
String text = run.getText();
builder.append(text);
}
}
}
但它會提取我不需要的所有頁腳,幻燈片編號
那么如何提取除頁腳和幻燈片編號以外的文本
提前致謝
我建議您看一下JPresentation。 他們的示例之一顯示了如何從所有幻燈片中提取所有圖像和文本: http : //www.independentsoft.de/jpresentation/tutorial/exportallslides.html
API的接縫非常簡單。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.