繁体   English   中英

如何使用Apache POI的事件API获取合并区域?

[英]How to get merged regions using apache POI's event API?

如何使用Apache POI提供的事件API获取Excel工作表的合并区域(合并单元格)?

使用“传统的”类似于DOM的解析样式,有称为Sheet.getNumMergedRegions()Sheet.getMergedRegion(int) 不幸的是,我需要处理巨大的Excel文件,即使我拥有允许使用的最高Xmx值(在此项目中),也会出现内存不足错误。 因此,我想使用事件API,但无法找出如何获取有关合并区域的信息,我需要知道这些信息才能正确地“理解”内容...

使用此处提供的示例: http : //poi.apache.org/spreadsheet/how-to.html#xssf_sax_api,我得到了合并区域中每个单元格的事件(尽管只有第一个包含任何文本内容)。 因此,也许,如果没有更直接的方法,这将有助于了解如何将这些合并的单元格与其他(空)单元格(安全)区分开来...

我不确定在哪里存储合并的单元格信息,但是我很确定它不会与单元格数据本身一起存储,因为这不是Excel的方式。

我建议您做的是创建一个没有合并单元格的简单文件。 然后,进行复制,并添加一个合并的单元格。 解压缩这两个文件(.xlsx是xml文件的zip),然后将它们进行比较。 这将很快向您显示将标记为合并的单元格设置的内容。 (我的直觉是它将在工作表设置中的某个位置,靠近开始但不靠近单元格值BICBW)

一旦知道了合并单元的详细信息在哪里,就可以查看用于合并单元的XSSF UserModel代码,以了解它们的工作方式,操作方式,选项等。 ,您可以查看文件格式文档以获取完整的详细信息,但是这些内容可能有点繁琐且详细,请先阅读。 最后,一旦知道从何处获取信息,就可以添加代码以使用合并的信息详细信息!

您需要打开流并将其解析两次。

第一次-提取合并的单元格。 它们出现在<sheetData>...</sheetData>标记之后的sheet...xml文件中,如以下示例所示:

...
< /sheetData >
< mergeCells count="2" >
    < mergeCell ref="A2:C2"/ >
    < mergeCell ref="A3:A7"/ >
 </mergeCells >

提取并保存在列表中。

然后再次重新打开流并照常进行解析,以提取行和单元格。 在结束每一行时,在endElement(...)方法中,检查此行是否(部分或全部)出现在合并区域中。

扩展麦克的答案。 您可以创建一个ContentHandler来定位合并区域,例如:

import java.util.ArrayList;
import java.util.List;

import org.apache.poi.ss.util.CellRangeAddress;

import org.xml.sax.Attributes;
import org.xml.sax.helpers.DefaultHandler;

public class MergedRegionLocator extends DefaultHandler {
    private final List<CellRangeAddress> mergedRegions = new ArrayList<>();

    @Override
    public void startElement (String uri, String localName, String name, Attributes attributes) {
        if ("mergeCell".equals(name) && attributes.getValue("ref") != null) {
            mergedRegions.add(CellRangeAddress.valueOf(attributes.getValue("ref")));
        }
    }

    public CellRangeAddress getMergedRegion (int index) {
        return mergedRegions.get(index);
    }

    public List<CellRangeAddress> getMergedRegions () {
        return mergedRegions;
    }
}

将其与基于事件的POI一起使用的示例:

OPCPackage pkg = OPCPackage.open(new FileInputStream("test.xlsx"));
XSSFReader reader = new XSSFReader(pkg);
InputStream sheetData = reader.getSheetsData().next();

MergedRegionLocator mergedRegionLocator = new MergedRegionLocator();
XMLReader parser = XMLReaderFactory.createXMLReader();
parser.setContentHandler(mergedRegionLocator);
parser.parse(new InputSource(sheetData));

mergedRegionLocator.getMergedRegions();

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM