簡體   English   中英

如何使用Apache POI的事件API獲取合並區域?

[英]How to get merged regions using apache POI's event API?

如何使用Apache POI提供的事件API獲取Excel工作表的合並區域(合並單元格)?

使用“傳統的”類似於DOM的解析樣式,有稱為Sheet.getNumMergedRegions()Sheet.getMergedRegion(int) 不幸的是,我需要處理巨大的Excel文件,即使我擁有允許使用的最高Xmx值(在此項目中),也會出現內存不足錯誤。 因此,我想使用事件API,但無法找出如何獲取有關合並區域的信息,我需要知道這些信息才能正確地“理解”內容...

使用此處提供的示例: http : //poi.apache.org/spreadsheet/how-to.html#xssf_sax_api,我得到了合並區域中每個單元格的事件(盡管只有第一個包含任何文本內容)。 因此,也許,如果沒有更直接的方法,這將有助於了解如何將這些合並的單元格與其他(空)單元格(安全)區分開來...

我不確定在哪里存儲合並的單元格信息,但是我很確定它不會與單元格數據本身一起存儲,因為這不是Excel的方式。

我建議您做的是創建一個沒有合並單元格的簡單文件。 然后,進行復制,並添加一個合並的單元格。 解壓縮這兩個文件(.xlsx是xml文件的zip),然后將它們進行比較。 這將很快向您顯示將標記為合並的單元格設置的內容。 (我的直覺是它將在工作表設置中的某個位置,靠近開始但不靠近單元格值BICBW)

一旦知道了合並單元的詳細信息在哪里,就可以查看用於合並單元的XSSF UserModel代碼,以了解它們的工作方式,操作方式,選項等。 ,您可以查看文件格式文檔以獲取完整的詳細信息,但是這些內容可能有點繁瑣且詳細,請先閱讀。 最后,一旦知道從何處獲取信息,就可以添加代碼以使用合並的信息詳細信息!

您需要打開流並將其解析兩次。

第一次-提取合並的單元格。 它們出現在<sheetData>...</sheetData>標記之后的sheet...xml文件中,如以下示例所示:

...
< /sheetData >
< mergeCells count="2" >
    < mergeCell ref="A2:C2"/ >
    < mergeCell ref="A3:A7"/ >
 </mergeCells >

提取並保存在列表中。

然后再次重新打開流並照常進行解析,以提取行和單元格。 在結束每一行時,在endElement(...)方法中,檢查此行是否(部分或全部)出現在合並區域中。

擴展麥克的答案。 您可以創建一個ContentHandler來定位合並區域,例如:

import java.util.ArrayList;
import java.util.List;

import org.apache.poi.ss.util.CellRangeAddress;

import org.xml.sax.Attributes;
import org.xml.sax.helpers.DefaultHandler;

public class MergedRegionLocator extends DefaultHandler {
    private final List<CellRangeAddress> mergedRegions = new ArrayList<>();

    @Override
    public void startElement (String uri, String localName, String name, Attributes attributes) {
        if ("mergeCell".equals(name) && attributes.getValue("ref") != null) {
            mergedRegions.add(CellRangeAddress.valueOf(attributes.getValue("ref")));
        }
    }

    public CellRangeAddress getMergedRegion (int index) {
        return mergedRegions.get(index);
    }

    public List<CellRangeAddress> getMergedRegions () {
        return mergedRegions;
    }
}

將其與基於事件的POI一起使用的示例:

OPCPackage pkg = OPCPackage.open(new FileInputStream("test.xlsx"));
XSSFReader reader = new XSSFReader(pkg);
InputStream sheetData = reader.getSheetsData().next();

MergedRegionLocator mergedRegionLocator = new MergedRegionLocator();
XMLReader parser = XMLReaderFactory.createXMLReader();
parser.setContentHandler(mergedRegionLocator);
parser.parse(new InputSource(sheetData));

mergedRegionLocator.getMergedRegions();

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM