簡體   English   中英

使用XSS和Event讀取Java中巨大的Excel文件的多個選項卡

[英]Reading multiple tabs of a huge excel file in Java using XSS and Event

我正在使用(作者:lchen)的這段代碼,該代碼根據我提供給方法“ readRow() ”的行數從excel文件中讀取內容。

 import java.io.InputStream;
import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;

import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamException;
import javax.xml.stream.XMLStreamReader;

import org.apache.poi.openxml4j.opc.OPCPackage;
import org.apache.poi.openxml4j.opc.PackageAccess;
import org.apache.poi.ss.util.CellReference;
import org.apache.poi.xssf.eventusermodel.ReadOnlySharedStringsTable;
import org.apache.poi.xssf.eventusermodel.XSSFReader;
import org.apache.poi.xssf.usermodel.XSSFRichTextString;
import org.xml.sax.InputSource;


public class TestLargeFileRead {
    private int rowNum = 0;
    private OPCPackage opcPkg;
    private ReadOnlySharedStringsTable stringsTable;
    private XMLStreamReader xmlReader;


    public void XExcelFileReader(String excelPath) throws Exception {
        opcPkg = OPCPackage.open(excelPath, PackageAccess.READ);
        this.stringsTable = new ReadOnlySharedStringsTable(opcPkg);

        XSSFReader xssfReader = new XSSFReader(opcPkg);
        XMLInputFactory factory = XMLInputFactory.newInstance();
        InputStream inputStream = xssfReader.getSheetsData().next();
        xmlReader = factory.createXMLStreamReader(inputStream);


        while (xmlReader.hasNext()) {
            xmlReader.next();
            if (xmlReader.isStartElement()) {
                if (xmlReader.getLocalName().equals("sheetData"))
                    break;
            }
        }
    }


    public int rowNum() {
        return rowNum;
    }


    public List<String[]> readRows(int batchSize) throws XMLStreamException {
        String elementName = "row";
        List<String[]> dataRows = new ArrayList<String[]>();
        if (batchSize > 0) {
            while (xmlReader.hasNext()) {
                xmlReader.next();
                if (xmlReader.isStartElement()) {
                    if (xmlReader.getLocalName().equals(elementName)) {
                        rowNum++;
                        dataRows.add(getDataRow());
                        if (dataRows.size() == batchSize)
                            break;
                    }
                }
            }
        }
        return dataRows;
    }

    private String[] getDataRow() throws XMLStreamException {
        List<String> rowValues = new ArrayList<String>();
        while (xmlReader.hasNext()) {
            xmlReader.next();
            if (xmlReader.isStartElement()) {
                if (xmlReader.getLocalName().equals("c")) {
                    CellReference cellReference = new CellReference(
                            xmlReader.getAttributeValue(null, "r"));
                    // Fill in the possible blank cells!
                    while (rowValues.size() < cellReference.getCol()) {
                        rowValues.add("");
                    }
                    String cellType = xmlReader.getAttributeValue(null, "t");
                    rowValues.add(getCellValue(cellType));
                }
            } else if (xmlReader.isEndElement()
                    && xmlReader.getLocalName().equals("row")) {
                break;
            }
        }
        return rowValues.toArray(new String[rowValues.size()]);
    }

    private String getCellValue(String cellType) throws XMLStreamException {
        String value = ""; // by default
        while (xmlReader.hasNext()) {
            xmlReader.next();
            if (xmlReader.isStartElement()) {
                if (xmlReader.getLocalName().equals("v")) {
                    if (cellType != null && cellType.equals("s")) {
                        int idx = Integer.parseInt(xmlReader.getElementText());
                        return new XSSFRichTextString(
                                stringsTable.getEntryAt(idx)).toString();
                    } else {
                        return xmlReader.getElementText();
                    }
                }
            } else if (xmlReader.isEndElement()
                    && xmlReader.getLocalName().equals("c")) {
                break;
            }
        }
        return value;
    }

    @Override
    protected void finalize() throws Throwable {
        if (opcPkg != null)
            opcPkg.close();
        super.finalize();
    }
public static void main(String[] args)  {  
        try {  
            TestLargeFileRead howto = new TestLargeFileRead();  
            howto.XExcelFileReader("D:\\TEMP_CATALOG\\H1.xlsx");  
        } catch (Exception e) {  
            e.printStackTrace();  
        }  


    }
}

但是它僅讀取“第一張表”的內容,並丟棄其他后續“表”。 我的要求是讀取SHEET名稱; 並根據名稱閱讀該SHEET的內容。 誰能幫助我自定義上面的代碼以獲取“ SHEET NAME”及其內容? 請 ?

您需要使用和調整使用的關鍵類是XSSFReader 如果查看它的Javadocs ,將會看到它提供了所有工作表的InputStreams的迭代器,以及一種獲取根Workbook流的方法。

如果要訪問所有工作表,則需要更改以下幾行:

    InputStream inputStream = xssfReader.getSheetsData().next();
    xmlReader = factory.createXMLStreamReader(inputStream);

變成更像:

Iterator<InputStream> sheetsData = xssfReader.getSheetsData();
while (sheetsData.hasNext()) {
    InputStream inputStream = sheetsData.next();
    xmlReader = factory.createXMLStreamReader(inputStream);

    ....
}

如果還希望獲得工作表名稱,則需要執行類似基於Apache POI XLSX事件的文本提取器中顯示的操作。

XSSFReader.SheetIterator iter = (XSSFReader.SheetIterator) xssfReader.getSheetsData();
while (sheetsData.hasNext()) {
    InputStream inputStream = sheetsData.next();
    String sheetName = iter.getSheetName();

    if (sheetName.equalsIgnoreCase("TheSheetIWant")) {
       xmlReader = factory.createXMLStreamReader(inputStream);

       ....
    }
}

如果您想了解更多有關執行此操作的知識,那么Apache POI附帶的XSSFEventBasedExcelExtractor是易於閱讀和遵循的最佳示例之一-閱讀相關代碼並學習!

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM