使用php加速xml解析

Question

嗨，我有一個xml文件，其中包含大約12,000條記錄。 我編寫了代碼並且工作正常，只需要一段時間來解析xml文件並返回內容。 有沒有辦法加速這個過程？

我的代碼：

<?php 
$dom = new DOMDocument(); 
$dom->load('comics.xml'); 
foreach ($dom->getElementsByTagName('record') as $entry) 
{   
$title = $entry->getElementsByTagName('title')->item(0)->textContent;   
echo $title;   

} 
?>

XML文件（只有一個演示在那里不能鏈接所有大聲笑）：

<?xml version='1.0' encoding='utf-8'?>
<calibredb>
  <record>
    <id>1</id>
    <uuid>991639a0-7cf6-4a34-a863-4aab8ac2921d</uuid>
    <publisher>Marvel Comics</publisher>
    <size>6109716</size>
    <title sort="Iron Man v1 101">Iron Man v1 101</title>
    <authors sort="Unknown">
      <author>Unknown</author>
    </authors>
    <timestamp>2012-04-15T18:49:22-07:00</timestamp>
    <pubdate>2012-04-15T18:49:22-07:00</pubdate>
    <cover>M:/Comics/Unknown/Iron Man v1 101 (1)/cover.jpg</cover>
    <formats>
      <format>M:/Comics/Unknown/Iron Man v1 101 (1)/Iron Man v1 101 - Unknown.zip</format>
    </formats>
  </record>
  </calibredb>

Answer 1

DOM方法適用於小型數據集，因為所有XML結構都被解析並放入內存中。

在您的情況下，您應該在解析大型XML文件時使用SAX方法，因為XML文件是逐行讀取的，而不是一次讀取所有內容。

谷歌有一些例子： https ： //www.google.lv/search？q = php + SAX + XML

Answer 2

答案很大程度上取決於數據。 一些可能的解決方案是將數據移動到像MySQL這樣的關系數據庫中，或者將數據規范化為CSV格式，這種格式更容易解析，占用更少的空間，並且可以逐行讀取。

Answer 3

我並不是特別熟悉PHP實現，但是在使用Xerces的C ++中使用以下方法我已經看到了針對您的場景的巨大性能改進。

我沒有按名稱請求所有元素並等待返回整個NodeList，而是發現在根節點下獲取第一個子節點然后獲取NextSibling節點要快得多。 使用每個兄弟作為新節點，您將繼續獲取NextSibling，直到沒有剩余。

希望這提供了PHP的性能改進，類似於它在C ++中的做法。

使用php加速xml解析

問題描述

3 個解決方案

解決方案1
2 2012-07-30 23:15:42

解決方案2
1 已采納 2012-07-30 23:02:09

解決方案3
0 2012-07-30 23:13:34

使用php加速xml解析

問題描述

3 個解決方案

解決方案1 2 2012-07-30 23:15:42

解決方案2 1 已采納 2012-07-30 23:02:09

解決方案3 0 2012-07-30 23:13:34

解決方案1
2 2012-07-30 23:15:42

解決方案2
1 已采納 2012-07-30 23:02:09

解決方案3
0 2012-07-30 23:13:34