繁体   English   中英

从原始xml创建xmls文件的子集,同时保持相同的结构

[英]create a subset of xmls files from an original xmls while keeping the same structure

我的问题是我想从原始xmls创建xmls文件的子集,同时保持相同的结构。 您可以说我想过滤一个子集。

在处理Medline数据库时,最好的方法是什么?

这里有一个概述。

  1. 完全阅读输入的xml文件。

  2. 确定您要分割xml文件的级别。 (例如3级)

  3. 确定感兴趣的标签。 您可以预先确定标签,或向用户提供一些GUI以选择所需的标签。 您还可以将输入文件拆分为许多包含输入文件所有标记的文件。

  4. 创建输出文件。 例如,直到3级,文件都是相同的。 从第4级开始,您将拥有许多不同的文件。

例如,如果您有xml文件,例如

<L1> .... 
    <L2> ...
        <L3> ....
           <L4a> .... </L4a>
           <L4b> .... </L4b>
           <L4c> .... </L4c>
        </L3>
    </L2>
</L1>    

您可以制作3个输出文件

<L1> .... 
    <L2> ...
        <L3> ....
           <L4a> .... </L4a>
        </L3>
    </L2>
</L1>    

<L1> .... 
    <L2> ...
        <L3> ....
           <L4b> .... </L4b>
        </L3>
    </L2>
</L1>    

等等

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM