[英]create a subset of xmls files from an original xmls while keeping the same structure
我的问题是我想从原始xmls创建xmls文件的子集,同时保持相同的结构。 您可以说我想过滤一个子集。
在处理Medline数据库时,最好的方法是什么?
这里有一个概述。
完全阅读输入的xml文件。
确定您要分割xml文件的级别。 (例如3级)
确定感兴趣的标签。 您可以预先确定标签,或向用户提供一些GUI以选择所需的标签。 您还可以将输入文件拆分为许多包含输入文件所有标记的文件。
创建输出文件。 例如,直到3级,文件都是相同的。 从第4级开始,您将拥有许多不同的文件。
例如,如果您有xml文件,例如
<L1> ....
<L2> ...
<L3> ....
<L4a> .... </L4a>
<L4b> .... </L4b>
<L4c> .... </L4c>
</L3>
</L2>
</L1>
您可以制作3个输出文件
<L1> ....
<L2> ...
<L3> ....
<L4a> .... </L4a>
</L3>
</L2>
</L1>
<L1> ....
<L2> ...
<L3> ....
<L4b> .... </L4b>
</L3>
</L2>
</L1>
等等
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.