[英]Robust json parser in Python or Java
我正在寻找一种使用Python或Java的健壮的 json解析器(到目前为止,我一直在使用Python,但是由于我正在使用它来分析Java基准测试,因此使用Java是一种合理的选择。)
关于删节和不完整文件的鲁棒性。
原因是我当前正在将caliper用于某些(微型)基准测试,并且在基准测试仍在运行 (或者如果我过早取消它)的情况下,输出文件将不是完整的JSON文档。 json
和simplejson
都不会读取这些在某些时候被截断的文件。
(我不喜欢Caliper Web界面,因为它速度慢,无法扩展到大型实验集,并且很多数据提交失败,然后从运行中丢失。)
大致而言,文档如下所示:
[
{
// first record, in multiple lines
},
{
// second record, in multiple lines
},
{
// truncated record.
现在,我正在使用一个讨厌的hack,该漏洞使用caliper当前产生的已知缩进来将},\\n\\ \\ {
处的结果文档拆分为大块,然后仅解析它们,直到最后一个失败为止。 但这是一个令人讨厌的骇客,并且对卡尺输出的未来变化并不稳健。 我也尝试过使用raw_decode
,但是它仍然需要完整的文档,并且不会在每个},
处返回有意义的结果。
我正在寻找类似于XML pull的API,这将允许我在基于事件的API中访问文档,直到被截断为止。 本质上,我对wrapper []
中的所有完整{}
部分感兴趣。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.