使用jq删除嵌套数组的匹配/非匹配元素

Question

我需要将sonarqube分析历史记录的结果拆分为单个文件。 假设下面有一个开始输入，

    {
  "paging": {
    "pageIndex": 1,
    "pageSize": 100,
    "total": 3
  },
  "measures": [
    {
      "metric": "coverage",
      "history": [
        {
          "date": "2018-11-18T12:37:08+0000",
          "value": "100.0"
        },
        {
          "date": "2018-11-21T12:22:39+0000",
          "value": "100.0"
        },
        {
          "date": "2018-11-21T13:09:02+0000",
          "value": "100.0"
        }
      ]
    },
    {
      "metric": "bugs",
      "history": [
        {
          "date": "2018-11-18T12:37:08+0000",
          "value": "0"
        },
        {
          "date": "2018-11-21T12:22:39+0000",
          "value": "0"
        },
        {
          "date": "2018-11-21T13:09:02+0000",
          "value": "0"
        }
      ]
    },
    {
      "metric": "vulnerabilities",
      "history": [
        {
          "date": "2018-11-18T12:37:08+0000",
          "value": "0"
        },
        {
          "date": "2018-11-21T12:22:39+0000",
          "value": "0"
        },
        {
          "date": "2018-11-21T13:09:02+0000",
          "value": "0"
        }
      ]
    }
  ]
}

如何使用jq清除结果，以便它只保留每个元素的历史数组条目？ 所需的输出是这样的（输出20181118123808.json用于“2018-11-18T12：37：08 + 0000”的分析）：

{
  "paging": {
    "pageIndex": 1,
    "pageSize": 100,
    "total": 3
  },
  "measures": [
    {
      "metric": "coverage",
      "history": [
        {
          "date": "2018-11-18T12:37:08+0000",
          "value": "100.0"
        }
      ]
    },
    {
      "metric": "bugs",
      "history": [
        {
          "date": "2018-11-18T12:37:08+0000",
          "value": "0"
        }
      ]
    },
    {
      "metric": "vulnerabilities",
      "history": [
        {
          "date": "2018-11-18T12:37:08+0000",
          "value": "0"
        }
      ]
    }
  ]
}

我迷失了如何仅在子元素上操作同时保持父结构完整。 JSON文件的命名将从jq实用程序外部处理。 提供的样本数据将分为3个文件。 其他一些输入可以有可变数量的条目，有些可能高达10000.谢谢。

Answer 1

这是一个使用awk编写不同文件的解决方案。 该解决方案假定每个度量的日期相同且顺序相同，但对不同日期的数量或不同度量的数量没有限制。

jq -c 'range(0; .measures[0].history|length) as $i
  | (.measures[0].history[$i].date|gsub("[^0-9]";"")),  # basis of filename
    reduce range(0; .measures|length) as $j (.;
      .measures[$j].history |= [.[$i]])' input.json |
awk -F\\t 'fn {print >> fn; fn="";next}{fn="output-" $1 ".json"}'

这种方法的缺点是，如果要对每个文件进行整齐格式化，则每个文件都需要额外运行漂亮的打印机（例如jq）。 因此，如果要求每个文件中的输出都是整洁的，则可以为每个日期运行jq一次，从而避免了对后处理（ awk ）步骤的需要。

如果措施的日期不是锁定步骤，那么仍然可以使用与上述相同的方法，但当然，收集日期和相应的措施必须以不同方式进行。

产量

上面调用jq产生的前两行如下：

"201811181237080000"
{"paging":{"pageIndex":1,"pageSize":100,"total":3},"measures":[{"metric":"coverage","history":[{"date":"2018-11-18T12:37:08+0000","value":"100.0"}]},{"metric":"bugs","history":[{"date":"2018-11-18T12:37:08+0000","value":"0"}]},{"metric":"vulnerabilities","history":[{"date":"2018-11-18T12:37:08+0000","value":"0"}]}]}

Answer 2

在评论中，出现了原始问题的以下附录：

是否存在一种变化，其中过滤是基于日期值而不是位置？ 不能保证订单是相同的，或者每个度量中的元素数量将是相同的（即一些日期可能缺少“错误”，一些可能具有额外的度量，例如“复杂性”）。

以下将生成一个JSON对象流，每个日期一个。 此流可以使用我之前的答案中的日期进行注释，该日期显示如何使用这些注释来创建各种文件。 为了便于理解，我们使用了两个辅助函数：

def dates:
  INDEX(.measures[].history[].date; .)
  | keys;

def gather($date): map(select(.date==$date));

dates[] as $date
| .measures |= map( .history |= gather($date) )

INDEX / 2

如果你的jq没有INDEX/2 ，那么现在是升级的绝佳时机，但是如果不可行的话，这就是它的def：

def INDEX(stream; idx_expr):
  reduce stream as $row ({};
    .[$row|idx_expr|
      if type != "string" then tojson
      else .
      end] |= $row);

使用jq删除嵌套数组的匹配/非匹配元素

问题描述

2 个解决方案

解决方案1
0 已采纳 2018-11-27 07:17:32

评论

产量

解决方案2
0 2018-12-02 18:11:37

INDEX / 2

使用jq删除嵌套数组的匹配/非匹配元素

问题描述

2 个解决方案

解决方案1 0 已采纳 2018-11-27 07:17:32

评论

产量

解决方案2 0 2018-12-02 18:11:37

INDEX / 2

解决方案1
0 已采纳 2018-11-27 07:17:32

解决方案2
0 2018-12-02 18:11:37