使用 awk 或 jq 獲取 json 值

Question

我的 json 文件看起來像這樣。

我有超過 5000 個文件：文件名： xxxx.json

示例文件1000.json

[
  {
    "gender": {
      "value": "Female"
    },
    "age": 38.58685,
    "age_group": "adult"
  },
  {
    "gender": {
      "value": "Male"
    },
    "age": 26.64953,
    "age_group": "adult"
  }
]

示例文件2000.json

[
  {
    "gender": {
      "value": "Male"
    },
    "age": 63.8272,
    "age_group": "adult"
  },
  {
    "gender": {
      "value": "Male"
    },
    "age": 11.8287,
    "age_group": "child"
  }
]

所需 Output 在一個文件中output.txt

1000 & Female,Male & 38,26 & adult,adult
2000 & Male,Male & 63,11 & adult,child

Answer 1

在jq中可以通過一些字符串插值來實現：

$ find . -name "*.json" -exec jq -r \
  '(input_filename | gsub("^\\./|\\.json$";"")) as $fname |
   (map(.gender.value) | unique | join(",")) as $genders |
   (map(.age|floor|tostring) | join(",")) as $ages |
   (map(.age_group) | unique | join(",")) as $age_groups |
   "\($fname) & \($genders) & \($ages) & \($age_groups)"' '{}' +
1000 & Female,Male & 38,26 & adult
2000 & Male & 63,11 & adult,child

input_filename命令返回顯而易見的結果，而對於其他部分，只需從. 作為數組並將它們加入 CSV 字符串（使用join而不是@csv以避免添加引號）。

find內容是為了避免jq -r '...' *.json命令行太長的可能性，因為您說您有超過 5000 個文件。 它可能會運行jq多次，每次使用盡可能多的文件名（尾隨+而不是;使得-exec工作起來很像xargs ），而不是每個文件運行一次，以提高效率。

使用 awk 或 jq 獲取 json 值

問題描述

1 個解決方案

解決方案1
5 已采納 2020-07-26 21:29:18

使用 awk 或 jq 獲取 json 值

問題描述

1 個解決方案

解決方案1 5 已采納 2020-07-26 21:29:18

解決方案1
5 已采納 2020-07-26 21:29:18