Excel到嵌套的Json，包括子元素到數組中

Question

我正在嘗試使用 Python 將 Excel 轉換為嵌套 JSON，其中重復值作為元素數組進入。

例如：CSV 的結構

Manufacturer,oilType,viscosity
shell,superOil,1ova
shell,superOil,2ova
shell,normalOil,1ova
bp, power, 10bba

應以 JSON（預期輸出）顯示為

elements: [
    {
        "Manufacturer": "shell",
        "details": [
            {
                "OilType": "superOil",
                "Viscosity": [
                    "1ova",
                    "2ova"
                ]
            },
            {
                "OilType": "normalOil",
                "Viscosity": [
                    "1ova"
                ]
            }
        ]
    },
    {
        "Manufacturer": "bp",
        "details": [
            {
                "OilType": "power",
                "Viscosity": [
                    "10bba"
                ]
            }
        ]
    }
]

我目前已使用openpyxl將 CSV 轉換為 JSON，並以（當前輸出）等格式顯示每個標題的值

[{Manufacturer: "shell", oilType: "superOil", Viscosity:"1ova"},{...},{...},...]

請幫助獲得預期的輸出。

Answer 1

您好，歡迎來到 StackOverflow。

您的問題實際上與openpyxl無關，因為您不需要保存到 Excel 文件中。

你可以這樣想：

將 csv（或 Excel）加載到 pandas DataFrame
按制造商和油類型分組
轉儲為您想要的格式
轉換為 JSON（字符串或文件）

在實踐中，這給出了類似的東西：

import json

import pandas as pd

df = pd.read_csv("oil.csv")  # or read_excel if this is an Excel
oils = df.groupby(["Manufacturer", "oilType"]).aggregate(pd.Series.to_list)

elements = [
    {
        "Manufacturer": manufacturer,
        "Details": [
            {"OilType": o, "Viscosity": v}
            for o, v in data.droplevel(0).viscosity.items()
        ],
    }
    for manufacturer, data in oils.groupby(level="Manufacturer")
]

with open("oil.json", "w") as f:
    json.dump({"elements": elements}, f)

有關信息， oils看起來像這樣：

                           viscosity
Manufacturer    oilType 
bp              power       [10bba]
shell           normalOil   [1ova]
                superOil    [1ova, 2ova]

Excel到嵌套的Json，包括子元素到數組中

問題描述

1 個解決方案

解決方案1
0 2022-05-20 04:44:14

Excel到嵌套的Json，包括子元素到數組中

問題描述

1 個解決方案

解決方案1 0 2022-05-20 04:44:14

解決方案1
0 2022-05-20 04:44:14