從 python 中的單個 csv 文件創建嵌套字典列表

Question

我有一個具有以下結構的 csv 文件：

team,tournament,player
Team 1,spring tournament,Rebbecca Cardone
Team 1,spring tournament,Salina Youngblood
Team 1,spring tournament,Catarina Corbell
Team 1,summer tournament,Cara Mejias
Team 1,summer tournament,Catarina Corbell
...
Team 10, spring tournament,Jessi Ravelo

我想創建一個包含玩家字典列表的嵌套字典（團隊、錦標賽）。 期望的結果是這樣的：

{'data': 
   {Team 1:
       {'spring tournament': 
               {'players': [
                   {name: Rebecca Cardone}, 
                   {name: Salina Youngblood},
                   {name: Catarina Corbell}]
        },
        {'summer tournament': 
               {'players': [
                   {name: Cara Mejias}, 
                   {name: Catarina Corbell}]
               }
        }

   },
    ...
  {Team 10:
       {'spring tournament': 
               {'players': [
                   {name: Jessi Ravelo}]
                }
       }
   }
}

我一直在努力像這樣格式化它。 我已經能夠成功嵌套第一級（團隊 # --> 錦標賽），但我無法嵌套第二級。 目前，我的代碼如下所示：

d = {}
header = True
with open("input.csv") as f:
    for line in f.readlines():
        if header:
            header = False
            continue
        team, tournament, player = line.strip().split(",")
        d_team = d.get(team,{})
        d_tournament = d_team.get(tournament, {})
        d_player = d_tournament.get('player',['name'])
        d_player.append(player)
        d_tournament['player'] = d_tournament
        d_team[tournament] = d_tournament
        d[team] = d_team
print(d)

修復我的代碼以便創建嵌套字典的下一步是什么？

Answer 1

您的實施存在一些問題：

你做d_player = d_tournament.get('player',['name']) 。 但是您實際上想要獲取名為 player s的鍵，這應該是一個字典列表。 這些字典中的每一個都必須具有{"name": "Player's Name"}的形式。 所以你想要l_player = d_tournament.get('players',[]) （默認為空列表），然后執行l_player.append({"name": player}) （我將其重命名為l_player因為它是一個列表，不是字典）。
你做d_tournament['player'] = d_tournament 。 我懷疑你的意思是d_tournament['player'] = d_player
去除行中元素的空白。 做team, tournament, player = (word.strip() for word in line.split(","))

進行這些更改后，您的代碼可以正常工作

我強烈建議您使用csv.reader class 來讀取您的 CSV 文件，而不是手動用逗號分隔行。

此外，由於 python 的容器（列表和字典）包含對其內容的引用，您只需添加一次容器，然后使用mydict["key"] = value或mylist.append()對其進行修改，這些更改將反映在父容器也是。 由於這種行為，您不需要像使用d_team[tournament] = d_tournament那樣在循環中重復分配這些東西

allteams = dict()
hasHeader = True
with open("input.csv") as f:
    csvreader = csv.reader(f)
    if hasHeader: next(csvreader) # Consume one line if a header exists

    # Iterate over the rows, and unpack each row into three variables
    for team_name, tournament_name, player_name in csvreader:
        # If the team hasn't been processed yet, create a new dict for it
        if team_name not in allteams:
            allteams[team_name] = dict()

        # Get the dict object that holds this team's information
        team = allteams[team_name]

        # If the tournament hasn't been processed already for this team, create a new dict for it in the team's dict
        if tournament_name not in team:
            team[tournament_name] = {"players": []}

        # Get the tournament dict object
        tournament = team[tournament_name]

        # Add this player's information to the tournament dict's "player" list
        tournament["players"].append({"name": player_name})

# Add all teams' data to the "data" key in our result dict
result = {"data": allteams}
print(result)

這給了我們想要的東西（美化的輸出）：

{
    'data': {
        'Team 1': {
            'spring tournament': {
                'players': [
                    { 'name': 'Rebbecca Cardone' },
                    { 'name': 'Salina Youngblood' },
                    { 'name': 'Catarina Corbell' }
                ]
            },
            'summer tournament': {
                'players': [
                    { 'name': 'Cara Mejias' },
                    { 'name': 'Catarina Corbell' }
                ]
            }
        },
        'Team 10': {
            ' spring tournament': {
                'players': [
                    { 'name': 'Jessi Ravelo' }
                ]
            }
        }
    }
}

Answer 2

您描述的示例字典是不可能的（如果您想要鍵“Team 1”下的多個字典，請將它們放在一個列表中），但是這個片段：

if __name__ == '__main__':
    your_dict = {}
    with open("yourfile.csv") as file:
        all_lines = file.readlines()

    data_lines = all_lines[1:]  #  Skipping "team,tournament,player" line

    for line in data_lines:
        line = line.strip()  # Remove \n
        team, tournament_type, player_name = line.split(",")
        team_dict = your_dict.get(team, {})  # e.g. "Team 1"

        tournaments_of_team_dict = team_dict.get(tournament_type, {'players': []})  # e.g. "spring_tournament"

        tournaments_of_team_dict["players"].append({'name': player_name})

        team_dict[tournament_type] = tournaments_of_team_dict
        your_dict[team] = team_dict

    your_dict = {'data': your_dict}

對於此示例yourfile.csv ：

team,tournament,player
Team 1,spring tournament,Rebbecca Cardone
Team 1,spring tournament,Salina Youngblood
Team 2,spring tournament,Catarina Corbell
Team 1,summer tournament,Cara Mejias
Team 2,summer tournament,Catarina Corbell

給出以下內容：

{
  "data": {
    "Team 1": {
      "spring tournament": {
        "players": [
          {
            "name": "Rebbecca Cardone"
          },
          {
            "name": "Salina Youngblood"
          }
        ]
      },
      "summer tournament": {
        "players": [
          {
            "name": "Cara Mejias"
          }
        ]
      }
    },
    "Team 2": {
      "spring tournament": {
        "players": [
          {
            "name": "Catarina Corbell"
          }
        ]
      },
      "summer tournament": {
        "players": [
          {
            "name": "Catarina Corbell"
          }
        ]
      }
    }
  }
}

Process finished with exit code 0

Answer 3

也許我忽略了一些東西，但你不能使用：

df.groupby(['team','tournament'])['player'].apply(list).reset_index().to_json(orient='records')

Answer 4

你可以這樣處理它：

from collections import defaultdict
import csv
from pprint import pprint

d = defaultdict(dict)

with open('f00.txt', 'r') as f:
    reader = csv.DictReader(f)
    for row in reader:
        d[ row['team'] ].setdefault(row['tournament'], []
                                    ).append(row['player'])

pprint(dict(d))

印刷：

{'Team 1': {'spring tournament': ['Rebbecca Cardone',
                                  'Salina Youngblood',
                                  'Catarina Corbell'],
            'summer tournament': ['Cara Mejias', 'Catarina Corbell']},
 'Team 10': {' spring tournament': ['Jessi Ravelo']}}

從 python 中的單個 csv 文件創建嵌套字典列表

問題描述

4 個解決方案

解決方案1
1 已采納 2021-05-25 16:48:33

解決方案2
0 2021-05-25 16:56:55

解決方案3
0 2021-05-25 19:08:27

解決方案4
0 2021-05-25 19:29:32

從 python 中的單個 csv 文件創建嵌套字典列表

問題描述

4 個解決方案

解決方案1 1 已采納 2021-05-25 16:48:33

解決方案2 0 2021-05-25 16:56:55

解決方案3 0 2021-05-25 19:08:27

解決方案4 0 2021-05-25 19:29:32

解決方案1
1 已采納 2021-05-25 16:48:33

解決方案2
0 2021-05-25 16:56:55

解決方案3
0 2021-05-25 19:08:27

解決方案4
0 2021-05-25 19:29:32