使用 pandas.dataframe 格式化數據

Question

我是熊貓的新手，我需要一些指導。 我有一本字典，我編寫了下面的代碼來創建一個數據框來寫入 Excel 工作表。

dict = { "name": "xyz",
         "desciption":"abc",
         "paths": ["a","b","c"]
       }
df = pd.DataFrame(dict)

………………………………………………………………………………………………………………………………………………………… ………………

我必須創建一個數據框並將其寫入excel。 我的excel應該以以下格式顯示數據：

name  description  paths
xyz   abc           a
                    b
                    c

但我實際得到的是：

name  description  paths
xyz   abc           a
xyz   abc           b
xyz   abc           c

Answer 1

您可以找到列name和desciption的重復項並將它們desciption空字符串：

# keep only the first one, mark others as duplicates
dups = df.duplicated(["name", "desciption"], keep="first")

# put empty string to those places
df.loc[dups, ["name", "desciption"]] = ""

這使

>>> df

  name desciption paths
0  xyz        abc     a
1                     b
2                     c

您可以將此幀寫入文件。

Answer 2

解決方案可能如下：

import pandas as pd

paths = ["a", "b", "c"]

d = {"name": ["xyz"] + [''] * (len(paths) - 1),
     "desciption": ["abc"] + [''] * (len(paths) - 1),
     "paths": paths
     }
df = pd.DataFrame(d)

print(df)

  name desciption paths
0  xyz        abc     a
1                     b
2                     c

您可以通過df.to_excel(index=False)擺脫索引號。

使用 pandas.dataframe 格式化數據

問題描述

2 個解決方案

解決方案1
3 已采納 2021-06-24 18:34:43

解決方案2
1 2021-06-24 18:25:59

使用 pandas.dataframe 格式化數據

問題描述

2 個解決方案

解決方案1 3 已采納 2021-06-24 18:34:43

解決方案2 1 2021-06-24 18:25:59

解決方案1
3 已采納 2021-06-24 18:34:43

解決方案2
1 2021-06-24 18:25:59