簡體   English   中英

使用 pandas.dataframe 格式化數據

[英]format data using pandas.dataframe

我是熊貓的新手,我需要一些指導。 我有一本字典,我編寫了下面的代碼來創建一個數據框來寫入 Excel 工作表。

dict = { "name": "xyz",
         "desciption":"abc",
         "paths": ["a","b","c"]
       }
df = pd.DataFrame(dict)

………………………………………………………………………………………………………………………………………………………… ………………

我必須創建一個數據框並將其寫入excel。 我的excel應該以以下格式顯示數據:

name  description  paths
xyz   abc           a
                    b
                    c

但我實際得到的是:

name  description  paths
xyz   abc           a
xyz   abc           b
xyz   abc           c

您可以找到列namedesciption的重復項並將它們desciption空字符串:

# keep only the first one, mark others as duplicates
dups = df.duplicated(["name", "desciption"], keep="first")

# put empty string to those places
df.loc[dups, ["name", "desciption"]] = ""

這使

>>> df

  name desciption paths
0  xyz        abc     a
1                     b
2                     c

您可以將此幀寫入文件。

解決方案可能如下:

import pandas as pd

paths = ["a", "b", "c"]

d = {"name": ["xyz"] + [''] * (len(paths) - 1),
     "desciption": ["abc"] + [''] * (len(paths) - 1),
     "paths": paths
     }
df = pd.DataFrame(d)

print(df)

  name desciption paths
0  xyz        abc     a
1                     b
2                     c

您可以通過df.to_excel(index=False)擺脫索引號。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM