簡體   English   中英

如何從多個分隔符值中將pandas中的csv文件讀取為兩列

[英]How to read csv file in pandas as two column from multiple delimiter values

我有一個像這樣的 csv 文件:

123, a, b, c, d
1433, b, c, d, e
2323, c, d, e, f
4543, d, e, f

我想將其讀入數據幀,但我希望第一個分隔符值作為一列,其余作為另一列

id         values
123        a, b, c, d
1433       b, c, d, e
2323       c, d, e, f
4543       d, e, f, NaN

我嘗試使用pandas read_csv,但在那里找不到諸如maxsplit之類的選項。 如果有人熟悉如何做到這一點,請幫助我。

我在 read_csv 函數中輸入了錯誤的分隔符,這會強制 Pandas 將數據讀入一列,然后我將列拆分為我想要的格式。 但是請注意,這並不能勝過 Datanovice 的解決方案,因為沒有引入 NaN:

data = '''123, a, b, c, d
          1433, b, c, d, e
          2323, c, d, e, f
          4543, d, e, f'''

df = pd.read_csv(StringIO(data),sep=';', header= None, names=['string'])
df.string.str.split(pat=',', n=1,expand=True)

    0         1
0   123     a, b, c, d
1   1433    b, c, d, e
2   2323    c, d, e, f
3   4543    d, e, f

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM