ValueError：數組的長度必須相同 - 將數據幀打印到 CSV

Question

感謝您的光臨！ 我希望在使用 Pandas 數據框創建 csv 時得到一些幫助。 這是我的代碼：

 a = ldamallet[bow_corpus_new[:21]] b = data_text_new print(a) print("/n") print(b) d = {'Preprocessed Document': b['Preprocessed Document'].tolist(), 'topic_0': a[0][1], 'topic_1': a[1][1], 'topic_2': a[2][1], 'topic_3': a[3][1], 'topic_4': a[4][1], 'topic_5': a[5][1], 'topic_6': a[6][1], 'topic_7': a[7][1], 'topic_8': a[8][1], 'topic_9': a[9][1], 'topic_10': a[10][1], 'topic_11': a[11][1], 'topic_12': a[12][1], 'topic_13': a[13][1], 'topic_14': a[14][1], 'topic_15': a[15][1], 'topic_16': a[16][1], 'topic_17': a[17][1], 'topic_18': a[18][1], 'topic_19': a[19][1]} print(d) df = pd.DataFrame(data=d) df.to_csv("test.csv", index=False)

數據：

打印（a）：格式是元組

[[(主題編號: 0, 主題百分比),...(19, #)], [(下一行的主題分布, #)...(19, .819438),...(#,#) ,...]

打印(b)

這是我的錯誤：

這是數據框的大小：

這是我希望它的樣子：

任何幫助將不勝感激：）

Answer 1

為它自己的列表中的所有行獲取每個元組的第二個值可能是最簡單的。 像這樣的東西

topic_0=[]
topic_1=[]
topic_2=[]
...and so on
for i in a:
    topic_0.append(i[0][1])
    topic_1.append(i[1][1])
    topic_2.append(i[2][1])
    ...and so on

然后你可以像這樣制作你的字典

d = {'Preprocessed Document': b['Preprocessed Document'].tolist(), 
     'topic_0': topic_0, 
     'topic_1': topic_1, 
      etc. }

Answer 2

我接受了@mattcremeens 的建議並且它奏效了。 我已經在下面發布了完整的代碼。 他關於 nixing 元組是正確的，我之前的代碼沒有遍歷行，而是只打印第一行。

 topic_0=[] topic_1=[] topic_2=[] topic_3=[] topic_4=[] topic_5=[] topic_6=[] topic_7=[] topic_8=[] topic_9=[] topic_10=[] topic_11=[] topic_12=[] topic_13=[] topic_14=[] topic_15=[] topic_16=[] topic_17=[] topic_18=[] topic_19=[] for i in a: topic_0.append(i[0][1]) topic_1.append(i[1][1]) topic_2.append(i[2][1]) topic_3.append(i[3][1]) topic_4.append(i[4][1]) topic_5.append(i[5][1]) topic_6.append(i[6][1]) topic_7.append(i[7][1]) topic_8.append(i[8][1]) topic_9.append(i[9][1]) topic_10.append(i[10][1]) topic_11.append(i[11][1]) topic_12.append(i[12][1]) topic_13.append(i[13][1]) topic_14.append(i[14][1]) topic_15.append(i[15][1]) topic_16.append(i[16][1]) topic_17.append(i[17][1]) topic_18.append(i[18][1]) topic_19.append(i[19][1]) d = {'Preprocessed Document': b['Preprocessed Document'].tolist(), 'topic_0': topic_0, 'topic_1': topic_1, 'topic_2': topic_2, 'topic_3': topic_3, 'topic_4': topic_4, 'topic_5': topic_5, 'topic_6': topic_6, 'topic_7': topic_7, 'topic_8': topic_8, 'topic_9': topic_9, 'topic_10': topic_10, 'topic_11': topic_11, 'topic_12': topic_12, 'topic_13': topic_13, 'topic_14': topic_14, 'topic_15': topic_15, 'topic_16': topic_16, 'topic_17': topic_17, 'topic_18': topic_18, 'topic_19': topic_19} df = pd.DataFrame(data=d) df.to_csv("test.csv", index=False, mode = 'a')

ValueError：數組的長度必須相同 - 將數據幀打印到 CSV

問題描述

2 個解決方案

解決方案1
1 已采納 2019-04-11 20:52:06

解決方案2
0 2019-04-11 21:20:13

ValueError：數組的長度必須相同 - 將數據幀打印到 CSV

問題描述

2 個解決方案

解決方案1 1 已采納 2019-04-11 20:52:06

解決方案2 0 2019-04-11 21:20:13

解決方案1
1 已采納 2019-04-11 20:52:06

解決方案2
0 2019-04-11 21:20:13