簡體   English   中英

ValueError:數組的長度必須相同 - 將數據幀打印到 CSV

[英]ValueError: arrays must all be same length - print dataframe to CSV

感謝您的光臨! 我希望在使用 Pandas 數據框創建 csv 時得到一些幫助。 這是我的代碼:

 a = ldamallet[bow_corpus_new[:21]] b = data_text_new print(a) print("/n") print(b) d = {'Preprocessed Document': b['Preprocessed Document'].tolist(), 'topic_0': a[0][1], 'topic_1': a[1][1], 'topic_2': a[2][1], 'topic_3': a[3][1], 'topic_4': a[4][1], 'topic_5': a[5][1], 'topic_6': a[6][1], 'topic_7': a[7][1], 'topic_8': a[8][1], 'topic_9': a[9][1], 'topic_10': a[10][1], 'topic_11': a[11][1], 'topic_12': a[12][1], 'topic_13': a[13][1], 'topic_14': a[14][1], 'topic_15': a[15][1], 'topic_16': a[16][1], 'topic_17': a[17][1], 'topic_18': a[18][1], 'topic_19': a[19][1]} print(d) df = pd.DataFrame(data=d) df.to_csv("test.csv", index=False)

數據:

打印(a):格式是元組

[[(主題編號: 0, 主題百分比),...(19, #)], [(下一行的主題分布, #)...(19, .819438),...(#,#) ,...]

打印(一)

打印(b)

打印(b)

這是我的錯誤: 錯誤

這是數據框的大小:

b的大小

的形狀

的形狀

這是我希望它的樣子: 夢想

任何幫助將不勝感激 :)

為它自己的列表中的所有行獲取每個元組的第二個值可能是最簡單的。 像這樣的東西

topic_0=[]
topic_1=[]
topic_2=[]
...and so on
for i in a:
    topic_0.append(i[0][1])
    topic_1.append(i[1][1])
    topic_2.append(i[2][1])
    ...and so on

然后你可以像這樣制作你的字典

d = {'Preprocessed Document': b['Preprocessed Document'].tolist(), 
     'topic_0': topic_0, 
     'topic_1': topic_1, 
      etc. }

我接受了@mattcremeens 的建議並且它奏效了。 我已經在下面發布了完整的代碼。 他關於 nixing 元組是正確的,我之前的代碼沒有遍歷行,而是只打印第一行。

 topic_0=[] topic_1=[] topic_2=[] topic_3=[] topic_4=[] topic_5=[] topic_6=[] topic_7=[] topic_8=[] topic_9=[] topic_10=[] topic_11=[] topic_12=[] topic_13=[] topic_14=[] topic_15=[] topic_16=[] topic_17=[] topic_18=[] topic_19=[] for i in a: topic_0.append(i[0][1]) topic_1.append(i[1][1]) topic_2.append(i[2][1]) topic_3.append(i[3][1]) topic_4.append(i[4][1]) topic_5.append(i[5][1]) topic_6.append(i[6][1]) topic_7.append(i[7][1]) topic_8.append(i[8][1]) topic_9.append(i[9][1]) topic_10.append(i[10][1]) topic_11.append(i[11][1]) topic_12.append(i[12][1]) topic_13.append(i[13][1]) topic_14.append(i[14][1]) topic_15.append(i[15][1]) topic_16.append(i[16][1]) topic_17.append(i[17][1]) topic_18.append(i[18][1]) topic_19.append(i[19][1]) d = {'Preprocessed Document': b['Preprocessed Document'].tolist(), 'topic_0': topic_0, 'topic_1': topic_1, 'topic_2': topic_2, 'topic_3': topic_3, 'topic_4': topic_4, 'topic_5': topic_5, 'topic_6': topic_6, 'topic_7': topic_7, 'topic_8': topic_8, 'topic_9': topic_9, 'topic_10': topic_10, 'topic_11': topic_11, 'topic_12': topic_12, 'topic_13': topic_13, 'topic_14': topic_14, 'topic_15': topic_15, 'topic_16': topic_16, 'topic_17': topic_17, 'topic_18': topic_18, 'topic_19': topic_19} df = pd.DataFrame(data=d) df.to_csv("test.csv", index=False, mode = 'a')

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM