![](/img/trans.png)
[英]multiple items on different rows of pandas dataframe to coulmns
[英]Adding different categories to multiple rows in pandas dataframe
我有三個有數百行的文檔。 我想將它們添加到具有不同名稱類別的數據框中。 我正在嘗試以下代碼。 但是,盡管我能夠合並數據框中的文檔,但無法將唯一名稱歸於類別。
with open('fdi.txt') as g:
fdi = g.read()
with open('gdp.txt') as g:
gdp= g.read()
with open('gni.txt') as g:
gni= g.read()
df = pd.DataFrame({'text': fdi + gdp + gni,
'categories': ['India', 'Israel', 'Fiji']}, index=[0])
謝謝。
如果不查看fdi,gdp和gni包含的示例數據以及所需輸出的樣例,很難回答您的問題。 但是,正如您在紡織品中提到的“行”一樣,您有三個類別,我假設您希望每個類別都屬於每個文件內容。
因此,假設文本文件包含數據行,我們可以在換行符\\n
上拆分它們,然后根據相關文件包含的行數來加長類別列表。 EG ['India']*len(fdi.split('\\n'))
如果上述假設正確,則應該可以使用以下代碼:
df = pd.DataFrame({'text': fdi.split('\n')+gdp.split('\n')+gni.split('\n'),
'Categories':['India']*len(fdi.split('\n'))+
['Israel']*len(gdp.split('\n'))+
['Fiji']*len(gni.split('\n'))})
如果這不是您想要的,請添加一些文本文件的示例內容和所需的輸出。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.