簡體   English   中英

在Pandas數據框中的多行中添加不同的類別

[英]Adding different categories to multiple rows in pandas dataframe

我有三個有數百行的文檔。 我想將它們添加到具有不同名稱類別的數據框中。 我正在嘗試以下代碼。 但是,盡管我能夠合並數據框中的文檔,但無法將唯一名稱歸於類別。

with open('fdi.txt') as g:
    fdi = g.read()
with open('gdp.txt') as g:
    gdp= g.read()
with open('gni.txt') as g:
    gni= g.read()    
df = pd.DataFrame({'text': fdi + gdp + gni, 
                      'categories': ['India', 'Israel', 'Fiji']}, index=[0])

謝謝。

如果不查看fdi,gdp和gni包含的示例數據以及所需輸出的樣例,很難回答您的問題。 但是,正如您在紡織品中提到的“行”一樣,您有三個類別,我假設您希望每個類別都屬於每個文件內容。

因此,假設文本文件包含數據行,我們可以在換行符\\n上拆分它們,然后根據相關文件包含的行數來加長類別列表。 EG ['India']*len(fdi.split('\\n'))

如果上述假設正確,則應該可以使用以下代碼:

df = pd.DataFrame({'text': fdi.split('\n')+gdp.split('\n')+gni.split('\n'),
          'Categories':['India']*len(fdi.split('\n'))+
         ['Israel']*len(gdp.split('\n'))+
         ['Fiji']*len(gni.split('\n'))})

如果這不是您想要的,請添加一些文本文件的示例內容和所需的輸出。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM