[英]pandas append column from dataframe to a list in python
我有一個 dataframe 如下
ID | 文本 |
---|---|
1個 | 啊啊啊 |
2個 | bbbb |
我將上面的內容讀到 dataframe,我需要將文本列轉換為列表以執行 NER 提取
tags = []
for i in df['text'].tolis(():
tdoc = nlp(i)
for tags in tdoc.ents:
tags.append((df.id,tags.text,tags.label_))
以上工作,我得到了我想導出到 dataframe 的 NER 標簽以及來自 dataframe 的“id”列
df_tag = pd.DataFrame_from_records(tags, columns = ['id', 'name', 'type'])
這里的問題是我的 id 列重復如下
ID | 姓名 | 類型 |
---|---|---|
1 2 | 內爾A | A型 |
1 2 | 內爾乙 | B型 |
所需 output
ID | 姓名 | 類型 |
---|---|---|
1個 | 內爾A | A型 |
2個 | 內爾乙 | B型 |
問題來自df.id
返回一個系列,您從中重復附加索引,而不是值。
另外,第 4 行和第 5 行,它應該是tag
,而不是tags
。
試試這樣:
tags = []
for i in df['text'].tolist():
tdoc = nlp(i)
for tag in tdoc.ents:
tags.append((df.id.values,tag.text,tag.label_))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.