[英]pandas append column from dataframe to a list in python
我有一个 dataframe 如下
ID | 文本 |
---|---|
1个 | 啊啊啊 |
2个 | bbbb |
我将上面的内容读到 dataframe,我需要将文本列转换为列表以执行 NER 提取
tags = []
for i in df['text'].tolis(():
tdoc = nlp(i)
for tags in tdoc.ents:
tags.append((df.id,tags.text,tags.label_))
以上工作,我得到了我想导出到 dataframe 的 NER 标签以及来自 dataframe 的“id”列
df_tag = pd.DataFrame_from_records(tags, columns = ['id', 'name', 'type'])
这里的问题是我的 id 列重复如下
ID | 姓名 | 类型 |
---|---|---|
1 2 | 内尔A | A型 |
1 2 | 内尔乙 | B型 |
所需 output
ID | 姓名 | 类型 |
---|---|---|
1个 | 内尔A | A型 |
2个 | 内尔乙 | B型 |
问题来自df.id
返回一个系列,您从中重复附加索引,而不是值。
另外,第 4 行和第 5 行,它应该是tag
,而不是tags
。
试试这样:
tags = []
for i in df['text'].tolist():
tdoc = nlp(i)
for tag in tdoc.ents:
tags.append((df.id.values,tag.text,tag.label_))
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.