繁体   English   中英

pandas append 列从 dataframe 到 python 中的列表

[英]pandas append column from dataframe to a list in python

我有一个 dataframe 如下

ID 文本
1个 啊啊啊
2个 bbbb

我将上面的内容读到 dataframe,我需要将文本列转换为列表以执行 NER 提取

tags = []
for i in df['text'].tolis(():
  tdoc = nlp(i)
  for tags in tdoc.ents:
   tags.append((df.id,tags.text,tags.label_))

以上工作,我得到了我想导出到 dataframe 的 NER 标签以及来自 dataframe 的“id”列

df_tag = pd.DataFrame_from_records(tags, columns = ['id', 'name', 'type'])

这里的问题是我的 id 列重复如下

ID 姓名 类型
1 2 内尔A A型
1 2 内尔乙 B型

所需 output

ID 姓名 类型
1个 内尔A A型
2个 内尔乙 B型

问题来自df.id返回一个系列,您从中重复附加索引,而不是值。

另外,第 4 行和第 5 行,它应该是tag ,而不是tags

试试这样:

tags = []
for i in df['text'].tolist():
    tdoc = nlp(i)
    for tag in tdoc.ents:
        tags.append((df.id.values,tag.text,tag.label_))

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM