繁体   English   中英

如何在Pandas列中拆分逗号分隔的单词列表?

[英]How can I split a list of comma separated words in a Pandas column?

我正在查询Stackoverflow以获取一些数据( https://data.stackexchange.com/stackoverflow/query/new ),并且我有一个带有标签作为列的数据框。 标签最初是以下形式

<html><css>

我设法以

html,css

我认为Jupyter笔记本的图像可以最好地显示它: Jupyter笔记本行

如何分隔标签,以便它们可以成为分类变量,并可以使用类似get_dummies的方法来对其进行转换? 我所看到的所有内容都是指实际列表,例如[html,css],而不仅仅是逗号分隔的单词。

为此,我们可以使用df['Tags'].str.get_dummies(',') ,该方法基本上执行split并将每个元素转换为自己的一键编码列。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM