[英]How do I divide a dataframe based on the content in the rows of a column?
我正在尝试从一个中获取两个数据框。 dataframe 有两组词(中性和非中性),所以我需要将它划分为一个只有中性词的数据集和另一个只有非中性词(维护所有行和列)的数据集。 这些词在一个名为 PALABRA 的列中。
这是变量中单词的示例(它们远不止这些):
neutral_words = ('CAR','CLOUD','SUN')
nonneutral_words = ('ACCIDENT','BUG','BURN')
df 看起来像这样:
PRESSEDKEY PALABRA COLOR KEYCORR RT CORRECT
90 v BURN red r 496 N
96 v SUN red r 1307 N
102 v BUG red r 0 N
108 v CLOUD blue a 168 N
114 v ACCIDENT green v 73 Y
这样,我需要将 df1 中的 dataframe 与中性字分开,将 df2 与非中性字分开。 我怎样才能做到这一点?
您可以使用isin
:
df1 = df.loc[df['PALABRA'].isin(neutral_words)]
df2 = df.loc[df['PALABRA'].isin(nonneutral_words)]
我想你会想要使用isin
function。
就像是:
df1=df[df.Palabra.isin(['ACCIDENT','BUG','BURN'])])
或者
df1=df[df.Palabra.isin(nonneutral_words)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.