繁体   English   中英

如何根据垃圾邮件或非垃圾邮件来区分我的文本?

[英]How can I separate my texts based on spam or not spam?

我还是 Python/Jupyter 的新手。 我有一个 excel 文件,我已将其导入到 Python 中,其中有 2 列 - 一个是二进制 1/0(1 表示垃圾邮件,0 表示非垃圾邮件),第二个是文本消息。 我正在尝试创建 2 个词云,一个用于垃圾邮件,一个用于非垃圾邮件。 如何将我的文本分为垃圾邮件和非垃圾邮件? 为清楚起见,我的电子表格的屏幕截图

按二进制值排序,升序(0 在前)或降序(1 在前)。

完成后保存 excel 文件,然后像往常一样导入。

假设您的 csv 文件名为 test.csv,其中包含两个名为“文本”和“标签”的列

df = pd.read_csv("test.csv")

df_spam = df[df.label == 1]
df_no_spam = df[df.label == 0]

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM