繁体   English   中英

使用 Python 对数据进行分类

[英]Categorization of Data using Python

我有一组要在列中查找的关键字,并根据这些关键字对字段进行分类。 假设一个单元格的值为“会计师”、“审计员”、“银行”、“收银员”等,我想添加一个新的列类别并将这些字段反映为“财务工作”。 在此处输入图像描述

我知道如何在 excel 中执行此操作,但该文件大约为 80mbs,而且速度太慢。 我正在考虑使用 Python,但在这方面的经验非常少。

样本数据

我正在考虑使用字典,但不知道要查找什么以及如何查找,从而获得相同的结果。

谁能帮我解决这个问题?

编辑:我有 150 多个关键字和大约 30 个类别。

import numpy as np
import pandas as pd

df['new_column'] = np.where(df['keywords'].isin(["Accountant", "auditor", "bank", "cashier"], "Finance Jobs", 'Other Jobs')

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM