簡體   English   中英

使用 Python 對數據進行分類

[英]Categorization of Data using Python

我有一組要在列中查找的關鍵字,並根據這些關鍵字對字段進行分類。 假設一個單元格的值為“會計師”、“審計員”、“銀行”、“收銀員”等,我想添加一個新的列類別並將這些字段反映為“財務工作”。 在此處輸入圖像描述

我知道如何在 excel 中執行此操作,但該文件大約為 80mbs,而且速度太慢。 我正在考慮使用 Python,但在這方面的經驗非常少。

樣本數據

我正在考慮使用字典,但不知道要查找什么以及如何查找,從而獲得相同的結果。

誰能幫我解決這個問題?

編輯:我有 150 多個關鍵字和大約 30 個類別。

import numpy as np
import pandas as pd

df['new_column'] = np.where(df['keywords'].isin(["Accountant", "auditor", "bank", "cashier"], "Finance Jobs", 'Other Jobs')

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM