簡體   English   中英

文本挖掘-挖掘描述性Excel工作表數據的最佳方法是什么

[英]Text Mining - What is the best way to mine descriptive excel sheet data

我有從Excel工作表中的數據庫中提取的大學排名數據。 我需要發短信說明公司提供的職位描述,該職位描述是所有行的描述性字段,然后提出需求概況的分析。 這是數據的快照 在此處輸入圖片說明

有人可以幫我開始這項活動嗎?

謝謝索拉卜

我不是數據專家,但是我有一些數據挖掘經驗。 對於初學者,我將嘗試按照以下步驟操作:

  1. Excel不適用於此類分析。 找到一些專門用於數據挖掘的工具,例如RStudio。 R具有許多有用的開箱即用的數據挖掘算法。

  2. 清理數據,例如將所有文本都轉換為小寫字母,刪除停用詞,刪除標點符號,刪除其他空格。

  3. 標記數據,例如1個單詞的標記-“財務”,“單身漢”

  4. 確定如何確定是否需要特定配置文件? 如果通過概要文件表示您需要更多有關出現在數據中的某些令牌的頻率的信息,則需要其他令牌(例如“財務”,“單身漢”等),然后只需創建一個頻率矩陣。 R允許您創建可視化內容-詞雲。

這是開始您的:)。 我相信在這件事上還有很多建議。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM