簡體 English 中英

在pandas數據框列中查找子字符串列表的所有變體

[英]Finding all variations of a list of substrings in a pandas dataframe column

原文 2019-07-09 03:24:03 6 1 python/ string/ pandas/ list

我有一個電影名稱字符串列表，我想在pandas數據movie_name列description進行搜索，如果在用戶輸入的描述中找到了新列movie_name則可以創建一個新列。

現在，由於描述不是標准化的，我如何搜索特定名稱的所有可能變體。 例如。 電影名稱之一是HARRY POTTER 4 。 現在，我需要搜索所有可能的輸入，例如HARRYPOTTER 4 ， HARRY POTTER4 ， HARRYPOTTER4等。在某些情況下，用戶可能沒有在4之后留空格並鍵入其他內容。 HARRY POTTER 4is a good movie 。

我需要從描述中提取列表中給定的電影名稱，並添加一個僅movie_name的新列。 除了使用.contains和.extract在列表中添加所有可能的變體，然后再使用.map或.replace將所有這些變體映射到1個最終電影名稱之外，還有其他方法嗎？

1 個解決方案

我建議您看一下FuzzyWuzzy庫。

這是一篇易於理解的文章： https : //www.geeksforgeeks.org/fuzzywuzzy-python-library/

按列的子字符串對Pandas Dataframe進行排序

[英]Sort Pandas Dataframe by substrings of a column

過濾器 dataframe：某個列包含某個列表的所有子字符串

[英]Filter dataframe: certain column contains ALL substrings of a certain list

具有列依賴關系的 Pandas DataFrame 的創建變體

[英]Creation Variations of Pandas DataFrame with Column Dependencies

Pandas DataFrame 從列中獲取子字符串

[英]Pandas DataFrame get substrings from column

刪除pandas dataframe列中的多個子字符串

[英]Removing multiple substrings in a pandas dataframe column

有沒有辦法替換熊貓數據框中的所有子字符串？

[英]Is there a way to replace all substrings in a pandas dataframe?

根據子串列表過濾 Pandas Dataframe

[英]Filter Pandas Dataframe based on List of substrings

列出熊貓數據框列中的所有單詞

[英]Make a list of all words in pandas dataframe column

從pandas數據框列中查找所有正則表達式匹配項

[英]finding all regex matches from a pandas dataframe column

在 pandas dataframe 中查找列和索引

[英]Finding Column and Index in pandas dataframe

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 按列的子字符串對Pandas Dataframe進行排序過濾器 dataframe：某個列包含某個列表的所有子字符串具有列依賴關系的 Pandas DataFrame 的創建變體 Pandas DataFrame 從列中獲取子字符串刪除pandas dataframe列中的多個子字符串有沒有辦法替換熊貓數據框中的所有子字符串？根據子串列表過濾 Pandas Dataframe 列出熊貓數據框列中的所有單詞從pandas數據框列中查找所有正則表達式匹配項在 pandas dataframe 中查找列和索引

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM