簡體   English   中英

基本問題 - 使用函數遍歷 Pandas 數據框列

[英]Basic question - iterating through pandas dataframe column using a function

我正在努力學習基礎知識。 我在pandas數據框中只有一列名稱,我想使用fuzzywuzzy庫中的3-4個函數來比較字符串的潛在重復項。 所以我想檢查列內容的其余部分的名字,然后是第二名,依此類推。 列將有數百個甚至數千個名稱。 我想創建一個包含名稱組合的 df,其中至少一個值大於 80。

我需要從那個 df 創建一個列表嗎? 抱歉,我知道這是非常基本的,我似乎無法自己找到解決方案。

所以最后我找到了一種不同的方法來解決我的問題。 我沒有使用 80k vs 80k 列表,而是使用了一個名為 itertools.combinations 的函數,它為您提供了在這種情況下完美的獨特組合。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM