[英]Adding column to pandas dataframe using group name in function when iterating through groupby
[英]Basic question - iterating through pandas dataframe column using a function
我正在努力學習基礎知識。 我在pandas數據框中只有一列名稱,我想使用fuzzywuzzy庫中的3-4個函數來比較字符串的潛在重復項。 所以我想檢查列內容的其余部分的名字,然后是第二名,依此類推。 列將有數百個甚至數千個名稱。 我想創建一個包含名稱組合的 df,其中至少一個值大於 80。
我需要從那個 df 創建一個列表嗎? 抱歉,我知道這是非常基本的,我似乎無法自己找到解決方案。
所以最后我找到了一種不同的方法來解決我的問題。 我沒有使用 80k vs 80k 列表,而是使用了一個名為 itertools.combinations 的函數,它為您提供了在這種情況下完美的獨特組合。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.