[英]How to find Levenshtein distance between 1 million article titles, where every title is compared to every other title?
我有一個很大的 pandas DataFrame,由 100 萬行組成,我想獲取 DataFrame 的一列中每個實體之間的 Levenshtein 距離。我嘗試將該列與其自身合並以生成笛卡爾積,然后將 Levenshtein 距離 function 應用於這個新列,但這在計算上太昂貴了,因為它需 ...