繁体 English 中英

有什么方法可以更快地运行循环吗？

[英]Is there any way to run loop faster?

原文 2019-11-11 08:28:36 1 1 python/ string/ matching/ fuzzywuzzy

我正在解决一些字符串匹配问题并使用fuzzywuzzy 模块来获得分数。

我的目标数据约为 67K，参考数据几乎为 4M，我创建了循环，一次迭代大约需要 +- 19 分钟。 有什么办法可以让我的循环运行得更快？

%%timeit
df11['NEW'] = ""
for i in range(0, 4):
    df11['NEW'] = process.extractOne(df11['Desc 1'][i], df['Description 2'])

df11.head()

1 个解决方案

假设：

目标/ choice字符串都比较长（例如 >20 个字符）并且它们不是都非常相似（例如只有一两个字符不同）
查询和“最佳”目标之间的编辑距离相对较小（例如修改的字符<10%）

那么我可能会使用三元组来索引字符串，然后忽略查询中没有足够三元组的目标行

我一直在玩“20 个新闻组数据集” ，它需要我的笔记本电脑：

使用这些行作为选择/目标运行 45 秒fuzzywuzzy.extractOne
0.3 秒使用三元组找到最近的字符串

这是服用后：

6 秒从 18828 封电子邮件中加载 477948 行文本
15 秒将台词变成包含 317324 个三元组的字典

我的代码很老套，但我可以整理一下，可能会将所有 67k 查询字符串的总运行时间减少到一天左右，如果您与multiprocessing并行执行此操作，可能只需几个小时

Python - 在数据框中运行 for 循环的更快方法

[英]Python - faster way to run a for loop in a dataframe

有没有更快的方法将组件添加到列表中？也许是一个循环？

[英]Is there any faster way to add the component in list? Maybe a loop?

有什么方法可以比for循环更快地迭代数组吗？

[英]Is there any way I can iterate through an array faster than a for loop?

为非常大的 dataframe 列表运行 for 循环的更快方法

[英]faster way to run a for loop for a very large dataframe list

递归公式在循环中很慢，有没有办法让这段代码运行得更快？

[英]Recursive formula is slow with a loop, is there a way to make this code run faster?

是否有一种 Pythonic 的方式来跳过 for 循环中的 if 语句以使我的代码运行得更快？

[英]Is there a Pythonic way of skipping if statements in a for loop to make my code run faster?

有没有更快的方法来做这个循环？

[英]Is there a faster way to do this loop?

有什么方法可以使此代码更快？

[英]Is there any way to make this code faster?

有什么办法可以让这个功能更快

[英]Is there any way to make this function faster

有没有更快的方法循环遍历此代码？

[英]Is there a faster way to loop through this code?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Python - 在数据框中运行 for 循环的更快方法有没有更快的方法将组件添加到列表中？也许是一个循环？有什么方法可以比for循环更快地迭代数组吗？为非常大的 dataframe 列表运行 for 循环的更快方法递归公式在循环中很慢，有没有办法让这段代码运行得更快？是否有一种 Pythonic 的方式来跳过 for 循环中的 if 语句以使我的代码运行得更快？有没有更快的方法来做这个循环？有什么方法可以使此代码更快？有什么办法可以让这个功能更快有没有更快的方法循环遍历此代码？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM