繁体 English 中英

如何在Node / V8中实现正则表达式匹配？

[英]How is regular expression matching implemented in Node / V8?

原文 2015-12-13 09:05:00 6 1 regex/ node.js/ performance/ v8

我遇到过一篇文章，该文章显示正则表达式匹配通常使用可能性能不佳的算法与建议的Thompson NFA算法实现。

考虑到这一点，如何在Node或V8中实现？ 是否有可能使用Thompson NFA的JS实现来提高性能，可能只使用了有限的一部分功能（可能删除了前瞻或其他“高级”功能）？

1 个解决方案

正如Chrome开发团队在本公告中提到的，V8引擎使用Irregexp正则表达式引擎：

以下是有关此引擎实现的一些引用：

我们在设计Irregexp时做出的一个基本决定是，我们愿意花费额外的时间来编译正则表达式，如果这样可以更快地运行它。 在编译期间，Irregexp首先将正则表达式转换为中间自动机表示。 这在很多方面都是“自然”和最易于访问的表示，使得分析和优化正则表达式变得更加容易。 例如，当编译/ Sun | Mon /自动机表示时，我们可以认识到两个选项都有'n'作为第三个字符。 我们可以快速扫描输入，直到找到'n'，然后开始匹配前面两个字符的正则表达式。 Irregexp最多可以查找四个字符，一次最多匹配四个字符。

优化后，我们生成本机代码，使用回溯来尝试不同的替代方案。 回溯可能非常耗时，因此我们使用优化来尽可能多地避免回溯。 有一些技术可以完全避免回溯，但JavaScript中regexp的性质使得在我们的案例中很难应用它们，尽管这是我们将来可以实现的。

因此V8会编译为本机自动机表示 - 尽管它不使用Thompson NFA。

至于性能，本文将V8正则表达式性能与其他库/语言进行比较。

Pharo 中实现了什么样的正则表达式匹配？

[英]What kind of regular expression matching is implemented in Pharo?

Perl兼容的正则表达式引擎：如何实现？

[英]Perl compatible regular expression engines: how implemented?

如何匹配和提取字符串匹配正则表达式

[英]How to match and extract string matching regular expression

如何搜索与正则表达式不匹配的字符串

[英]How to search for strings not matching a regular expression

如何找到与正则表达式不匹配的所有内容

[英]How to find everything that is not matching a regular expression

如何处理一些匹配正则表达式的字符串？

[英]How to handle some strings matching a regular expression?

如何获取匹配格式的正则表达式？

[英]How to get the regular expression matching a format?

如何构建匹配十六进制数字的正则表达式？

[英]How to build a regular expression matching hexadecimal digits?

用于匹配XML标签和替换节点值的正则表达式

[英]Regular Expression for matching XML tags and replacing node values

表达正则表达式匹配

[英]Express regular expression matching

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Pharo 中实现了什么样的正则表达式匹配？ Perl兼容的正则表达式引擎：如何实现？如何匹配和提取字符串匹配正则表达式如何搜索与正则表达式不匹配的字符串如何找到与正则表达式不匹配的所有内容如何处理一些匹配正则表达式的字符串？如何获取匹配格式的正则表达式？如何构建匹配十六进制数字的正则表达式？用于匹配XML标签和替换节点值的正则表达式表达正则表达式匹配

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM