繁体 English 中英

如何在 python 中使用正则表达式提取这句话？

[英]How to extract this sentence using regex in python?

原文 2020-07-16 02:04:29 6 1 python/ regex/ nlp

我正在尝试从研究文章中提取引用的句子。 我已经设法提取除一个之外的所有句子。

“相关性（对于正在经历学习过程的个人）在 Hidi 和 Renninger 的 model (2006) 中作为触发器出现，并且可以是 Priniski 等人的连续体中的任何相关类型。”

(r'\w.+\(\d{4}\)+\.*', regex = True)是我使用的模式。 我想知道是否要处理括号内的单词。

文章中的示例段落：

n \n\n关于成人教育的工作相关性：案例研究叙述 \n\nTone Vold1,2、Hanne Haave2 和 Aristidis Kaloudis1 \n1NTNU，挪威 \n2INN，挪威 \nTone.vold@ntnu.no \nTone.vold@inn .no \nHanne.haave@inn.no \nAristidis.kaloudis@ntnu.no \nDOI: 10.34190/EJKM.18.02.002 \n \n摘要：人们越来越关注高等教育的相关性。 主要是关于增加个人的工作机会或工作\进步。 然而，高等教育的相关性也可能与解决工作场所的重要问题或问题有关。 关于教育活动如何变得相关，有一些必要的先决条件。 \n首先，学生必须能够发现通用知识和获得的技能如何适用于工作中的具体\n情况。 这需要经验、对组织规范和文化的理解以及一定形式的实践智慧。

我已经拆分并标记了句子，然后将其转换为 dataframe，我尝试使用以下代码匹配并提取带有引用的整个句子

print (df[df['sentences'].str.contains((r'\w.+(\d{4})+.*', regex = True)]) 是我用来提取所有行的代码/引用 dataframe (df) 的句子

我设法编写了与 dataframe 行中的整个句子匹配的不同正则表达式模式。 与我的问题句子匹配的正则表达式模式将帮助我。

1 个解决方案

您的正则表达式将在括号内有 4 位数字的任何序列之后停止，在本例中为“（2006）”，重复 1 次或更多次，然后可能的句点 0 次或更多次。

因此，您需要一个模式来获取括号后字符的 rest，然后是结束句子的句点的模式，而不是捕获例如“。” 在“等人的”中。

我推荐https://regex101.com/来测试正则表达式。

使用python提取一个句子

[英]extract a sentence using python

如何在 python 中使用正则表达式从段落中提取连字符或星号之间的句子

[英]How to extract a sentence between hyphen or asterisk from a paragraph using regex in python

如何使用正则表达式根据起始关键字提取单句和双句

[英]How to extract single and double sentence based on starting keyword using regex

根据 python 中的正则表达式条件提取句子

[英]Extract sentence based on regex conditions in python

如何使用简单的for循环从python中的字符串中提取一个句子？

[英]how to extract a sentence from string in python using simple for loop?

如何在python中使用正则表达式检测句子中的给定单词

[英]How to detect a given word in sentence using regex in python

如何在 python 中使用正则表达式匹配带有多个点的句子？

[英]How to match a sentence with multiple dots using regex in python?

如何使用 python 中的正则表达式匹配一句话中的模式？

[英]How to match patterns in one sentence using regex in python?

使用正则表达式提取句子的名称

[英]Extract names of a sentence with regex

如何在Python中使用NLP、RegEx查找句子中的日期

[英]How to find dates in the sentence using NLP, RegEx in Python

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 使用python提取一个句子如何在 python 中使用正则表达式从段落中提取连字符或星号之间的句子如何使用正则表达式根据起始关键字提取单句和双句根据 python 中的正则表达式条件提取句子如何使用简单的for循环从python中的字符串中提取一个句子？如何在python中使用正则表达式检测句子中的给定单词如何在 python 中使用正则表达式匹配带有多个点的句子？如何使用 python 中的正则表达式匹配一句话中的模式？使用正则表达式提取句子的名称如何在Python中使用NLP、RegEx查找句子中的日期

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM