如何在python中使用正则表达式来提取触摸逗号的文本?

例如

Str= "Select Name,Email,Contact (Select Subject,ActivityDate,Description from Opportunity) from Opportunity"

Desired_List = ['Name','Email','Contact','Subject','ActivityDate','Description']

这是另一个要测试的字符串:

Str = "Select Invoice_Number__c,ID,Name,Owner.Name,Amount,Billing_Email__c,Payment_Terms__c,Invoice_Schedule__c,Opt_Out_Date__c,CloseDate,Contract_Start_Date__c,Contract_End_Date__c,(Select Subject,ActivityDate,           Description from ActivityHistories ORDER By ActivityDate DESC NULLS LAST)from Opportunity where StageName = 'Closed Won' ANDType != 'Upsell' ANDInvoice_Number__c != '' LIMIT 2"

请注意,逗号和说明之间有很大的空间。

===============>>#1 票数:6 已采纳

使用正向先行和向后搜索来匹配在逗号两侧的单词。

import re

Str= "Select Name,Email,Contact (Select Subject,ActivityDate,Description from Opportunity) from Opportunity"

matches = re.findall(r"\w+(?=,)|(?<=,)\w+", Str)
print matches

输出:

['Name', 'Email', 'Contact', 'Subject', 'ActivityDate', 'Description']

这些都记录在这里

更新:使用OP的新字符串:

['Invoice_Number__c', 'ID', 'Name', 'Owner', 'Name', 'Amount', 'Billing_Email__c', 'Payment_Terms__c', 'Invoice_Schedule__c', 'Opt_Out_Date__c', 'CloseDate', 'Contract_Start_Date__c', 'Contract_End_Date__c', 'Subject', 'ActivityDate', 'Description']

  ask by Chris translate from so

未解决问题?本站智能推荐:

3回复

使用正则表达式提取带点和逗号的数字

我读过很多页面,试图向我解释如何将regex用于Python,但我还是regex 。 甚至regex Wiki和re文档都根本无法帮助我。 我还是有点困惑:P 我有以下字符串: 我正在尝试使用以下命令仅提取2.608,24和163,66 : 但是,我的print st_
1回复

使用正则表达式的单词边界-无法提取所有单词

我需要提取Male-Cat : 我需要提取树倍Male-Cat : 可以通过第一种方法正确解析的另一个字符串: 缺少什么? 您能解释什么是错误的,什么是正确的方法吗?
1回复

如何在python中使用正则表达式从字符串中提取特定单词

我有两个包含单词及其类型的字符串: 我喜欢将带有/NN标签的任何单词形式的单词提取到带有/NNP和/CDP标签的单词中。 到目前为止,这是我的代码(仍然仅适用于/NNP标签): 到目前为止的代码结果: 如我们所见,对于第一个字符串( text1 ), entityExt
3回复

在Python中使用正则表达式从字符串中提取具有特定字符的单词列表

我有一个包含单词的字符串,每个单词都有其自己的标记(例如NN / NNP / JJ等)。 我想使用包含NNP令牌的特定重复单词 。 到目前为止,我的代码: 代码的结果: 我们看到,包含NNP的单词有3个,分别是Rapunzel / NNP Sheila / NNP(彼此相邻出
1回复

使用正则表达式从字符串中提取多个单词

我正在尝试从一份文件的一部分中提取所有参考文献作为列表。 现在,我只有一个段落并将其设置为字符串。 我想知道是否有可能在python上使用正则表达式来做到这一点? 我希望能够从字符串中提取多个单词,但是到目前为止,我所能做的只是提取年份,单个单词或字符,而不是一次提取整个引用。 确实
2回复

使用python正则表达式进行单词标记化

我试图在python中将字符串拆分为“标签”列表。 拆分应该处理诸如“HappyBirthday”之类的字符串并删除大多数标点符号但保留连字符和撇号。 我的出发点是: 我想转换这个示例数据: 成: PS我很抱歉我的描述不是很好。 我不确定如何解释它,并且大多数谷歌都
3回复

使用正则表达式提取字符串位置Python

我正在尝试使用正则表达式提取子字符串的位置(索引)。 我需要使用正则表达式,因为字符串不会完全相同。 我想获取子字符串的位置(开始位置或结束位置),因此我可以在该子字符串后面取1,000个字符。 例如,如果我有“虽然外汇交易频繁,但大多数人却赚很少的钱”。 我想找到“外国货币”的头寸
2回复

用于单词和单个空格的Python正则表达式

我正在使用re.sub,以便通过正则表达式将“坏”字符串强制转换为“有效”字符串。 我正在努力创建正确的正则表达式,它将解析一个字符串并“删除坏的部分”。 具体来说,我想强制字符串全部按字母顺序排列,并允许单词之间的单个空格。 任何不同意这条规则的价值我想用''代替。 这包括多个空格。
1回复

Python:使用正则表达式从字符串中提取数字

我有一个字符串,试图找到所有数字,例如1,-1.5,.5等。我已经找到了这个问题,并且给出了非常有用的答案。 我唯一的问题是所有这些解决方案似乎都“太多”了。 例如,“ MH17”中的匹配“ 17”。 如何扩展任何建议的解决方案,使数字不能以字母开头(或包含字母)?
4回复

Python正则表达式字符串提取

我正在尝试使用正则表达式从此字符串中提取两个字符串- 我想要src之后的URL和alt之后的文本(所以有机化学I(作为第二语言)和url) 我已经尝试过(' src=(\\w+)" width') , (' src="(\\w+)"')和('src="(