如何使用python将字符串拆分为带引号的句子和数字

Question

嗨，大家好，我是python新手，不胜感激！

我有多个这样的字符串：

21357.53 84898.10 Mckenzie Meadows Golf Course 80912.48 84102.38

而且我正在尝试找出如何根据一组单词（即"Mckenzie Meadows Golf Course" ）在双引号和双引号（不带引号）之间进行分界。

然后，我将字符串重新排列为以下格式：

"Mckenzie Meadows Golf Course" 21357.53 84898.10 80912.48 84102.38

重新排列我只会用

for row in data:
    outfile.write('{0} {1} {2} {3} {4}'.format(row[2], row[0], row[1], row[3], row[4]))
    outfile.write('\n')

但是我不确定如何将单引号的句子排除在外。 谢谢您的帮助！

Answer 1

您可以尝试以下方法：

s = "21357.53 84898.10 Mckenzie Meadows Golf Course 80912.48 84102.38"
sList = s.split(' ')
words = []
nums = []
for l in sList:
    if l.isalpha():
        words.append(l)
    elif l.isdigit():
        nums.append(l)

wordString = "\"%s\"" %  " ".join(words)
row = [wordString] + nums

此时， row包含所需的行。

Answer 2

这就是我这样做的方式：

import re

tgt='21357.53 84898.10 Mckenzie Meadows Golf Course 80912.48 84102.38'

nums=[m.group() for m in re.finditer(r'[\d\.]+',tgt)]
words=[m.group() for m in re.finditer(r'[a-zA-Z]+',tgt)]
print '"{}" {}'.format(' '.join(words),' '.join(nums))

印刷品：

"Mckenzie Meadows Golf Course" 21357.53 84898.10 80912.48 84102.38

另外，您可以测试Python认为是浮点数的东西来找到它们：

nums=[]
words=[]
for e in tgt.split():
    try:
        nums.append(float(e))
    except ValueError:
        words.append(e)

print words,nums

最后，如果您具有4个浮点数和一个字符串（float，float，string，float，float）的固定格式，则可以执行以下操作：

li=tgt.split()
nums=' '.join(li[0:2]+li[-2:])
words=' '.join(li[2:-2])
print words,nums

Answer 3

使用正则表达式的代码：

import re

s = '21357.53 84898.10 Mckenzie Meadows Golf Course 80912.48 84102.38'
row = re.search('([0-9.]+)\s([0-9.]+)\s([\w ]+)\s([0-9.]+)\s([0-9.]+)', s)
if row:
    print '"{0}" {1} {2} {3} {4}'.format(row.group(3), row.group(1), row.group(2), row.group(4), row.group(5))

将打印（带双引号）：

 "Mckenzie Meadows Golf Course" 21357.53 84898.10 80912.48 84102.38

Answer 4

使用str方法：

>>> s = '21357.53 84898.10 Mckenzie Meadows Golf Course 80912.48 84102.38'
>>> temp = s.split()
>>> temp
['21357.53', '84898.10', 'Mckenzie', 'Meadows', 'Golf', 'Course', '80912.48', '84102.38']
>>> row = [temp[0], temp[1], '"'+' '.join(temp[2:-2])+'"', temp[-2], temp[-1]]
>>> row
['21357.53', '84898.10', '"Mckenzie Meadows Golf Course"', '80912.48', '84102.38']
>>> print '{0} {1} {2} {3} {4}'.format(row[2], row[0], row[1], row[3], row[4])
"Mckenzie Meadows Golf Course" 21357.53 84898.10 80912.48 84102.38

Answer 5

使用str方法， filter和lambda ：

>>> words = "21357.53 84898.10 Mckenzie Meadows Golf Course 80912.48 84102.38".split()
>>> print '"%s" %s'%(" ".join(filter(lambda x: x.isalpha(), words)), " ".join(filter(lambda x: not x.isalpha(), words)))
"Mckenzie Meadows Golf Course" 21357.53 84898.10 80912.48 84102.38

更严格地说，在不假设所有非字母单词都是浮点数的情况下（使用reduce ）：

>>> words = "21357.53 84898.10 Mckenzie Meadows Golf Course 80912.48 84102.38".split()
>>> print '"%s" %s'%(" ".join(filter(lambda x: x.isalpha(), words)), " ".join(filter(lambda x: reduce(lambda y, z: z.isdigit() and z, x.split('.'), True), words)))
"Mckenzie Meadows Golf Course" 21357.53 84898.10 80912.48 84102.38

如何使用python将字符串拆分为带引号的句子和数字

问题描述

5 个解决方案

解决方案1
2 2013-07-10 16:47:53

解决方案2
2 已采纳 2013-07-10 17:09:04

解决方案3
1 2013-07-10 16:53:43

解决方案4
0 2013-07-10 17:03:15

解决方案5
0 2013-07-10 17:34:20

如何使用python将字符串拆分为带引号的句子和数字

问题描述

5 个解决方案

解决方案1 2 2013-07-10 16:47:53

解决方案2 2 已采纳 2013-07-10 17:09:04

解决方案3 1 2013-07-10 16:53:43

解决方案4 0 2013-07-10 17:03:15

解决方案5 0 2013-07-10 17:34:20

解决方案1
2 2013-07-10 16:47:53

解决方案2
2 已采纳 2013-07-10 17:09:04

解决方案3
1 2013-07-10 16:53:43

解决方案4
0 2013-07-10 17:03:15

解决方案5
0 2013-07-10 17:34:20