使用python從文件中提取浮點數

Question

我有.txt文件，看起來像：

[ -5.44339373e+00  -2.77404404e-01   1.26122094e-01   9.83589873e-01
   1.95201179e-01  -4.49866890e-01  -2.06423297e-01   1.04780491e+00]
 [  4.34562117e-01  -1.04469577e-01   2.83633101e-01   1.00452355e-01   -7.12572469e-01  -4.99234705e-01  -1.93152897e-01   1.80787567e-02]

我需要從中提取所有浮點數並將其放入列表/數組

我所做的是：

A = []
for line in open("general.txt", "r").read().split(" "):
    for unit in line.split("]", 3):
        A.append(list(map(lambda x: str(x), unit.replace("[", "").replace("]", "").split(" "))))

但A包含['']或更糟的['3.20973096e-02\\n']元素。 這些都是字符串，但是我需要浮點數。 怎么做？

Answer 1

為什么不使用正則表達式？

>>> import re
>>> e = r'(\d+\.\d+e?(?:\+|-)\d{2}?)'
>>> results = re.findall(e, your_string)
['5.44339373e+00',
 '2.77404404e-01',
 '1.26122094e-01',
 '9.83589873e-01',
 '1.95201179e-01',
 '4.49866890e-01',
 '2.06423297e-01',
 '1.04780491e+00',
 '4.34562117e-01',
 '1.04469577e-01',
 '2.83633101e-01',
 '1.00452355e-01',
 '7.12572469e-01',
 '4.99234705e-01',
 '1.93152897e-01',
 '1.80787567e-02']

現在，這些是匹配的字符串 ，但是您可以輕松地將它們轉換為浮點數：

>>> map(float, re.findall(e, your_string))
[5.44339373,
 0.277404404,
 0.126122094,
 0.983589873,
 0.195201179,
 0.44986689,
 0.206423297,
 1.04780491,
 0.434562117,
 0.104469577,
 0.283633101,
 0.100452355,
 0.712572469,
 0.499234705,
 0.193152897,
 0.0180787567]

注意，正則表達式可能需要進行一些調整，但這是一個好的開始。

Answer 2

作為更精確的方法，您可以使用正則表達式來分割行：

>>> s="""[ -5.44339373e+00  -2.77404404e-01   1.26122094e-01   9.83589873e-01
...    1.95201179e-01  -4.49866890e-01  -2.06423297e-01   1.04780491e+00]
...  [  4.34562117e-01  -1.04469577e-01   2.83633101e-01   1.00452355e-01   -7.12572469e-01  -4.99234705e-01  -1.93152897e-01   1.80787567e-02] """
>>> print re.split(r'[\s\[\]]+',s)
['', '-5.44339373e+00', '-2.77404404e-01', '1.26122094e-01', '9.83589873e-01', '1.95201179e-01', '-4.49866890e-01', '-2.06423297e-01', '1.04780491e+00', '4.34562117e-01', '-1.04469577e-01', '2.83633101e-01', '1.00452355e-01', '-7.12572469e-01', '-4.99234705e-01', '-1.93152897e-01', '1.80787567e-02', '']

在這種情況下，您可以將數據保存在文件中：

import re
print re.split(r'[\s\[\]]+',open("general.txt", "r").read())

如果您想在開頭和結尾使用空字符串，則可以使用列表推導：

>>> print [i for i in re.split(r'[\s\[\]]*',s) if i]
['-5.44339373e+00', '-2.77404404e-01', '1.26122094e-01', '9.83589873e-01', '1.95201179e-01', '-4.49866890e-01', '-2.06423297e-01', '1.04780491e+00', '4.34562117e-01', '-1.04469577e-01', '2.83633101e-01', '1.00452355e-01', '-7.12572469e-01', '-4.99234705e-01', '-1.93152897e-01', '1.80787567e-02']

Answer 3

讓我們一下文件
```
 content = open('data.txt').read() 
```
在']'上分割
```
 logical_lines = content.split(']') 
```

去除'['和其他東西

 logical_lines = [ll.lstrip(' \\n[') for ll in logical_lines]

轉換為浮點數

 lol = [map(float,ll.split()) for ll in logical_lines]

一口氣將其全部粘貼

lol=[map(float,l.lstrip(' \n[').split()) for l in open('data.txt').read().split(']')]

我已經根據我們提供的示例數據對其進行了測試，並且可以正常工作...

使用python從文件中提取浮點數

問題描述

3 個解決方案

解決方案1
2 2015-02-19 12:31:20

解決方案2
1 已采納 2015-02-19 12:30:02

解決方案3
0 2015-02-19 12:50:37

使用python從文件中提取浮點數

問題描述

3 個解決方案

解決方案1 2 2015-02-19 12:31:20

解決方案2 1 已采納 2015-02-19 12:30:02

解決方案3 0 2015-02-19 12:50:37

解決方案1
2 2015-02-19 12:31:20

解決方案2
1 已采納 2015-02-19 12:30:02

解決方案3
0 2015-02-19 12:50:37