Python3.7 无法正确解析文本文件

Question

我正在尝试编写一个（应该是……）基本的 Python 脚本来完成以下任务：

从硬编码路径读入日志文件（下面的示例文件）
为文件的每一行创建一个数组，包含两个或三个元素
打印出那个数组。

以下是来自 scimark 基准测试的示例日志文件：

**                                                              **
** SciMark2 Numeric Benchmark, see http://math.nist.gov/scimark **
** for details. (Results can be submitted to pozo@nist.gov)     **
**                                                              **
Using       2.00 seconds min time per kenel.
Composite Score:          55.11
FFT             Mflops:   35.99    (N=1024)
SOR             Mflops:   60.25    (100 x 100)
MonteCarlo:     Mflops:    3.21
Sparse matmult  Mflops:   16.10    (N=1000, nz=5000)
LU              Mflops:   15.02    (M=100, N=100)

理想情况下，我会像这样创建一个数组：

array = [
['Composite Score', 55.11 ''],
['FFT MFlops', 35.99, '(N=1024)'],
['SOR MFlops', 60.25, '(100 x 100)'],
['MonteCarlo Mflops', 3.21, ''],
['Sparse matmult Mflops', 16.10, '(n=1000, NZ=5000)'],
['LU', 3.21, '(M=100, N=100)']]

我尝试使用以下 python 代码执行此操作：

import csv

with open ('/SciMarkResults.txt') as file:
    lines = file.readlines()

print(len(lines))
new_lines = lines[5:]

def get_data(readfile):
    types = (line.split('\n') for line in readfile)
    return types

a = get_data(new_lines)

print(a)

它提供以下输出：

11
<generator object get_data.<locals>.<genexpr> at 0x7ff45b5c5ba0>

我考虑过使用正则表达式，但这似乎不是首选的解决方案。

我无法确定为什么我无法正确拆分阵列。 简单地打印new_lines产量：

['Composite Score:          460.11\n', 'FFT             Mflops:   315.99    (N=1024)\n', 'SOR             Mflops:   860.25    (100 x 100)\n', 'MonteCarlo:     Mflops:    93.21\n', 'Sparse matmult  Mflops:   416.10    (N=1000, nz=5000)\n', 'LU              Mflops:   615.02    (M=100, N=100)\n']

任何意见，将不胜感激。

Answer 1

而不是使用，

types = (line.split('\n') for line in readfile)

这是一个生成器理解，你可以使用

types = [line.split('\n') for line in readfile]

这是一个列表理解，应该给你你需要的输出。

@jdehesa在上面回答了同样的问题

Python3.7 无法正确解析文本文件

问题描述

1 个解决方案

解决方案1
1 已采纳 2019-03-13 16:36:53

Python3.7 无法正确解析文本文件

问题描述

1 个解决方案

解决方案1 1 已采纳 2019-03-13 16:36:53

解决方案1
1 已采纳 2019-03-13 16:36:53