[英]Python3.7 not parsing text file properly
我正在尝试编写一个(应该是……)基本的 Python 脚本来完成以下任务:
以下是来自 scimark 基准测试的示例日志文件:
** **
** SciMark2 Numeric Benchmark, see http://math.nist.gov/scimark **
** for details. (Results can be submitted to pozo@nist.gov) **
** **
Using 2.00 seconds min time per kenel.
Composite Score: 55.11
FFT Mflops: 35.99 (N=1024)
SOR Mflops: 60.25 (100 x 100)
MonteCarlo: Mflops: 3.21
Sparse matmult Mflops: 16.10 (N=1000, nz=5000)
LU Mflops: 15.02 (M=100, N=100)
理想情况下,我会像这样创建一个数组:
array = [
['Composite Score', 55.11 ''],
['FFT MFlops', 35.99, '(N=1024)'],
['SOR MFlops', 60.25, '(100 x 100)'],
['MonteCarlo Mflops', 3.21, ''],
['Sparse matmult Mflops', 16.10, '(n=1000, NZ=5000)'],
['LU', 3.21, '(M=100, N=100)']]
我尝试使用以下 python 代码执行此操作:
import csv
with open ('/SciMarkResults.txt') as file:
lines = file.readlines()
print(len(lines))
new_lines = lines[5:]
def get_data(readfile):
types = (line.split('\n') for line in readfile)
return types
a = get_data(new_lines)
print(a)
它提供以下输出:
11
<generator object get_data.<locals>.<genexpr> at 0x7ff45b5c5ba0>
我考虑过使用正则表达式,但这似乎不是首选的解决方案。
我无法确定为什么我无法正确拆分阵列。 简单地打印new_lines
产量:
['Composite Score: 460.11\n', 'FFT Mflops: 315.99 (N=1024)\n', 'SOR Mflops: 860.25 (100 x 100)\n', 'MonteCarlo: Mflops: 93.21\n', 'Sparse matmult Mflops: 416.10 (N=1000, nz=5000)\n', 'LU Mflops: 615.02 (M=100, N=100)\n']
任何意见,将不胜感激。
而不是使用,
types = (line.split('\n') for line in readfile)
这是一个生成器理解,你可以使用
types = [line.split('\n') for line in readfile]
这是一个列表理解,应该给你你需要的输出。
@jdehesa在上面回答了同样的问题
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.