[英]NumPy genfromtxt - skipping rows that start with specific number
我有一个文件,其中第一列有一个整数,该整数告诉它是否是元数据数据-以0开头的行是元数据,并且其中的列数不是固定的,而其他任何整数则表示数据行:
0 -1.0000E+02 2.0000E+03 -1.0000E+03
0 NDIM= 3 IPS = 1
1 3 0 0 1.8279163801E+001 2.1982510269E-002
我想使用numpy以便仅从以非零整数开头的行中读取数据,我可以使用numpy.genfromtxt()来做到这一点吗?
np.genfromtxt
可以接受迭代器作为其第一个参数。 因此,您可以构建一个生成器表达式以仅生成所需的行:
import re
lines = (line for line in open('data', 'rb') if re.match(r'^\s*[1-9]', line) )
然后
In [61]: np.genfromtxt(lines)
Out[61]:
array([ 1. , 3. , 0. , 0. ,
18.2791638 , 0.02198251])
re.match(r'^\\s*[1-9]', line)
测试re.match(r'^\\s*[1-9]', line)
是否以空格开头,后跟1到9之间的一个数字。如果非零整数可以以0开头,那么您可以改为采用
lines = (line for line in open('data', 'rb') if line.split(None, 1)[0].lstrip('0') in '123456789')
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.