我的Python代码没有从.csv excel文件中提取所有信息，而且我不知道为什么

Question

我对编码领域还很陌生，而我的老板也把我惹上火了，所以如果这是菜鸟的错误，我很抱歉，尽管我认为不是。

因此，我尝试绘制G与l1的关系图（这不是11，而是L1）。 数据在我从excel文件加载的文件中。 excel文件为14x250，因此有14个参数，每个参数包含250个数据点。 我放置的图形格式正确，但是显示了零个y值。 据我所知，该代码绘制了前12列的图形，而省略了后2列（其中包含两组“ y”数据）。 我找不到错误所在，这使我发疯！ 任何帮助将不胜感激！

这是我格式化excel文件的地方，我认为错误是：

header = ['l1', 'l2', 'l3', 'l4', 'l5', 'EI',
      'S', 'P_right', 'P1_0', 'P3_0',
      'w_left', 'w_right', 'G_left', 'G_right']

def loadfile(filename, skip=[], *args):
    output = []
    with open(filename, *args) as f:
        reader = csv.reader(f, quoting=csv.QUOTE_NONNUMERIC)
        for i, row in enumerate(reader):
            if not(i in skip):
                output.append(row)
    return np.array(output)

这是我实际加载excel文件的地方，这是下一个可能出现错误的地方：

outputs_l1 = [loadfile('FILE.csv'.format(p)) for p in p3_arr]

fig = plt.figure()
for output, col in zip(outputs_l1, colors):
    plt.plot(output[:,0], output[:,10]*1E3, col+'-')
plt.legend(['$P3 = {} Pa$'.format(p) for p in p3_arr], loc=(1.05, 0.6), fontsize=16)
for output, col in zip(outputs_l1, colors):
    plt.plot(output[:,0], output[:,11]*1E3, col+'--')
plt.ticklabel_format(axis='both', style='plain', scilimits=(-1,1))
plt.xlabel('$l1 (m)$')
plt.ylabel('G $(J / m^2) * 10^{-3}$')
plt.xlim(xmin=.2)
plt.ylim(ymax=2, ymin=0)

plt.subplots_adjust(top=0.8, bottom=0.15, right=0.7)

Answer 1

使用列名代替数字，并结合两个绘图循环，

col = {name:i for i,name in enumerate(header)}

fig = plt.figure()
for data,color in zip(outputs_l1, colors):
    xs  = data[:, col["l1"     ]]
    wl = data[:, col["w_left" ]] * 1000.0    # column 10
    wr = data[:, col["w_right"]] * 1000.0    # column 11
    plt.plot(xs, wl, color + "-", wr, color + "--")

一个可能的错误变得很明显：您说要绘制G ，但您指定的是w （列10和11，而不是列12和13）。

也许w_left和w_data不会出现，因为它们超出了您指定的限制（ plt.ylim(ymax=2, ymin=0) ）？

我想你真正想要的是

fig = plt.figure()
for data,color in zip(outputs_l1, colors):
    xs  = data[:, col["l1"     ]]
    gl = data[:, col["G_left" ]] * 1000.0    # column 12
    gr = data[:, col["G_right"]] * 1000.0    # column 13
    plt.plot(xs, gl, color + "-", gr, color + "--")

在

def loadfile(filename, skip=[], *args):

将[]作为默认参数传递会有些危险，因为对默认列表的更改会在函数调用期间持续存在，从而导致非常奇怪的结果。 你应该做

def loadfile(filename, skip=None, *args):
    skip = skip or []

除非您只使用skip进行成员资格测试，所以作为一个集合它会更快，所以它成为

def loadfile(filename, skip=None, *args):
    skip = set(skip or [])

也，

    output = []
    with open(filename, *args) as f:
        reader = csv.reader(f, quoting=csv.QUOTE_NONNUMERIC)
        for i, row in enumerate(reader):
            if not(i in skip):
                output.append(row)
    return np.array(output)

可以缩短为

    with open(filename, *args) as f:
        cr = csv.reader(f, quoting=csv.QUOTE_NONNUMERIC)
        return np.array(row for i,row in enumerate(cr) if i not in skip)

结果是一个numpy 2d数组； 所以

outputs_l1 = [loadfile('FILE.csv'.format(p)) for p in p3_arr]

看起来p3_arr是确定要查看哪些数据集的列表； 然后outputs_l1成为二维数组的列表。 这是一个误导性的名称，因为从header来看， l1应该是每个2d数组的第一列； 因此， outputs_l1逻辑上应该是仅包含第一列数据的2d数组。 我建议将其重命名为p_data 。

我的Python代码没有从.csv excel文件中提取所有信息，而且我不知道为什么

问题描述

这是我格式化excel文件的地方，我认为错误是：

这是我实际加载excel文件的地方，这是下一个可能出现错误的地方：

1 个解决方案

解决方案1
1 已采纳 2015-01-19 18:40:02

我的Python代码没有从.csv excel文件中提取所有信息，而且我不知道为什么

问题描述

这是我格式化excel文件的地方，我认为错误是：

这是我实际加载excel文件的地方，这是下一个可能出现错误的地方：

1 个解决方案

解决方案1 1 已采纳 2015-01-19 18:40:02

解决方案1
1 已采纳 2015-01-19 18:40:02