用管道分隔的平面文件插入python以供Pandas和Stats使用

Question

我已经搜索了很多，但是还没有找到答案。

我试图将带有数据的平面文件放入管道，并放入python读取的内容中，并且可以进行分析（例如，执行t检验）。

首先，我创建了一个简单的管道分隔平面文件：

 1|2 3|4 4|5 1|6 2|7 3|8 8|9

并将其保存为“ simpledata”。

然后我在nano中创建了一个bash脚本

#!/usr/bin/env python

import sys
from scipy import stats 

A = sys.stdin.read()
print A
paired_sample = stats.ttest_rel(A[:,0],A[:,1])
print "The t-statistic is %.3f and the p-value is %.3f." % paired_sample

然后我将脚本另存为pairedttest.sh并以

 cat simpledata | pairedttest.sh

我得到的错误是

TypeError: string indices must be integers, not tuple

谢谢您的帮助

Answer 1

您是要打电话吗？：

paired_sample = stats.ttest_rel([1,3,4,1,2,3,8], [2,4,5,6,7,8,9])

如果是这样，您将无法按照自己的方式进行操作。 当您从标准输入中读取A时，它只是一个字符串，因此您无法按照尝试的方式对其进行索引。 您需要从字符串构建两个列表。 最明显的方式是这样的：

left = []
right = []
for line in A.splitlines():
    l, r = line.split("|")
    left.append(int(l))
    right.append(int(r))
print left
print right

这将输出：

[1, 3, 4, 1, 2, 3, 8]
[2, 4, 5, 6, 7, 8, 9]

这样就可以调用stats.ttest_rel(left, right)

或者说真的很聪明，使它变得（几乎无法阅读）单线：

z = zip(*[map(int, line.split("|")) for line in A.splitlines()])

这将输出：

[(1, 3, 4, 1, 2, 3, 8), (2, 4, 5, 6, 7, 8, 9)]

因此您可以调用stats.ttest_rel(*z)

用管道分隔的平面文件插入python以供Pandas和Stats使用

问题描述

1 个解决方案

解决方案1
1 已采纳 2014-05-30 23:46:09

用管道分隔的平面文件插入python以供Pandas和Stats使用

问题描述

1 个解决方案

解决方案1 1 已采纳 2014-05-30 23:46:09

解决方案1
1 已采纳 2014-05-30 23:46:09