[英]Reshaping data in CSV to multiple columns
0 19 1 19 2 19 3 19
我如何在python中將以上csv數據更改為-
0 19
1 19
2 19
3 19
現在我需要重塑數據集的幫助,如下所示-
0 100 1 100 2 100 3 100 4 100 5 100
6 200 7 200 8 200 9 200 0 200 1 200
.....
我想以以下格式重塑數據集-
0 100
1 100
2 100
3 100
4 100
5 100
..
6 200
7 200
8 200
9 200
0 200
1 200
...
您真的不需要熊貓。 您可以使用np.loadtxt
進行此操作,然后進行reshape
。
import io
# replace this with your filename
buf = io.StringIO('''0 19 1 19 2 19 3 19''') # buf = 'file.txt'
arr = np.loadtxt(buf).reshape(-1, 2)
arr
array([[ 0., 19.],
[ 1., 19.],
[ 2., 19.],
[ 3., 19.]])
請注意,如果您使用其他定界符(例如,逗號),則可以通過傳遞delimiter
參數來指定它,例如: np.loadtxt(buf, delimiter=',')
。
現在,使用savetxt
保存為savetxt
np.savetxt('file.csv', arr, delimiter=',')
稍后,當使用pandas
讀取CSV時,請使用-
df = pd.read_csv(index_col=[0], header=None, names=['A', 'B'])
from io import StringIO
txt = """0 19 1 19 2 19 3 19
"""
df = pd.read_csv(StringIO(txt),header=None,sep=' ')
df=df.dropna(1)
pd.DataFrame(df.T[0].values.reshape(df.shape[1]//2,2))
Out[77]:
0 1
0 0 19
1 1 19
2 2 19
3 3 19
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.