[英]how to sort CSV columns files with Python
我在这里确实需要您的帮助:我正在附加一个Excel文件-并尝试以正确的方式(考虑秒数)对第二列(“时间”)进行排序。 我很尴尬地承认我浪费了多少时间。
PAPER TIME ACTION PRICE AMOUNT
1026 01/12/2013 9:03 BID 124 84,888
1026 18/04/2013 9:01 BID 120.5 14,888
1026 19/01/2013 9:02 BID 121 24,888
1026 21/04/2013 9:05 BID 122 44,888
1026 20/04/2013 9:04 BID 121.5 34,888
1026 15/10/2013 9:06 BID 123.5 74,888
1026 17/04/2013 9:00 BID 120 4,888
1026 22/04/2013 9:07 BID 122.5 54,888
1026 27/04/2013 9:08 BID 123 64,888
此数据存储在名为yaniv123.csv的CSV文件中,列在A到E之间(仅10行)。 如何导入此文件并以正确的方式对B列(时间)进行排序。请帮助我:-)非常感谢!
正如@Edwin van Mierlo提到的,标题需要调整。 您可以使用逗号分隔,但需要确保删除逗号数量。 如果不是,则使用分号代替:
纸张;时间;动作;价格;金额
1026; 01/12/2013 9:03; BID; 124; 84,888
1026; 18/04/2013 9:01; BID; 120.5; 14,888
1026; 19/01/2013 9:02; BID; 121; 24,888
1026; 21/04/2013 9:05; BID; 122; 44,888
1026; 20/04/2013 9:04; BID; 121.5; 34,888
1026; 15/10/2013 9:06; BID; 123.5; 74,888
1026; 17/04/2013 9:00; BID; 120; 4,888
1026; 22/04/2013 9:07; BID; 122.5; 54,888
1026; 27/04/2013 9:08; BID; 123; 64,888
但是,如果一切均已正确调整,则可以使用python panda库。
import pandas as pd
df = pd.read_csv('sample.csv', parse_dates=True, delimiter=";")
df['TIME'] = pd.to_datetime(df.TIME)
print(df.head())
print(df.sort('TIME'))
输出应为:PAPER TIME ACTION PRICE AMOUNT
1026 01/12/2013 9:03出价124.0 84,888
1026 15/10/2013 9:06出价123.5 74,888
1026 17/04/2013 9:00买入价120.0 4,888
1026 18/04/2013 9:01出价120.5 14,888
1026 19/01/2013 9:02出价121.0 24,888
1026 20/04/2013 9:04出价121.5 34,888
1026 21/04/2013 9:05出价122.0 44,888
1026 22/04/2013 9:07出价122.5 54,888
1026 27/04/2013 9:08出价123.0 64,888
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.