![](/img/trans.png)
[英]extract data from .txt file and convert it into row and column in .csv format
[英]convert file from .csv to .txt with change in format delete specific column and row header
我在 .csv 文件中有以下格式的数据
约会时间 | 象征 | 打开 | 高的 | 低的 | 关 | 体积 |
---|---|---|---|---|---|---|
2005-03-10 09:15:00 | NSE:阿图尔 | 85.59 | 89.00 | 85.19 | 86.84 | 73582 |
2005-03-11 09:15:00 | NSE:阿图尔 | 89.44 | 89.80 | 85.50 | 85.94 | 153945 |
2005-03-14 09:15:00 | NSE:阿图尔 | 86.90 | 88.75 | 84.00 | 84.65 | 73539 |
2005-03-15 09:15:00 | NSE:阿图尔 | 85.00 | 85.94 | 82.00 | 82.40 | 79053 |
我想创建一个新的 .txt 或 .csv 文件,格式如下
1st - 我想删除“符号”列
第二 - 想要删除标题行,即日期时间|符号|打开.....
3rd - 想要将 'datetime' 列日期和时间格式更改为 YYYYMMDD
4th - 用“;”分隔每一列
为了便于理解,下面给出了所需的格式示例。
20050310; 85.59; 89.00; 85.19; 86.84; 73582
20050311; 89.44; 89.80; 85.50; 85.94; 153945
20050314; 86.90; 88.75; 84.00; 84.65; 73539
20050315; 85.00; 85.94; 82.00; 82.40; 79053
到目前为止,我已经尝试了以下代码,但无法找到所需的格式
import pandas as pd
data = pd.read_csv('ATUL.csv')
print("Original 'ATUL.csv' CSV Data: \n")
print(data)
data.drop('symbol', inplace=True, axis=1)
print("\nCSV Data after deleting the column 'symbol':\n")
print(data)
第二 - 想要删除标题行,即日期时间|符号|打开.....
导出时可以使用header
来排除 header。
3rd - 想要将 'datetime' 列日期和时间格式更改为 YYYYMMDD
您可以将datetime
列转换为 datetime 类型,然后使用dt.strftime
更改格式。
4th - 用“;”分隔每一列
导出时可以使用sep
指定分隔符。
data.drop('symbol', inplace=True, axis=1)
data['datetime'] = pd.to_datetime(data['datetime']).dt.strftime('%Y%m%d')
data.to_csv('output.txt', sep=';', header=None, index=False)
20050310;85.59;89.0;85.19;86.84;73582
20050311;89.44;89.8;85.5;85.94;153945
20050314;86.9;88.75;84.0;84.65;73539
20050315;85.0;85.94;82.0;82.4;79053
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.