backtrader 時間列：ValueError：時間數據“0”與格式“%Y-%m-%d %H:%M:%S”不匹配

Question

我有一個價格表，其中包含 csv 格式的日期和時間：

          Date           Time    o   h    l    c      v
0   2020-07-09  15:10:00    8   8   7.5 7.94    41
1   2020-07-09  15:00:00    7.61    8.24    7.61    8.24    10
2   2020-07-09  14:50:00    8.3 8.3 7.7 7.7 7
3   2020-07-09  14:40:00    8.72    8.72    8.3 8.3 7
4   2020-07-09  14:30:00    8.72    8.72    8.39    8.39    8
5   2020-07-09  14:20:00    8.35    8.6 8.3 8.6 6
6   2020-07-09  14:10:00    8.18    8.46    8.18    8.45    22
7   2020-07-09  14:00:00    8.5 8.5 8.5 8.5 1

ValueError: 時間數據“0”與格式“%Y-%m-%d %H:%M:%S”不匹配

這是我從運行這些代碼片段中得到的錯誤。

data = bt.feeds.GenericCSVData(dataname='ticks2.csv',
    params = (
        
        ('nullvalue', float('NaN')),
        ('dtformat', '%Y/%m/%d'),# %H:%M:%S
        ('tmformat', '%H:%M:%S'),
        
        
        ('datetime', 0),
        ('time', 1),
        ('open', 2),
        ('high', 3),
        ('low', 4),
        ('close', 5),
        ('volume', 6),

我試圖合並日期和時間列來解決這個問題，但無濟於事......因為錯誤保持不變。

df = pd.read_csv('ticks.csv', parse_dates=[['Date', 'Time']])
    print(df)
    del df["Unnamed: 0"]

Answer 1

首先，您將索引作為 CSV 中的第一列（即 0、1、2、3、4...），但是您在 CSV 的第一行中沒有此列的列名，因此您需要將其名稱添加到 CSV 的標題（第一行）中，只需將其命名為“Index”，以便第一個修改的 CSV 行看起來像Index Date Time ohlcv 。

第二件事是，看起來您的 CSV 中有制表符而不是逗號作為單元格分隔符，因此您需要在 read_csv 中將其指定為sep = '\\t'即pd.read_csv('test.csv', sep = '\\t', parse_dates = [['Date', 'Time']]) 。

下面是一個有效的更正示例，我為sep = ','的情況做了我的示例sep = ','因為 StackOverflow 從文本中刪除了選項卡，我無法顯示它們。 對於您的情況，只需在read_csv(...) sep = ','修改為sep = '\\t' 。 您可以在我的示例中看到，我的 csv 在第一個 csv 行的開頭包含添加的Index 。 同樣在我的示例的開頭，我有測試 csv 文件寫入塊，您不需要這個塊，因為您已經有了文件。

總而言之，您必須做兩件事：

編輯您的 CSV 文件並插入到起始詞Index加選項卡的第一行。
如果您有制表符分隔的 CSV 並且看起來像您那樣，請將sep = '\\t'添加到您的read_csv(...) 。

在線試試吧！

# This file-writing block is not needed, it is to create example file
with open('test.csv', 'w', encoding = 'utf-8') as f:
    f.write("""
Index,Date,Time,o,h,l,c,v
0,2020-07-09,15:10:00,8,8,7.5,7.94,41
1,2020-07-09,15:00:00,7.61,8.24,7.61,8.24,10
2,2020-07-09,14:50:00,8.3,8.3,7.7,7.7,7
3,2020-07-09,14:40:00,8.72,8.72,8.3,8.3,7
4,2020-07-09,14:30:00,8.72,8.72,8.39,8.39,8
5,2020-07-09,14:20:00,8.35,8.6,8.3,8.6,6
6,2020-07-09,14:10:00,8.18,8.46,8.18,8.45,22
7,2020-07-09,14:00:00,8.5,8.5,8.5,8.5,1
    """)

# This code is needed to solve task
# Change to "sep = '\t'" for your case of tab-separated CSV
import pandas as pd
df = pd.read_csv('test.csv', sep = ',', parse_dates = [['Date', 'Time']])
print(df)

輸出：

            Date_Time  Index     o     h     l     c   v
0 2020-07-09 15:10:00      0  8.00  8.00  7.50  7.94  41
1 2020-07-09 15:00:00      1  7.61  8.24  7.61  8.24  10
2 2020-07-09 14:50:00      2  8.30  8.30  7.70  7.70   7
3 2020-07-09 14:40:00      3  8.72  8.72  8.30  8.30   7
4 2020-07-09 14:30:00      4  8.72  8.72  8.39  8.39   8
5 2020-07-09 14:20:00      5  8.35  8.60  8.30  8.60   6
6 2020-07-09 14:10:00      6  8.18  8.46  8.18  8.45  22
7 2020-07-09 14:00:00      7  8.50  8.50  8.50  8.50   1

backtrader 時間列：ValueError：時間數據“0”與格式“%Y-%m-%d %H:%M:%S”不匹配

問題描述

1 個解決方案

解決方案1
1 已采納 2020-11-07 10:04:20

backtrader 時間列：ValueError：時間數據“0”與格式“%Y-%m-%d %H:%M:%S”不匹配

問題描述

1 個解決方案

解決方案1 1 已采納 2020-11-07 10:04:20

解決方案1
1 已采納 2020-11-07 10:04:20