繁体   English   中英

pandas.to_datetime() 如何从本地时区转换为 UTC unix 时间戳?

[英]pandas.to_datetime() how to convert from local timezone to UTC unix timestamp?

我有一个“YYYY-MM-DD”形式的日期值列表。 这些值位于本地 PC 的时区(我不知道)。 这些值在 Pandas dataframe 中作为系列加载,我想将它们转换为 UTC 时间戳。

  1. 如果我使用非常简单的代码:
ts = pd.to_datetime(s, format="%Y-%m-%d")
print(ts[0])
print(int(ts[0].timestamp()))
print(ts[0].strftime("%d.%m.%Y %Z"))

它给了我 output:

2021-01-01 00:00:00
1609459200   --> this is 'Friday, January 1, 2021 0:00:00 UTC'
01.01.2021

即它将源字符串作为UTC 并将其放入UTC。 但我的源字符串是本地时间,output 不正确。

  1. 然后我找到了一个以这种方式在源字符串中提供时区信息的选项:
s = pd.Series(['2021-01-01 Europe/Moscow', '2021-01-02 Europe/Moscow'])
ts = pd.to_datetime(s, format="%Y-%m-%d %Z")
print(ts[0])
print(int(ts[0].timestamp()))
print(ts[0].strftime("%d.%m.%Y %Z"))

它给了我真正需要的结果:

2021-01-01 00:00:00+03:00
1609448400 --> this is correct 'Thursday, December 31, 2020 21:00:00 UTC'
01.01.2021 MSK

但是时区名称在这里是硬编码的。

  1. 因此,我需要从我的代码工作的 PC 获取本地时区名称。 我试过这样:
from datetime import datetime
from dateutil import tz
print(datetime.now(tz.tzlocal()).tzname())

它给了我 output MSK 但是这个 output 的问题 - 当我尝试将它用于 Pandas.to_datetime 时 - 它给了我一个错误:

s = pd.Series(['2021-01-01 MSK', '2021-01-02 MSK'])
ts = pd.to_datetime(s, format="%Y-%m-%d %Z")

ValueError:时间数据“2021-01-01 MSK”与格式“%Y-%m-%d %Z”不匹配(匹配)

因此,我看到了以下前进方式:

  • 要么以某种方式从我的 python 代码中获得完整的时区名称Europe/Moscow而不是短MSK
  • 或使pandas.to_datetime()格式选项%Z识别时区名称的缩写形式MSK
  • 或者在将源字符串导入 pandas 之前以某种方式预处理源字符串(最不理想的路径,所以我还没有研究过)。

我有点坚持在这里选择前进的道路。 你能给我建议哪种方式可以给我更好的代码吗?

我认为您可以使用Series.dt.tz_localize

from dateutil import tz

s = pd.Series(['2021-01-01', '2021-01-02'])
ts = pd.to_datetime(s, format="%Y-%m-%d").dt.tz_localize(tz.tzlocal())

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM