[英]Parsing time string in Python
我有一個日期時間字符串,我不知道如何在Python中解析它。
字符串是這樣的:
Tue May 08 15:14:45 +0800 2012
我試過了
datetime.strptime("Tue May 08 15:14:45 +0800 2012","%a %b %d %H:%M:%S %z %Y")
但是Python提升了
'z' is a bad directive in format '%a %b %d %H:%M:%S %z %Y'
根據Python doc:
%z UTC格式+ HHMM或-HHMM中的UTC偏移量(如果對象是天真的,則為空字符串)。
解析此時間字符串的正確格式是什么?
datetime.datetime.strptime
遇到時區解析問題。 看看dateutil
包 :
>>> from dateutil import parser
>>> parser.parse("Tue May 08 15:14:45 +0800 2012")
datetime.datetime(2012, 5, 8, 15, 14, 45, tzinfo=tzoffset(None, 28800))
你最好的選擇是看看strptime()
有點像
>>> from datetime import datetime
>>> date_str = 'Tue May 08 15:14:45 +0800 2012'
>>> date = datetime.strptime(date_str, '%a %B %d %H:%M:%S +0800 %Y')
>>> date
datetime.datetime(2012, 5, 8, 15, 14, 45)
不幸的是,我不確定如何做+0800時區,也許別人可以幫忙解決這個問題。
格式化字符串可以在http://docs.python.org/library/time.html#time.strftime找到,並且格式化打印字符串是相同的。
希望有所幫助
標記
PS,你最好的選擇是從pypi安裝pytz時區。 ( http://pytz.sourceforge.net/ )事實上我認為如果我沒記錯的話,pytz有一個很棒的日期時間解析方法。 標准的lib在地面上有點薄,帶有時區功能。
它在SO中多次討論過。 簡而言之,不支持“%z”,因為平台不支持它。 我的解決方案是新的,只是跳過時區:
datetime.datetime.strptime(re.sub(r"[+-]([0-9])+", "", "Tue May 08 15:14:45 +0800 2012"),"%a %b %d %H:%M:%S %Y")
這是一個stdlib解決方案,它支持輸入時間字符串中的變量utc offset:
>>> from email.utils import parsedate_tz, mktime_tz
>>> from datetime import datetime, timedelta
>>> timestamp = mktime_tz(parsedate_tz('Tue May 08 15:14:45 +0800 2012'))
>>> utc_time = datetime(1970, 1, 1) + timedelta(seconds=timestamp)
>>> utc_time
datetime.datetime(2012, 5, 8, 7, 14, 45)
In [117]: datetime.datetime.strptime?
Type: builtin_function_or_method
Base Class: <type 'builtin_function_or_method'>
String Form: <built-in method strptime of type object at 0x9a2520>
Namespace: Interactive
Docstring:
string, format -> new datetime parsed from a string (like time.strptime()).
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.