![](/img/trans.png)
[英]Change frequency of x-axis tick label of datetime data in python bar chart using matplotlib
[英]How to change the datetime tick label frequency for matplotlib plots?
首先,您必须将 Pandas 日期对象转换为 Python 日期对象。 由于 matplotlib 内部日期转换函数,因此需要此转换。 然后使用matplotlib.dates
函数来设置所需的格式化程序和刻度位置,如下所示:
import pandas as pd
import numpy as np
import matplotlib.pylab as plt
import matplotlib.dates as mdates
# convert date objects from pandas format to python datetime
index = pd.date_range(start = "2015-07-01", end = "2017-01-01", freq = "D")
index = [pd.to_datetime(date, format='%Y-%m-%d').date() for date in index]
data = np.random.randint(1,100, size=len(index))
df = pd.DataFrame(data=data,index=index, columns=['data'])
print (df.head())
ax = df.plot()
# set monthly locator
ax.xaxis.set_major_locator(mdates.MonthLocator(interval=1))
# set formatter
ax.xaxis.set_major_formatter(mdates.DateFormatter('%d-%m-%Y'))
# set font and rotation for date tick labels
plt.gcf().autofmt_xdate()
plt.show()
对于季节标签,您必须自己构建它,然后使用plt.setp
函数进行设置(对于 02 月设置标签winter
,04 - spring
等): plt.setp(new_labels, rotation=90, fontsize=9)
。
df负责人:
data
2015-07-01 26
2015-07-02 33
2015-07-03 46
2015-07-04 69
2015-07-05 17
我很难让@Serenity 回答工作,因为我直接使用 Matplotlib 而不是绘制 Pandas 数据集。 因此,如果您是其中之一,我的回答可能会有所帮助。
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.dates as mdates
# Process dataset
bitcoin['Date'] = pd.to_datetime(bitcoin['Date'])
bitcoin['Open'] = pd.to_numeric(bitcoin['Open'])
# Plot
plt.figure()
plt.plot(bitcoin['Date'], bitcoin['Open'])
ax = plt.gca()
ax.xaxis.set_major_locator(mdates.MonthLocator(interval=4))
ax.xaxis.set_major_formatter(mdates.DateFormatter('%d-%m-%Y'))
plt.gcf().autofmt_xdate() # Rotation
plt.show()
bitcoin[['Date', 'Open']].head()
Date Open
0 2017-09-05 4228.29
1 2017-09-04 4591.63
2 2017-09-03 4585.27
3 2017-09-02 4901.42
4 2017-09-01 4701.76
这个答案基于Serenity 的一个以及ImportanceOfBeingErnest 的这个。
自定义时间序列刻度标签的最佳方法是使用matplotlib.dates
模块 (mdates) 中的刻度定位器和格式化程序。 尽管值得注意的是,如果您想要一个基于与您正在绘制的时间序列相同的单位的刻度频率,使用日期作为字符串创建和格式化刻度标签可能更方便,就像在这个问题的答案中一样熊猫条形图。
如文档中所述,pandas 使用 matplotlib 为时间序列创建带有自己的自定义刻度格式器的图:
pandas 为时间序列图提供自定义格式化程序。 这些更改了日期和时间轴标签的格式。 默认情况下,自定义格式化程序仅应用于由 Pandas 使用 DataFrame.plot() 或 Series.plot() 创建的绘图。
pandas 时间序列图的刻度和标签目前默认格式如下:
import numpy as np # v 1.19.2
import pandas as pd # v 1.1.3
import matplotlib.dates as mdates # v 3.3.2
# Create random dataset stored as a pandas DataFrame with a DatetimeIndex
rng = np.random.default_rng(seed=1) # random number generator
date_day = pd.date_range(start='2015-07-01', end='2016-12-31', freq='D')
traffic = rng.lognormal(sigma=2, size=date_day.size)
df_day = pd.DataFrame(dict(traffic=traffic), index=date_day)
# Create pandas plot with default settings except for figure size
df_day.plot(figsize=(10,5));
为了能够使用 mdates 刻度定位器和格式化程序并覆盖默认刻度格式,matplotlib 必须正确识别熊猫日期。 问题在于,pandas 和 matplotlib 有不同的方法来计算用于在时间轴(默认为 x 轴)上定位刻度的日期数字。
在 pandas 中,时间以纳秒为单位,从1970-01-01 00:00:00
(Unix 纪元的起源)的零开始,并且各个时间点存储为pandas 时间戳对象。 但是在为绘图创建时间尺度时,pandas 使用另一种编号系统,该系统从同一原点开始,然后在所选频率的每个周期内增加 1(在本例中,频率以天为单位)。
自 2020 年 7 月发布的 3.3.0 版以来, Matplotlib 使用与 pandas 相同的默认来源,但日期始终以天为单位进行编号:
Matplotlib 使用浮点数表示日期,指定自 1970-01-01 UTC 的默认纪元以来的天数; 例如,1970-01-01, 06:00 是浮点数 0.25。
您可以通过运行ax.get_xticks()
和ax = df.plot()
来检查用于比例尺的数字。
正如您可能已经猜到的那样,这意味着当时间序列的频率为天时,不需要日期转换,如下图所示,使用简单的自定义刻度定位器和格式化程序:
ax = df_day.plot(figsize=(10,5))
# Create custom ticks using matplotlib date tick locator and formatter
loc = mdates.MonthLocator(interval=2)
ax.xaxis.set_major_locator(loc)
fmt = mdates.DateFormatter('%b\n%Y')
ax.xaxis.set_major_formatter(fmt)
这种特殊情况可以方便地为 x 轴限制和次要 x 刻度保留其他 Pandas 默认设置。 但这是一般规则的一个例外。
为了能够将 mdates 刻度定位器和格式化程序与任何类型频率的时间序列的熊猫图一起使用,您需要使用( 长期存在但不存在文档字符串且几乎没有记录) x_compat=True
参数. 以下示例说明了它与按月频率重新采样的相同数据集的用法。 通常情况下,您只想稍微调整默认的 Pandas 格式,因此在以下示例中,从头开始重新创建默认格式以显示可以使用哪些方法对其进行调整:
# Resample time series to monthly frequency and plot it using date
# numbers that are compatible with mdates
df_month = df_day.resample('MS').sum()
ax = df_month.plot(figsize=(10,5), x_compat=True)
# Set major and minor date tick locators
maj_loc = mdates.MonthLocator(bymonth=np.arange(1,12,2))
ax.xaxis.set_major_locator(maj_loc)
min_loc = mdates.MonthLocator()
ax.xaxis.set_minor_locator(min_loc)
# Set major date tick formatter
zfmts = ['', '%b\n%Y', '%b', '%b-%d', '%H:%M', '%H:%M']
maj_fmt = mdates.ConciseDateFormatter(maj_loc, zero_formats=zfmts, show_offset=False)
ax.xaxis.set_major_formatter(maj_fmt)
ax.figure.autofmt_xdate(rotation=0, ha='center')
ax.set_xlim(df_month.index.min(), df_month.index.max());
文档: pd.date_range
, 日期格式代码, mdates.ConciseDateFormatter
, fig.autofmt_xdate
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.