[英]How to find all local maxima and minima in a Python Pandas series without knowing the frequency of the window
作为我问题的背景,请允许我解释我要解决的问题。 我有一个传感器正在收集压力数据。 我将这些数据收集到 pandas dataframe 中,结构如下:
DateTime Transmission Line PSI
2021-02-18 11:55:34 3.760
2021-02-18 11:55:49 3.359
2021-02-18 11:56:04 3.142
2021-02-18 11:56:19 3.009
2021-02-18 11:56:34 2.938
... ...
2021-02-19 12:05:06 3.013
2021-02-19 12:05:21 3.011
2021-02-19 12:05:36 3.009
2021-02-19 12:05:51 3.009
2021-02-19 12:06:06 3.007
我可以使用 pyplot plot dataframe 并直观地查看为系统供电的压缩机何时运行、多久运行一次以及对系统加压需要多长时间。 Plot的压力数据:
从图中可以明显看出,plot 左侧的周期比右侧的周期短得多。
我要解决的问题是我想以编程方式计算最后一个完整开关周期的最大压力、最小压力、周期长度和占空比。 一个好处是以编程方式计算 24 小时期间的总运行时间。
我想我需要对压力序列求导,并且我正在使用在python pandas: how to calculate derived/gradient找到的解决方案。
然后,当压缩机运行(正数)而不是(零或负数)时,导数系列将以数字形式显示。 我在想,然后我可以找到各个峰的所有最大值和最小值,并从那里得到它们之间的时间增量。
However, the problem I'm running into is any solutions I've found so far require me to know in advance how large a window to use (for example, the order argument when using SciPy argrelextrema https://docs.scipy.org /doc/scipy/reference/generated/scipy.signal.argrelextrema.html )。
但是我的数据系列的周期短至几分钟,理想情况下(如果我们没有泄漏。)周期应该延长到几小时或更长时间,使用短 windows 会导致我在较长的周期中出现错误的最大值和最小值。 更长的 windows 会导致我错过较短的许多最大值和最小值。
以编程方式查看上述 plot 中显而易见的内容的任何想法?
Mr.T 上面的评论有我的答案......使用scipy.signal.find_peaks
让我可以做我需要的事情。 在下面发布代码。
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from matplotlib.dates import DateFormatter
import scipy.signal as sig
namespace = ['DateTime', 'Transmission Line PSI']
plt.rcParams["figure.figsize"] = [16.0, 9.0]
fig, ax = plt.subplots()
df = pd.read_csv(r'\\192.168.1.1\raid\graphdata.csv', names=namespace)
# convert imported date/time information to real datetimes and set as index
df['DateTime'] = pd.to_datetime(df['DateTime'])
df = df.set_index(df['DateTime']).drop('DateTime', axis=1)
# take first derivative of pressure data to show when pressure is rising or falling
df['deltas'] = df['Transmission Line PSI'].diff() / df.index.to_series().diff().dt.total_seconds()
df['deltas'] = df['deltas'].fillna(0)
peaks, _ = sig.find_peaks(df['deltas'], height=0.01)
neg_peaks, _ = sig.find_peaks(-df['deltas'], height=0.01)
# plotting peaks and neg_peaks against first derivative
plt.scatter(df.iloc[peaks].index, df.iloc[peaks]['deltas'])
plt.scatter(df.iloc[neg_peaks].index, df.iloc[neg_peaks]['deltas'])
plt.plot(df['deltas'])
plt.show()
# find timedeltas between all positive peaks - these are the periods of the cycle times
cycle_times = df.iloc[peaks].index.to_series().diff().dt.seconds.div(60, fill_value=0)
# plot periods
plt.plot(cycle_times)
plt.show()
cycle_times 样本:
>>> cycle_times
DateTime
2021-02-18 11:59:04 0.000000
2021-02-18 12:04:04 5.000000
2021-02-18 12:09:35 5.516667
2021-02-18 12:16:05 6.500000
2021-02-18 12:21:35 5.500000
...
2021-02-19 08:54:09 17.016667
2021-02-19 09:27:56 33.783333
2021-02-19 10:15:44 47.800000
2021-02-19 11:24:19 68.583333
2021-02-19 12:02:36 38.283333
Name: DateTime, Length: 267, dtype: float64
https://docs.scipy.org/doc/scipy/reference/generated/scipy.signal.find_peaks.html
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.