[英]pandas how to get mean value of datetime timestamp with some conditions?
我有一個 df,你可以通過復制並運行以下代碼來獲得它: 我的問題是,如何獲得每個用戶每個持續時間的平均值? 輸出應該是這樣的(平均值是樣本的假值,不是准確的平均值): ...
[英]pandas how to get mean value of datetime timestamp with some conditions?
我有一個 df,你可以通過復制並運行以下代碼來獲得它: 我的問題是,如何獲得每個用戶每個持續時間的平均值? 輸出應該是這樣的(平均值是樣本的假值,不是准確的平均值): ...
[英]Pandas GroupBy time idxmax w/ empty groups throws exception
我有一個包含數百萬個事件的列表,這些事件及時存儲在數據框df中。 df.head()給出 output: 我按時間分組。 我想獲得所有時間 windows 的 idxmin 和 idxmax,因為我需要知道是最小值還是最大值先出現。 任何時候 window不包含我想要一個 NaN 值的測量值。 因 ...
[英]Pandas time series index attribute error when using TsTables & PyTables in creating a table class
我正在嘗試通過 tb.IsDescription class 創建一個表結構,然后創建一個 .h5 文件並使用帶有日期時間索引的 Pandas Dataframe 填充它,使用 TsTables package。我已經測試了 Dataframe 和日期時間索引沒事的。 我認為問題出在 TsTabl ...
[英]Manipulate the Dataframe to start from the nearest varying Midnight timestamp
我的目標: 我有一個每天隨機生成的數據集,導致第一行在隨機時間開始。 我想讓這個數據集從最近的午夜日期開始。 例如,如果第一行的日期是2022-05-09 15:00:00 ,我將不得不對數據進行切片以使其從最近的午夜開始,在這種情況下: 2022-05-10 00:00:00 這是數據集的樣子: ...
[英]How to count number of values in column based on one timestamp value python and add the count to new column
在這個 dataframe df 中,我需要按時間戳 -> select 過濾一個時間戳,對於唯一的汽車列名稱,我需要計算計算唯一汽車名稱的列。 output 看起來像這樣。 讓我們說如果我們給 2015-04-16 11:57:36 我試過這樣的東西,但沒有帶時間戳的想法過濾器。 任何人 ...
[英]How to generate monthly period index with annual frequency?
如何以最簡潔的方式生成每 12 個月觀察一次的月度周期指數? 我想出了以下解決方案 但我想知道是否有一種方法可以避免從期間索引轉換為 dataframe 並返回到期間索引。 這是預期的 output: ...
[英]To find a chosen date between date range of two columns
請幫助我找出如何檢查“chosen_date”是否在“date1”和“date2”列之間的范圍內。 from datetime import datetime chosen_date = datetime.today().strftime("%Y-%m-%d") ...
[英]How to select a range of consecutive dates of a dataframe with many users in pandas
我有一個 dataframe 有 1900 萬行不同的客戶(~10K 客戶)以及他們在不同日期范圍內的日常消費。 我已將此數據重新采樣到每周消耗量中,結果 dataframe 是 2M 行。 我想知道每個客戶的連續日期范圍和 select 個具有最大(范圍)的日期。 有任何想法嗎? 謝謝! ...
[英]Round all index to 30 min in Pandas datetimeindex
我知道圓形,天花板,地板功能。 這四舍五入到最接近的 30 分鍾間隔。 我想要的是每個都四舍五入到 30 分鍾。 在.round 的情況下,10:15 將四舍五入為 10:30,10:45 將四舍五入為 11:00。 我希望兩者都舍入到 10:30。 日期時間索引: ...
[英]How to resample intra-day intervals and use .idxmax()?
我正在使用來自 yfinance 的數據,它返回 pandas 數據幀。 數據框中有 5 分鍾的日內間隔。 我想重新采樣到每日數據並獲得當天最大音量的 idxmax。 返回錯誤: 我使用 B(business-days) 作為重采樣周期,所以不應該有任何空序列。 我應該說.max() 工作正常。 ...
[英]Why can't I select whole days from intra-day time series?
我有基本的財務 OHLCV 數據。 假設我想 select 某一天的所有示例。 即使在使用 lt 或 gt 時可以與字符串日期進行比較,這也不起作用。 所以我創建了日期列 這個新列比 object dtype 還: 還是不行。 ...
[英]Resampling and computing mean in pandas dataframe
我有一個帶有 1 列和基於時間的索引的 Pandas 數據框。 我想每兩秒重新采樣一次數據並計算列中值的平均值。 下面是一個例子: 上面的代碼給出了這個結果。 現在,我每兩秒計算一次值的平均值。 這給了我如下圖所示的結果。 但我希望得到如圖 3 所示的結果。我希望將計算出的平均值 ...
[英]Last real-time candle from yfinance
當您從 yfinance 實時下載數據並且同時下載多個股票代碼時,您通常會將最后一個數據示例分成幾行。 我不在乎這些最小的時間差異,我只想要最后一行中每只股票的最后一個例子。 我一直在考慮對最后一個例子進行分組,但我不確定如何分組。 請注意,我一次下載的股票可能更多,可能是 10 個,然后這 ...
[英]Pandas: cut date column into period date groups/bins
我有一個 dataframe 如下: 我希望將Date列分成幾組在一個新列中,稱為Date_Bin,規則是:從今天開始,如果Date中的值小於7天,那么新列中的值將是'last 7 days',如果該值小於 14 天且大於 7 天,則該值為“7 到 14 天”,如果該值小於 30 天且大於 14 天 ...
[英]Find current active connections given connection and disconnection times of a location
我有一個 dataframe 具有連接日期、斷開日期、 rowID和RouterName 。 我想在一個循環中找到當前活動的連接,該循環每分鍾迭代一次(這可以更改為任何分鍾),持續 24 小時。 我正在嘗試從該數據集計算該位置的人數,稍后我將使用該數據集來計算代理感染電暈或任何空氣傳播傳染病的風險水 ...
[英]How to resample a grouped dataframe with zero order hold?
我有一個 dataframe 有一堆不同的測量值(每個measurements列中都有一個唯一的 ID),並且每 10 毫秒采集一次測量樣本。 現在我想對所有數據進行下采樣,以便為所有測量“偽造”不同的采樣時間,例如 40 毫秒。 我實現了如下所示的重采樣,但現在我被卡住了:我不想在重采樣器 ob ...
[英]How to get column values from another dataframe with a different datetime index
我有一個不同間隔的交易數據框,例如。 1分鍾和5分鍾。 我希望將計算值從較慢的 5 分鍾復制到 1 分鍾 dataframe。 例如 1min 是這樣的: 我希望在 dataframe 中添加一個 forecast_5m 或其他內容,它具有來自 5 分鍾 dataframe 的預測列的前 5 分 ...
[英]Finding the midpoint between values in a pandas datetime column and making a start and end time period column based on the midpoint
這是我的代碼設置: 這會產生具有以下形式的 dataframe: 我想要做的是找到值之間的中點並在 dataframe 中創建兩個新列。 兩個新列是“開始時間”和“結束時間”。 “開始時間”是該時間與前一次之間的中點(如果存在)。 “結束時間”是該時間與下一次之間的中點(如果存在)。 如果不存在 ...
[英]Pandas rolling time window fails on count of string - why?
嘗試使用帶有 timeindex 和 count() 方法的 pandas 滾動,出現錯誤,我在這里缺少什么? 這是一個例子: 得到這個: ...