cost 173 ms
Pandas 帶空組的 GroupBy 時間 idxmax 拋出異常

[英]Pandas GroupBy time idxmax w/ empty groups throws exception

我有一個包含數百萬個事件的列表,這些事件及時存儲在數據框df中。 df.head()給出 output: 我按時間分組。 我想獲得所有時間 windows 的 idxmin 和 idxmax,因為我需要知道是最小值還是最大值先出現。 任何時候 window不包含我想要一個 NaN 值的測量值。 因 ...

Pandas 使用TsTables & PyTables 建表時時序索引屬性錯誤 class

[英]Pandas time series index attribute error when using TsTables & PyTables in creating a table class

我正在嘗試通過 tb.IsDescription class 創建一個表結構,然后創建一個 .h5 文件並使用帶有日期時間索引的 Pandas Dataframe 填充它,使用 TsTables package。我已經測試了 Dataframe 和日期時間索引沒事的。 我認為問題出在 TsTabl ...

操縱 Dataframe 從最近的變化午夜時間戳開始

[英]Manipulate the Dataframe to start from the nearest varying Midnight timestamp

我的目標: 我有一個每天隨機生成的數據集,導致第一行在隨機時間開始。 我想讓這個數據集從最近的午夜日期開始。 例如,如果第一行的日期是2022-05-09 15:00:00 ,我將不得不對數據進行切片以使其從最近的午夜開始,在這種情況下: 2022-05-10 00:00:00 這是數據集的樣子: ...

如何根據一個時間戳值 python 計算列中值的數量並將計數添加到新列

[英]How to count number of values in column based on one timestamp value python and add the count to new column

在這個 dataframe df 中,我需要按時間戳 -> select 過濾一個時間戳,對於唯一的汽車列名稱,我需要計算計算唯一汽車名稱的列。 output 看起來像這樣。 讓我們說如果我們給 2015-04-16 11:57:36 我試過這樣的東西,但沒有帶時間戳的想法過濾器。 任何人 ...

如何 select dataframe 的一系列連續日期與 pandas 中的許多用戶

[英]How to select a range of consecutive dates of a dataframe with many users in pandas

我有一個 dataframe 有 1900 萬行不同的客戶(~10K 客戶)以及他們在不同日期范圍內的日常消費。 我已將此數據重新采樣到每周消耗量中,結果 dataframe 是 2M 行。 我想知道每個客戶的連續日期范圍和 select 個具有最大(范圍)的日期。 有任何想法嗎? 謝謝! ...

在 Pandas datetimeindex 中將所有索引舍入到 30 分鍾

[英]Round all index to 30 min in Pandas datetimeindex

我知道圓形,天花板,地板功能。 這四舍五入到最接近的 30 分鍾間隔。 我想要的是每個都四舍五入到 30 分鍾。 在.round 的情況下,10:15 將四舍五入為 10:30,10:45 將四舍五入為 11:00。 我希望兩者都舍入到 10:30。 日期時間索引: ...

如何重新采樣日內間隔並使用.idxmax()?

[英]How to resample intra-day intervals and use .idxmax()?

我正在使用來自 yfinance 的數據,它返回 pandas 數據幀。 數據框中有 5 分鍾的日內間隔。 我想重新采樣到每日數據並獲得當天最大音量的 idxmax。 返回錯誤: 我使用 B(business-days) 作為重采樣周期,所以不應該有任何空序列。 我應該說.max() 工作正常。 ...

熊貓數據幀中的重采樣和計算平均值

[英]Resampling and computing mean in pandas dataframe

我有一個帶有 1 列和基於時間的索引的 Pandas 數據框。 我想每兩秒重新采樣一次數據並計算列中值的平均值。 下面是一個例子: 上面的代碼給出了這個結果。 現在,我每兩秒計算一次值的平均值。 這給了我如下圖所示的結果。 但我希望得到如圖 3 所示的結果。我希望將計算出的平均值 ...

來自 yfinance 的最后一根實時蠟燭

[英]Last real-time candle from yfinance

當您從 yfinance 實時下載數據並且同時下載多個股票代碼時,您通常會將最后一個數據示例分成幾行。 我不在乎這些最小的時間差異,我只想要最后一行中每只股票的最后一個例子。 我一直在考慮對最后一個例子進行分組,但我不確定如何分組。 請注意,我一次下載的股票可能更多,可能是 10 個,然后這 ...

Pandas:將日期列切割成期間日期組/箱

[英]Pandas: cut date column into period date groups/bins

我有一個 dataframe 如下: 我希望將Date列分成幾組在一個新列中,稱為Date_Bin,規則是:從今天開始,如果Date中的值小於7天,那么新列中的值將是'last 7 days',如果該值小於 14 天且大於 7 天,則該值為“7 到 14 天”,如果該值小於 30 天且大於 14 天 ...

在給定位置的連接和斷開時間的情況下查找當前活動連接

[英]Find current active connections given connection and disconnection times of a location

我有一個 dataframe 具有連接日期、斷開日期、 rowID和RouterName 。 我想在一個循環中找到當前活動的連接,該循環每分鍾迭代一次(這可以更改為任何分鍾),持續 24 小時。 我正在嘗試從該數據集計算該位置的人數,稍后我將使用該數據集來計算代理感染電暈或任何空氣傳播傳染病的風險水 ...

如何對具有零階保持的分組 dataframe 重新采樣?

[英]How to resample a grouped dataframe with zero order hold?

我有一個 dataframe 有一堆不同的測量值(每個measurements列中都有一個唯一的 ID),並且每 10 毫秒采集一次測量樣本。 現在我想對所有數據進行下采樣,以便為所有測量“偽造”不同的采樣時間,例如 40 毫秒。 我實現了如下所示的重采樣,但現在我被卡住了:我不想在重采樣器 ob ...

如何從另一個具有不同日期時間索引的 dataframe 獲取列值

[英]How to get column values from another dataframe with a different datetime index

我有一個不同間隔的交易數據框,例如。 1分鍾和5分鍾。 我希望將計算值從較慢的 5 分鍾復制到 1 分鍾 dataframe。 例如 1min 是這樣的: 我希望在 dataframe 中添加一個 forecast_5m 或其他內容,它具有來自 5 分鍾 dataframe 的預測列的前 5 分 ...

在 pandas 日期時間列中查找值之間的中點,並根據中點制作開始和結束時間段列

[英]Finding the midpoint between values in a pandas datetime column and making a start and end time period column based on the midpoint

這是我的代碼設置: 這會產生具有以下形式的 dataframe: 我想要做的是找到值之間的中點並在 dataframe 中創建兩個新列。 兩個新列是“開始時間”和“結束時間”。 “開始時間”是該時間與前一次之間的中點(如果存在)。 “結束時間”是該時間與下一次之間的中點(如果存在)。 如果不存在 ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM