cost 361 ms
Python dataframe - 重新采样时间戳,按小时分组,但保留开始和结束日期时间 - Python dataframe - resample timestamps, group by hour, but keep the start and end datetime

我有一个包含时间戳和值的 DataFrame。 我想按数据重新采样:按小时对时间戳进行分组并对值求和。 可以通过 Pandas function 重采样轻松完成: 问题是这种方法丢失了原始的开始和结束时间。 如果我的第一个小时从 13:29 开始,则第一个聚合小时将显示为 13:00 到 14:00 ...

Pandas 每周重采样 - Pandas weekly resampling

我有一个带有每日市场数据 (OHLCV) 的 dataframe,我正在将其重新采样为每周。 我的具体要求是每周数据框的索引标签必须是该周第一天的索引标签,其数据存在于每日 dataframe 中。 例如2022年7月,从7月4日开始的交易周(美股)应该标注为7月5日,因为7月4日是假期,在日线da ...

使用给定的日期范围对 dataframe 的每个 ID 重新采样 - Resample each ID of a dataframe with a given date range

我有一个 dataframe,如下所示。 每周,不同的 ID 会接受不同的测试。 我想对它重新取样,以便每个 ID 都列在该周进行的所有测试旁边,并且 received = 1 或 0 取决于他们是否收到它。 StackOverflow 涵盖了按日期重采样,但不包含按 ID 重采样/填充。 帮助? ...

仅当存在足够数据时,如何有条件地将数据重新采样为每小时值? - How do I conditionally resample data into hourly values only when enough data is present?

我第一次尝试更棘手的事情并来到这里寻求建议。 我试图对有时以 10 分钟为增量的数据进行重新采样,以便仅当一半或更多数据是实际值而不是 NaN 值时,我才能获得每小时值。 如果超过 50% 是 NaN,我如何仍然返回 NaN 值? 这样我仍然有一个连续的时间序列(至少在时间戳方面)。 我正在通过 ...

将 nan 缓冲区添加到 xarray 数据集 - Add nan buffer to xarray dataset

我有一个 xarray 数据集,它将充当不同数据集的掩码。 我想从掩码中的任何 nan 值创建一个缓冲区(具有可配置的距离)。 我还没有看到任何在内部添加缓冲区的东西,而不是用填充值扩展数组大小。 下面是一些可重现的代码来说明我的意思(我使用的数据集有 10,000 个 x/y 坐标): 我想创建一 ...

as.svrepdesign 是否从 svydesign object 继承了 fpc? - Does as.svrepdesign inherit the fpc from a svydesign object?

我对as.svrepdesign函数使用设计 object 中的 fpc 感到有点困惑。 文档中的示例显示以下内容: 所以这似乎很好。 我的理解是,它本质上将使用引导程序来计算调查设计中感兴趣的统计数据。 但是是否应用了 FPC? 我建议不是的原因是因为如果您选择“subbootstrap”,代码 ...

Python - 如何对 2D 形状进行重采样? - Python - How to resample a 2D shape?

我正在为一些几何数据操作编写 python 脚本(计算多驱动工业机器的运动轨迹)。 一般来说,想法是有一个给定的形状(比方说 - 一个椭圆,但一般情况下它可以是任何凸形,用一系列二维点定义),它被旋转并且必须遵循它的最上面的切点。 我对后一部分没有问题,但我需要一些关于 2D 形状准备的提示。 假 ...

在 Rust 中使用 Polars 对时间序列进行重采样 - Resample time series using Polars in Rust

我正在尝试通过进行一些数据解析和重新使用我的一些交易工具来学习 rust,但很快就卡住了。 我想将我的数据从 5 分钟重新采样到 15 分钟,而 Polars 似乎能够以优化的方式做到这一点。 到目前为止,这是我的尝试。 我设法将时间从 5 分钟分组到 15 分钟,但我无法全神贯注于如何将此分组应用 ...

从矩阵中重新采样(引导程序)数据,每行 x 绘制,每列绘制 y - Resample (bootstrap) data from matrix with x draws per row and y draws per column

我有一个包含 0 和 1 的矩阵。 ~30% 的样本是 1,我想估计这个百分比的置信区间(例如,“如果我对整个人口进行抽样,可能会有 28-32% 的“1”)。这样做你可以引导从样本中,(通过替换从自身重绘样本 N 次,并分析 1s 在所有重绘样本中的百分比分布)。但是我的数据在行和列内嵌套(高 ...

Pandas:在给定时间(例如每一天)对插值时间序列数据进行采样的更简单方法 - Pandas: easier way to sample interpolated time series data at given times (e.g. every full day)

我经常遇到的问题是我有时间序列数据,我想在给定时间进行插值和重新采样。 我有一个解决方案,但感觉就像“劳动密集型”,例如我想应该有一个更简单的方法。 Have a look for how I currently do it here: https://gist.github.com/cs224/ ...

GRASS GIS:执行 r.resamp.filter 时出错 - GRASS GIS: Error while executing r.resamp.filter

我想使用高斯滤波器将栅格从 15m 重新采样到 460m。 目标我有一个我想缩小的粗糙图像。 我也有一个很好的分辨率带来帮助缩小。 我使用的缩减方法称为地理加权区域到点回归克里金法 (GWATPRK)。 该方法包括两个步骤: GWR 和, GWR 残差上的 ATPK。 为了使用栅格数据执行 GW ...

将一组 CT 扫描重新采样到相同的像素间距和体积大小的最快和最简单的方法是什么? - What is the fastest and easiest way to resample a set of CT scans to same pixel spacing and volume size?

我必须从 kiTS 19 Challenge 提供的数据集开始训练一个 neural.net 来对肾脏和他的肿瘤进行语义分割。 在这个数据集中,我有 100 个 CT 扫描作为训练集,在大小和像素间距方面有很大差异。 通过研究 inte.net 上的几种方法,我发现确定一组唯一的像素间距是一种很好 ...

自举重采样方法的置信区间模拟问题 - Confidence intervals simulation problem with bootstrap resampling method

覆盖率是通过将包含参数真实值的区间数除以重复次数获得的。 这里的覆盖率始终为 100。我会忽略什么? 我以 95% 的信心工作,所以我应该得到这个数字的结果。 我不明白为什么它是 100。你能帮忙吗? 这对所有置信区间都有效。 我的论文分析。 如果你能帮忙,我会很高兴。 我会在感谢部分写下你的名字 ...

在 SAS 中使用 PROC SURVEYSELECT 为重复单元创建唯一标签 - Create unique label for repeated units with PROC SURVEYSELECT in SAS

我需要从真实(集群)试验数据集中重新采样。 到目前为止,我已在 SAS 中使用以下PROC SURVEYSELECT程序从试验中抽取 10 个集群进行替换,其中 50% 的集群来自控制组,50% 的集群来自治疗组。 我重复这 100 次以获得 100 次复制,每个复制 10 个集群并且分配相等。 ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM