标签[resampling] - 堆栈内存溢出

将 Pandas 中的每小时数据重采样为半小时 - Resampling Hourly Data into Half Hourly in Pandas

我有以下 DataFrame 称为prices ：我正在尝试对prices重新采样以显示半小时数据而不是每小时数据， PriceAmountGBP在半小时内重复，下面需要 output：我尝试了以下不正确的操作： Output：任何帮助表示赞赏！ ...

Python dataframe - 重新采样时间戳，按小时分组，但保留开始和结束日期时间 - Python dataframe - resample timestamps, group by hour, but keep the start and end datetime

我有一个包含时间戳和值的 DataFrame。我想按数据重新采样：按小时对时间戳进行分组并对值求和。可以通过 Pandas function 重采样轻松完成：问题是这种方法丢失了原始的开始和结束时间。如果我的第一个小时从 13:29 开始，则第一个聚合小时将显示为 13:00 到 14:00 ...

Pandas 每周重采样 - Pandas weekly resampling

我有一个带有每日市场数据 (OHLCV) 的 dataframe，我正在将其重新采样为每周。我的具体要求是每周数据框的索引标签必须是该周第一天的索引标签，其数据存在于每日 dataframe 中。例如2022年7月，从7月4日开始的交易周（美股）应该标注为7月5日，因为7月4日是假期，在日线da ...

使用给定的日期范围对 dataframe 的每个 ID 重新采样 - Resample each ID of a dataframe with a given date range

我有一个 dataframe，如下所示。每周，不同的 ID 会接受不同的测试。我想对它重新取样，以便每个 ID 都列在该周进行的所有测试旁边，并且 received = 1 或 0 取决于他们是否收到它。 StackOverflow 涵盖了按日期重采样，但不包含按 ID 重采样/填充。帮助？ ...

仅当存在足够数据时，如何有条件地将数据重新采样为每小时值？ - How do I conditionally resample data into hourly values only when enough data is present?

我第一次尝试更棘手的事情并来到这里寻求建议。我试图对有时以 10 分钟为增量的数据进行重新采样，以便仅当一半或更多数据是实际值而不是 NaN 值时，我才能获得每小时值。如果超过 50% 是 NaN，我如何仍然返回 NaN 值？这样我仍然有一个连续的时间序列（至少在时间戳方面）。我正在通过 ...

将 nan 缓冲区添加到 xarray 数据集 - Add nan buffer to xarray dataset

我有一个 xarray 数据集，它将充当不同数据集的掩码。我想从掩码中的任何 nan 值创建一个缓冲区（具有可配置的距离）。我还没有看到任何在内部添加缓冲区的东西，而不是用填充值扩展数组大小。下面是一些可重现的代码来说明我的意思（我使用的数据集有 10,000 个 x/y 坐标）：我想创建一 ...

as.svrepdesign 是否从 svydesign object 继承了 fpc？ - Does as.svrepdesign inherit the fpc from a svydesign object?

我对as.svrepdesign函数使用设计 object 中的 fpc 感到有点困惑。文档中的示例显示以下内容：所以这似乎很好。我的理解是，它本质上将使用引导程序来计算调查设计中感兴趣的统计数据。但是是否应用了 FPC？我建议不是的原因是因为如果您选择“subbootstrap”，代码 ...

Python - 如何对 2D 形状进行重采样？ - Python - How to resample a 2D shape?

我正在为一些几何数据操作编写 python 脚本（计算多驱动工业机器的运动轨迹）。一般来说，想法是有一个给定的形状（比方说 - 一个椭圆，但一般情况下它可以是任何凸形，用一系列二维点定义），它被旋转并且必须遵循它的最上面的切点。我对后一部分没有问题，但我需要一些关于 2D 形状准备的提示。假 ...

Python 按天重新采样并获取周开始数据 - Python resample by day & get weekstart data

我有月度数据。当我应用按天重采样和三次插值时，有一个函数可以找到月末数据现在我想要每周开始的数据，但我找不到这样的功能。我该如何解决这个问题？输入每月数据按天重新采样并使用三次插值后期望的输出是每周的星期一谢谢 ...

在 Rust 中使用 Polars 对时间序列进行重采样 - Resample time series using Polars in Rust

我正在尝试通过进行一些数据解析和重新使用我的一些交易工具来学习 rust，但很快就卡住了。我想将我的数据从 5 分钟重新采样到 15 分钟，而 Polars 似乎能够以优化的方式做到这一点。到目前为止，这是我的尝试。我设法将时间从 5 分钟分组到 15 分钟，但我无法全神贯注于如何将此分组应用 ...

从矩阵中重新采样（引导程序）数据，每行 x 绘制，每列绘制 y - Resample (bootstrap) data from matrix with x draws per row and y draws per column

我有一个包含 0 和 1 的矩阵。 ~30% 的样本是 1，我想估计这个百分比的置信区间（例如，“如果我对整个人口进行抽样，可能会有 28-32% 的“1”）。这样做你可以引导从样本中，（通过替换从自身重绘样本 N 次，并分析 1s 在所有重绘样本中的百分比分布）。但是我的数据在行和列内嵌套（高 ...

Audio resample 11025Hz to 48000Hz with ffmpeg 其他方式 - Audio resample 11025Hz to 48000Hz with ffmpeg of other ways

我有很多 11025Hz 8 位的 wav 文件，我喜欢重新采样到 48000Hz，因为我想增加高频。请问ffmpeg可以吗我发现了这个： https://ffmpeg.org/ffmpeg-resampler.html 但尚不清楚是否有用。请问ffmpeg能不能搞定效果好还是要找其他具体的软件 ...

在 Pandas 中创建新的 dataframe，将每小时数据和每小时温度读数扩展到刻钟间隔 - Create new dataframe in Pandas that expands hourly data and hourly temperature reading to quarter-hour intervals

编辑：我想通了： df_weather_test = df_weather df_weather_test['date_time'] = pd.to_datetime(df_weather['date_time']) df_weather_test2 = df_weather_test.res ...

重新采样数据以仅显示截至该月最后一天的数据 - Resampling data to show only data as of the last date of the month

我有类似的数据：日期一种乙 1/5/22 4个 5个 1/6/22 8个 3个 1/8/22 1个 5个 2/10/22 4个 8个 2/28/22 6个 4个 22/3/15 6个 0 22/3/21 0 0 22/3/25 5个 7 我只想保留月份最后一天的行，类似于以下 ...

Pandas：在给定时间（例如每一天）对插值时间序列数据进行采样的更简单方法 - Pandas: easier way to sample interpolated time series data at given times (e.g. every full day)

我经常遇到的问题是我有时间序列数据，我想在给定时间进行插值和重新采样。我有一个解决方案，但感觉就像“劳动密集型”，例如我想应该有一个更简单的方法。 Have a look for how I currently do it here: https://gist.github.com/cs224/ ...

GRASS GIS：执行 r.resamp.filter 时出错 - GRASS GIS: Error while executing r.resamp.filter

我想使用高斯滤波器将栅格从 15m 重新采样到 460m。目标我有一个我想缩小的粗糙图像。我也有一个很好的分辨率带来帮助缩小。我使用的缩减方法称为地理加权区域到点回归克里金法 (GWATPRK)。该方法包括两个步骤： GWR 和， GWR 残差上的 ATPK。为了使用栅格数据执行 GW ...

在匹配样本中成对引导 - Bootstrap in pair within a matched sample

嗨，我想通过引导匹配样本来比较治疗组和对照组之间的结果。该匹配样本是使用MatchIt提供的遗传匹配方法获得的。根据这篇论文 Austin, P. C., & Small, DS (2014)。使用无放回的倾向得分匹配时使用自举：一项模拟研究。医学统计，33（24），4306-431 ...

将一组 CT 扫描重新采样到相同的像素间距和体积大小的最快和最简单的方法是什么？ - What is the fastest and easiest way to resample a set of CT scans to same pixel spacing and volume size?

我必须从 kiTS 19 Challenge 提供的数据集开始训练一个 neural.net 来对肾脏和他的肿瘤进行语义分割。在这个数据集中，我有 100 个 CT 扫描作为训练集，在大小和像素间距方面有很大差异。通过研究 inte.net 上的几种方法，我发现确定一组唯一的像素间距是一种很好 ...

自举重采样方法的置信区间模拟问题 - Confidence intervals simulation problem with bootstrap resampling method

覆盖率是通过将包含参数真实值的区间数除以重复次数获得的。这里的覆盖率始终为 100。我会忽略什么？我以 95% 的信心工作，所以我应该得到这个数字的结果。我不明白为什么它是 100。你能帮忙吗？这对所有置信区间都有效。我的论文分析。如果你能帮忙，我会很高兴。我会在感谢部分写下你的名字 ...

在 SAS 中使用 PROC SURVEYSELECT 为重复单元创建唯一标签 - Create unique label for repeated units with PROC SURVEYSELECT in SAS

我需要从真实（集群）试验数据集中重新采样。到目前为止，我已在 SAS 中使用以下PROC SURVEYSELECT程序从试验中抽取 10 个集群进行替换，其中 50% 的集群来自控制组，50% 的集群来自治疗组。我重复这 100 次以获得 100 次复制，每个复制 10 个集群并且分配相等。 ...