cost 333 ms
在 Pandas 中创建自定义大小的日期时间系列容器 - Create custom sized bins of datetime Series in Pandas

我有多个 Pandas 系列的 datetime64 值,我想使用任意 bin 大小将它们分组。 我找到了Series.to_period() function,它完全符合我的要求,只是我需要更多地控制所选的 bin 大小。 to_period允许我按整年、月、日等进行分类,但我也想按 5 年、6 ...

以比时间戳更高的频率提取数据值 - Extract data values at a higher frequency than time stamps

我有连续的行为数据,其中包含受试者改变行为时的时间戳以及每个行为是什么,我需要提取每分钟的瞬时行为,从第一个行为开始的第二秒开始:如果行为从 17:34 开始: 06,我将下一分钟定义为 17:35:06。 我还计算了每个行为的持续时间。 这是我的数据的样子: 我已经使用cut()将每一行放入它所在 ...

渐变填充颜色与 ggplot2 中的 geom_hexbin 中的 bin 计数映射不准确 - Inaccurate mapping of gradient fill colours with bin counts in `geom_hexbin` in `ggplot2`

我正在尝试使用ggplot2对 plot 进行分箱散点 plot,如下所示。 当我使用geom_hexbin时,容器中的计数未准确映射到梯度比例。 例如,计数为 5809 和 5556 的 bin 仍显示为蓝色。 但是,对于geom_bin_2d ,映射似乎是准确的 这里出了什么问题? 如何在 ...

如何使用 group_by() |> tally() 对 integer 列进行分箱并显示所有分箱,即使其中没有值? - How to bin an integer column with group_by() |> tally() and show all bins, even if no values in them?

我想对 integer 列进行分类并计算每个分类中有多少个值。 我有一个可行的解决方案,但它有局限性,因为它不会显示其中没有值的垃圾箱。 考虑mtcars中的hp列。 我想按40的间隔将它装箱,以获得所需的 output:# desired output # +────────+────────+ ...

使用 np.select 更改 Pandas 列中的混合数据类型(int 和 str) - Using np.select to change mix data types (int and str) in a Pandas column

我一直在尝试将我的 df 中的一列 map 分为 4 个类别(合并)但是,该列中包含混合值:int 和 str,它看起来像这样: 我一直试图将它们更改为的类别: 这就是我一直试图解决这个问题的方式: 但是,我收到此错误: ValueError: shape mismatch: objects ca ...

在 ggplot 中为有间隙的数据创建自定义(等间距)箱 - Create custom (equally spaced) bins in ggplot for data with gaps

我的数据在值的“集群/组”之间存在很大程度的分离,我希望用这些数据制作直方图,但是将箱分成大小相等的组一直很困难。 我希望零 (0) 拥有自己的垃圾箱,等间距垃圾箱的总数小于 8(理想情况下,以避免拥挤地块),额外的空垃圾箱用于“...”,表示中的大间隙-在数据值之间。 实际数据集有 800+ 个零 ...

如何获取 col c 中值的平均值,在基于 col b 的 bin 中,在 col a 中定义的组中 - how to get mean of values in col c, in bins based on col b, in a group defined in col a

我有一个 pandas dataframe 有数万行和大约 15 列,其中五个如下所示。 与每个 RELATEID 位置关联的数据是具有 POINT_TOP 值的点,其潜在范围为 96 到 495(每个位置不同),增量为 1,并且每个点的关联 kclass 为 1、2 或 3。需要做的是按 RELA ...

使用 binning 将列从浮点数据类型转换为分类数据类型 - Converting columns from float datatype to categorical datatype using binning

我希望转换由两列组成的数据框。 这是示例df: Output: 两列都是浮动的,我希望使用分箱将它们转换为分类。 我希望在转换为分类时为每列创建以下箱。 数字箱:18-24、25-44、45-65、66-92 成本列的 bin:>=1000,<1000 最后,我不想创建新列,而只是转换 ...

cut() 中的换档中断 R function - Shifting breaks in the cut() R function

我有一系列介于 0 和 360 之间的值,我想将它们分成几组,每次垃圾箱移动一点。 我想用 R 编程语言来做这件事。 例如: 接下来,我想保持箱子大小相同,l,但将它们移动两个单位。 这意味着我的休息时间从 2 开始,到 362 结束。但是,当我剪切数据时,我在 0 和 2 之间的值被标记为 NA ...

scipy.stats.binned_statistic map 如何将 bin 边缘序列与将在其上计算统计数据的数据? - How does scipy.stats.binned_statistic map the sequence of bin edges to the data on which the statistic will be computed?

从文档中获取以下示例: bin_means 中的第一个值(在这种情况下实际上是计算中位数)是 0.46506315,这是数组boatspeed 中的第 175 个值。 我真的很困惑这种方法如何获取箱数组并将其映射到值向量(在这种情况下为船速)。 第 175 个条目如何属于从“1”开始并以“2”结 ...

我需要将一列值放入分类箱中 - I need to place a column of values into categorical bins

我正在清理关于苹果的 dataframe。 我应该将“年龄”列中的值放入分类箱中。 但是,当我开始将值实际放入箱中、标记它们等时。要么我的所有值都归入第一类(代码 1),要么它似乎删除了每个不适合第一类的值垃圾箱(代码 2)。 试试 1 试试 2 我尝试格式化此代码的任何其他方式都会给我类型错误“' ...

从 pandas binner 中删除 nan - Remove nan from pandas binner

我创建了以下 pandas dataframe 称为train : dataframe 看起来像这样: 然后,我使用以下代码对名为og_max_max_dpd的列进行了分箱: 我打印了如下所示的binner : 我想从该列表中删除 nan ,以便 binner 看起来像这样: 有谁知道如何删除n ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM