簡體 English 中英

熊貓矢量化方法來創建大小為n的組？

[英]Pandas vectorized way to create groups of size n?

原文 2019-06-05 13:32:28 6 1 python/ pandas/ numpy/ vectorization

假設我有一個龐大的形狀張量(samples, timesteps, features) ，但是我想將其展開以對Pandas執行groupby操作，如何以向量化的方式相應地標記每個n：n + size元素？ 解決速度慢：

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.normal(0, 1, 500))
df["sample"] = np.nan

n_timesteps = 50
n_samples = len(df) // n_timesteps

size = n_timesteps
for i in range(n_samples):
    id0 = i * n_timesteps
    id1 = i * n_timesteps + n_timesteps
    df.loc[id0:id1, "sample"] = i

1 個解決方案

通過整數除以index分配新列：

#default RangeIndex
df['sample'] = df.index // n_timesteps

或者通過創建一維數組numpy的arange ：

df['sample'] = np.arange(len(df)) // n_timesteps

排序熊貓數據框矢量化方式

[英]Sorting pandas dataframe vectorized way

熊貓矢量化方式來標記一系列 m*n 元素中第一個出現的值（m 個元素）

[英]Pandas vectorized way to tag first occurring value(m elements) in a series of m*n elements

Pandas - 從 groupby 操作的前 n 組創建新的 DataFrame

[英]Pandas - create a new DataFrame from first n groups of a groupby operation

更快（矢量化）的方式來執行此 pandas 公式與日期

[英]Faster (vectorized) way to do this pandas formula with dates

Pandas: Select 前n組

[英]Pandas: Select top n groups

用於將函數應用於數據框以創建列表的矢量化方式

[英]Vectorized way for applying a function to a dataframe to create lists

Python pandas：為組創建唯一標識符的快捷方式

[英]Python pandas:Fast way to create a unique identifier for groups

有沒有辦法在 PANDAS df 上以矢量化方式有條件地復制值？

[英]Is there a way to conditionally copy values in a vectorized way on a PANDAS df?

以矢量化方式將列添加到 Pandas DataFrame 以對其他列值進行調節

[英]Adding Column to pandas DataFrame in Vectorized way conditioning on other column values

在pandas中以矢量化方式計算特定連續相等值的數量

[英]Calculating the number of specific consecutive equal values in a vectorized way in pandas

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 排序熊貓數據框矢量化方式熊貓矢量化方式來標記一系列 m*n 元素中第一個出現的值（m 個元素） Pandas - 從 groupby 操作的前 n 組創建新的 DataFrame 更快（矢量化）的方式來執行此 pandas 公式與日期 Pandas: Select 前n組用於將函數應用於數據框以創建列表的矢量化方式 Python pandas：為組創建唯一標識符的快捷方式有沒有辦法在 PANDAS df 上以矢量化方式有條件地復制值？以矢量化方式將列添加到 Pandas DataFrame 以對其他列值進行調節在pandas中以矢量化方式計算特定連續相等值的數量

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM