cost 448 ms
Pandas 條件連接和計算

[英]Pandas conditional join and calculation

我有兩個 Pandas 數據框,df_stock_prices 和 df_sentiment_mean。 我想做以下事情: 將這兩個數據框左連接/合並為一個 dataframe,由 Date 和 ticker 連接。 在 df_stock_prices 中,ticker 是列名稱,例如 AAPL.O ...

使用 apply 在 N 個數據集列表中的每個數據集的頂部添加一個(固定的)新行

[英]Adding a (fixed) new row to the top of each dataset in a list of N datasets using apply

我有 N 個數據集,它們被加載到 RStudio 並存儲在列表 object“數據集”中。 問題是我想成為他們每個人的第一行或他們每個人的標題,無論哪種方式都在他們的第三行。 我發布的這個問題的初始版本只有下面的段落描述了 N 個數據集的每一個是什么樣子,但我意識到這還不夠簡單,所以現在我在下面添加 ...

如何將等效的標准子設置操作應用於數據幀列表而不是單個 dataframe

[英]How to apply the equivalent of standard sub setting operations but to a list of dataframes instead of to a single dataframe

我在一個文件夾中有一組 40 個不同的數據集,這些數據集已加載到 RStudio 中的 WorkSpace 中,其中包含: 這個 object 數據集是一個包含 40 個數據幀的列表。 當 object 是單個 dataframe 時,我想運行與以下代碼行相同的代碼: 從那里,我同樣想找到方法來找 ...

Pandas groupby后其他列出現次數直方圖

[英]Pandas histogram of number of occurences of other columns after groupby

我有一個 dataframe: 我需要生成一個 plot 的“每 <Batch_ID,分鍾> 的不同代碼數量”的直方圖。請注意,“代碼”可能多次出現,但應在唯一之后采用。 所以在這種情況下,一些條目將是: 如何做呢? ...

通過不同的標准合並不同維度的數據幀

[英]Joining dataframes of different dimensions with varying merge by criterion

晚上好,我正在嘗試合並幾個數據集,而我在 R 中的常規工具今晚讓我失望了。 考慮下面的 df1 和 df2。 在這兩種情況下,a 列和 b 列都應該充當分組變量。 例如,在df1中,當a = a且b = 1時,則c = x。 鑒於我正在處理的數據結構,a 和 b 的實際順序並不重要,如果 a = 1 ...

Pandas dataframe 刪除基於另一列值的重復項

[英]Pandas dataframe drop duplicates based in another column value

我有一個 dataframe 重復: 當有重復時,總是在我想用鍵(timestamp,id,ch) drop_duplicates但保留is_eval為 True 的行時。 意思是,如果有一行is_eval==True則保留它。 否則,沒關系。 所以這里的output應該是: 我該怎么做? ...

基於來自另一個數據框的其他列創建新列

[英]Creating a new column based on other columns from another dataframe

我有2個數據框: df1 df2 我想在 df2 中創建一個名為Total的新列,它是 df1 中每個用戶的所有列的列表,乘以該用戶的因子 - 只有當它們在 A 類中時才應該這樣做。 這就是最終 df 的樣子 df2 這是我嘗試過的: ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM