cost 208 ms
如何將小計列添加到多級列 dataframe?

[英]How to add sub-total columns to a multilevel columns dataframe?

我有一個 dataframe,有 3 個級別的多索引列: 按級別 (0,2) 進行分組后,我得到以下小計 dataframe: 我需要將第二個插入第一個,而不打亂列、級別或索引,以便我得到以下 dataframe: 我該怎么做呢? ...

類似aj(asof join)的function如何返回給定日期之前右表中的所有記錄?

[英]How to return all records in the right table before the given date with a function similar to aj (asof join)?

在 DolphinDB 中, asof join返回右表中給定時間之前的最新記錄。 是否有類似於aj的 function ,但返回給定日期之前的所有先前記錄和 forms 一個新表? 我有以下兩個表,tb1 和 tb2。 在 tb2 中,日期列中的每個值都是一個月的第一天,每個目標(A、B 和 C ...

Pandas 合並判斷Value是否存在

[英]Pandas Merge to Determine if Value exists

我有一份清單表格數據進入電子表格,我試圖確定是否未檢查特定值並提供基於此的信息。 我的第一個想法是擁有一個主列表/df,其中所有表單值然后對每個響應進行左/右合並以確定不存在的值。 示例數據和腳本。 對於第二組中缺少的地址響應,期望nan/NA ,有 6 行而不是原來的 5 行。 ...

Pandas 將假人轉換為新列

[英]Pandas convert dummies to a new column

我有一個 dataframe 將客戶離散化為不同的 Q,它看起來像: 我想要做的是向 dataframe 添加一個新列 Q,它顯示該客戶所在的部門,因此它看起來像: 我能想到的唯一方法是使用 for 循環,但它會讓我一團糟。 還有其他方法嗎? ...

合並 Pandas Dataframe 中的行,填充 NaN 值並刪除重復項

[英]Merge rows in a Pandas Dataframe filling NaN values and removing duplicates

我正在嘗試清理包含帶有“重復”(但不完全重復)人員信息的臟數據的 Python Pandas dataframe 。 不幸的是,我沒有明確的“主鍵”,因為列id並不總是設置,而且我有一個不同名稱( name , name2 , name3 )的列表,它們並不總是匹配(有時我有相同的name但不同na ...

合並后在數據框中填充na值

[英]Fill na values in dataframe after merge

我有 2 個數據框,我想合並名字並聯系電子郵件,返回 df2 中的所有值。 數據樣本: 合並 合並的輸出 問題是由於兩個表中名稱和電子郵件之間的差異,某些行無法匹配,因此我想對名字和姓氏執行另一次合並以填充缺失的 nan 值。 我嘗試使用 combine_first 函數,但由於索引不同 ...

如何查看DF1中的id是否在過去30分鍾內出現在DF2中? 使用 Pandas

[英]How to check if id in DF1 appeared within the past 30 minutes in DF2? using Pandas

我有帶 customer_id、datetime 和 fruites 購買的 DF1,以及帶 customer_id、datetime 和 Veggies 購買的 DF2,如何檢查在購買水果的過去 30 分鍾內客戶是否購買了 Veggies? 客戶ID 購買日期水果項目 1個 2019-08-01 ...

Python:動態地從多列中選擇列值

[英]Python: Selecting column values from multiple columns dynamically

我有 2 個數據框。 第一個是匯總表,匯總了每個行業及其來源的准確性(按降序排列)。 在第二張表中,Source A 和 B 中有字符串列表,它們可以是空值: 對於每一行/公司,我應該 select 第一個具有最高精度的非空源,如下表所示: 例如,對於 company1 和 2,盡管它們都來自“化工 ...

識別導致兩個數據幀之間不匹配的列

[英]Identify columns which cause non match between two dataframes

我比較了兩個數據幀( df1和df2 ),對於給定的鍵組合,每個數據幀都應具有唯一的行。 這意味着Col1和Col2等鍵沒有重復項。 首先,我天真地確定哪些行不匹配 然后我想找出導致這種不匹配的列,考慮到唯一性鍵(?)。 因此,例如,要知道Col2導致與鍵Col1 = 'A'和Col3 = '2'不 ...

按日期更新另一個 DataFrame 中的值

[英]Update values in a DataFrame by values in another by date

我試圖制作一個代碼來輸入項目的版本。 有兩個數據框,一個包含項目,一個包含版本信息。 這是我制作的虛擬數據和代碼: 所以我嘗試的是這段代碼。 實際上這段代碼有效,但我認為它效率不高,因為它在大約 1~2 分鍾內給了我一個結果。 (200 個項目)。 ...

在 python 中使用 df.loc 時出現 AssertionError

[英]AssertionError when use df.loc in python

我創建了一個腳本來加載數據、檢查 NA 值並填充所有 NA 值。 這是我的代碼: 但它沒有用。 我檢查了我的代碼,發現這個問題來自 loc()。 例如: 我得到的是: 我不知道為什么 df[column_name] 可用,但 df.loc[index,columns_name] 是錯誤的。 你可以 ...

根據日期將位置映射到名稱 pandas DataFrame

[英]Mapping positions to names based on date in a pandas DataFrame

我有一個 DataFrame 的“職位”和“他們上任的日期”: 我想將 map 和position更改為不同cameToOfficeDate的員工姓名,但也基於position的commencementDate 。 比如CEO在2021年前是Bill,2021年后是Mark。 所以 output ...

將一個 dataframe 中的列值作為列表附加到另一個

[英]Appending column values from one dataframe to another as a list

我有幾十個非常相似的數據框。 我想要的是將每個列的所有“VALUE”列值組合到列表中,並返回一個 dataFrame,其中“VALUE”列由這些列表組成。 我只想對“PV”包含子字符串列表中的 substring 的行執行此操作。 我想出了一種我認為可行的方法,但它真的很討厭而且無論如何都不起作用( ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM