[英]How to add sub-total columns to a multilevel columns dataframe?
我有一個 dataframe,有 3 個級別的多索引列: 按級別 (0,2) 進行分組后,我得到以下小計 dataframe: 我需要將第二個插入第一個,而不打亂列、級別或索引,以便我得到以下 dataframe: 我該怎么做呢? ...
[英]How to add sub-total columns to a multilevel columns dataframe?
我有一個 dataframe,有 3 個級別的多索引列: 按級別 (0,2) 進行分組后,我得到以下小計 dataframe: 我需要將第二個插入第一個,而不打亂列、級別或索引,以便我得到以下 dataframe: 我該怎么做呢? ...
[英]How to return all records in the right table before the given date with a function similar to aj (asof join)?
在 DolphinDB 中, asof join返回右表中給定時間之前的最新記錄。 是否有類似於aj的 function ,但返回給定日期之前的所有先前記錄和 forms 一個新表? 我有以下兩個表,tb1 和 tb2。 在 tb2 中,日期列中的每個值都是一個月的第一天,每個目標(A、B 和 C ...
[英]Pandas Merge to Determine if Value exists
我有一份清單表格數據進入電子表格,我試圖確定是否未檢查特定值並提供基於此的信息。 我的第一個想法是擁有一個主列表/df,其中所有表單值然后對每個響應進行左/右合並以確定不存在的值。 示例數據和腳本。 對於第二組中缺少的地址響應,期望nan/NA ,有 6 行而不是原來的 5 行。 ...
[英]Pandas convert dummies to a new column
我有一個 dataframe 將客戶離散化為不同的 Q,它看起來像: 我想要做的是向 dataframe 添加一個新列 Q,它顯示該客戶所在的部門,因此它看起來像: 我能想到的唯一方法是使用 for 循環,但它會讓我一團糟。 還有其他方法嗎? ...
[英]Merge rows in a Pandas Dataframe filling NaN values and removing duplicates
我正在嘗試清理包含帶有“重復”(但不完全重復)人員信息的臟數據的 Python Pandas dataframe 。 不幸的是,我沒有明確的“主鍵”,因為列id並不總是設置,而且我有一個不同名稱( name , name2 , name3 )的列表,它們並不總是匹配(有時我有相同的name但不同na ...
[英]Change columns to rows per student ID
我在 excel 表中有數據,我正在讀入數據框: ID 年級 課程 Q1 號碼 Q1 信 Q2 編號 Q2 信 1 9 英語 73 ...
[英]Can you group multiple rows all into one row by column value with Python using pandas?
我該如何改變這個: 日期 網址 描述 類別 2022-06-17 14:24:52 /XYBkLO 上市 一個 2022-06-17 14:24:52 ...
[英]Fill na values in dataframe after merge
我有 2 個數據框,我想合並名字並聯系電子郵件,返回 df2 中的所有值。 數據樣本: 合並 合並的輸出 問題是由於兩個表中名稱和電子郵件之間的差異,某些行無法匹配,因此我想對名字和姓氏執行另一次合並以填充缺失的 nan 值。 我嘗試使用 combine_first 函數,但由於索引不同 ...
[英]Python Pandas Dataframe - Best Join and filter condition
輸入: 時間從到 2/2/22 X 是 2/2/22 是 X 2/2/22 X 是 2/2/22 一種乙 2/2/22 P 問 2/3/22 問 P 2/2/22 C 丁 2/3/22 是 X Output: 時間從到時間從到 2/2/22 X 是 2/2/22 是 X 2/2/2 ...
[英]how to merge Two datasets with different time ranges?
我有兩個如下所示的數據集: df1 : 日期 城市 狀態 數量 2019-01 芝加哥 伊利諾伊州 35 2019-01 奧蘭多 ...
[英]Merge 2 dataframes with same column headers creating subheaders
我有 2 個數據框與 Covid-19 有關 和 我想以 dataframe 結束,它是兩者的組合,就像這樣, 我假設您可以對數據幀進行一些奇特的合並,但我無法鍛煉您的操作方式。 ...
[英]How to check if id in DF1 appeared within the past 30 minutes in DF2? using Pandas
我有帶 customer_id、datetime 和 fruites 購買的 DF1,以及帶 customer_id、datetime 和 Veggies 購買的 DF2,如何檢查在購買水果的過去 30 分鍾內客戶是否購買了 Veggies? 客戶ID 購買日期水果項目 1個 2019-08-01 ...
[英]Python: Selecting column values from multiple columns dynamically
我有 2 個數據框。 第一個是匯總表,匯總了每個行業及其來源的准確性(按降序排列)。 在第二張表中,Source A 和 B 中有字符串列表,它們可以是空值: 對於每一行/公司,我應該 select 第一個具有最高精度的非空源,如下表所示: 例如,對於 company1 和 2,盡管它們都來自“化工 ...
[英]Merge two DataFrames by combining duplicates and concatenating nonduplicates
我有兩個數據框: 我想合並的方式是列“A”在 DataFrame 之間添加不同的值,但合並重復項。 所需的 output: ...
[英]Identify columns which cause non match between two dataframes
我比較了兩個數據幀( df1和df2 ),對於給定的鍵組合,每個數據幀都應具有唯一的行。 這意味着Col1和Col2等鍵沒有重復項。 首先,我天真地確定哪些行不匹配 然后我想找出導致這種不匹配的列,考慮到唯一性鍵(?)。 因此,例如,要知道Col2導致與鍵Col1 = 'A'和Col3 = '2'不 ...
[英]How merge or join data in a Pandas nested DataFrame
我試圖弄清楚如何在 DataFrame 中的嵌套字段上執行合並或加入。下面是一些示例數據:df_all_groups = pd.read_json(""" [ { "object": "group", "id": "group-one", "c ...
[英]Update values in a DataFrame by values in another by date
我試圖制作一個代碼來輸入項目的版本。 有兩個數據框,一個包含項目,一個包含版本信息。 這是我制作的虛擬數據和代碼: 所以我嘗試的是這段代碼。 實際上這段代碼有效,但我認為它效率不高,因為它在大約 1~2 分鍾內給了我一個結果。 (200 個項目)。 ...
[英]AssertionError when use df.loc in python
我創建了一個腳本來加載數據、檢查 NA 值並填充所有 NA 值。 這是我的代碼: 但它沒有用。 我檢查了我的代碼,發現這個問題來自 loc()。 例如: 我得到的是: 我不知道為什么 df[column_name] 可用,但 df.loc[index,columns_name] 是錯誤的。 你可以 ...
[英]Mapping positions to names based on date in a pandas DataFrame
我有一個 DataFrame 的“職位”和“他們上任的日期”: 我想將 map 和position更改為不同cameToOfficeDate的員工姓名,但也基於position的commencementDate 。 比如CEO在2021年前是Bill,2021年后是Mark。 所以 output ...
[英]Appending column values from one dataframe to another as a list
我有幾十個非常相似的數據框。 我想要的是將每個列的所有“VALUE”列值組合到列表中,並返回一個 dataFrame,其中“VALUE”列由這些列表組成。 我只想對“PV”包含子字符串列表中的 substring 的行執行此操作。 我想出了一種我認為可行的方法,但它真的很討厭而且無論如何都不起作用( ...