cost 300 ms
我有一個數據集,我需要將一些列轉換為單個分類變量並連接多個真值

[英]I have a dataset where I need to convert some columns into single categorical variables & concatenating multi true values

我有一個具有唯一 ID 的數據集,其中的列每個 ID 都有幾個 bool 值。 因此,我需要將這些列轉換為連接多個真實布爾值的單個分類變量。 如果在提到的 bool ID 中有 3 個真值,我們將其分配給類別為“Win” ID BoolCol_1 BoolCol_2 BoolCol_3 B ...

需要根據 R 中的字符串值將分類變量重新分組為 5 組

[英]Need to regroup categorical variable into just 5 groups based on string value in R

我有一個超過 1000 個級別的分類變量。 我想將級別分組在一起,這樣我就可以降低維度,只有 5 個通用級別。 我想使用組名並將相似的值組合在一起。 例如,我想將包含“免疫”一詞的所有級別分組到一個名為“免疫組”的新組中。 我想將包含“眼睛”一詞的所有級別分組到一個名為“眼睛組”等的新組中。 我在 ...

格式化數據透視表的分類變量並鏈接到 Excel 中的其他數據

[英]Formatting categorical variables for pivot tables and linking to other data in Excel

Excel范例] 以上是我正在使用的數據集。 ^ 我正在使用數據透視表為此數據集創建一個交互式儀表板。 我有關於日期、縣和來電者類型(隸屬關系)的圖表。 我也想將呼叫查詢類別鏈接到此數據。 我需要將每個呼叫查詢類別的計數顯示在圖表中並與其他數據類型鏈接。 但是,由於呼叫查詢當前的格式(在單獨的列 ...

將多個分類列合並為一個,當每一行只有一個非 NaN 值時,在 Pandas

[英]Combine multiple categorical columns into one, when each row has only one non-NaN value, in Pandas

我有 給予 我想添加一個新的分類列,其中包含未排序的值 red、blue、hot、cold、warm、charm、strange,並適當填寫。 我有很多這樣的專欄,不只是三個。 一些可能性: astype(str)並連接然后重新創建一個分類使用union_categoricals創建一個新的分類 ...

將分類控制變量添加到 nlsLM 回歸

[英]Adding categorical control variables to nlsLM regression

我正在嘗試運行非線性最小二乘回歸來估計三個參數,同時控制分類變量。 為此,我目前正在使用 minpack.lm package 中的 nlsLM function。 我有以下數據集: 在接下來的 function 中,我正在估算參數 z、k 和 g。 變量“Y”、“Value”和“Amount”由我 ...

在ggplot2中加入不同美學的線條

[英]Join lines of different aesthetics in ggplot2

我正在嘗試解決以下問題:如何在 ggplot 中加入不同美學/組的線條並保持某個組的顏色。 最好查看下面的示例,以便更好地理解我的意思。 考慮以下代碼: 生成 plot: 我的問題是 ggplot 不會加入分組變量更改的行。 例如,我希望有一條紅線將最后一個藍點連接到第一個紅點。 解決此類問題的一 ...

使用 pandas 中的分類數據按月對數據進行分組

[英]Grouping data month-wise with Categorical data in pandas

如何從數據框在 pandas 中同時包含分類數據和數字數據的日期開始將數據分組為月份。 我嘗試了 groupby function 但我認為它不適用於分類數據。 分類列中有多個值。 樣本數據: 日期活動名稱 No_of_Male_Viewers No_of_Female_Viewers 2021 ...

如何用每個唯一值(隨機分類)的隨機數替換 Pandas 列中的值?

[英]How to replace values in Pandas column with random numbers per unique values (random categorical)?

我有一個 df 列,看起來像這樣: 此列是敏感數據。 我想用任何隨機數替換每個值,但每個隨機數應該在相同的 ID 中保持相同的數字。 例如,我想像這樣屏蔽列中的數據: 請注意,相同的 ID 具有相同的值。 我如何實現這一目標? 我有成千上萬的身份證。 ...

在 XGBoost 算法中使用分類變量預測器

[英]Using a Categorical Variable Predictor in XGBoost Algorithm

我正在嘗試在 xgboost 算法中使用分類預測器,但不斷出錯。 這是我的代碼的相關部分。df = data[["country_name", "Timestamp", "Flow Duration", "Flow IAT Min", "Src Port", "Tot Fwd Pkts", "Ini ...

如何從R中的多個列中選擇投票最多的類別

[英]How to choose the most voted category from multiple columns in R

我有一個需要使用 R 解決的分類問題,但老實說,我不知道該怎么做。 我有一張表(見下文),其中不同的樣本按三個 ML 模型(每列一個)分類,我需要為每個案例選擇“投票最多”的類別並將其寫入新列。 當前表 期望的輸出 我一直在閱讀 R 中的分類變量,但似乎任何東西都適合我的特定需求。 任 ...

根據獨立的分類列表對數據框進行排序。 嘗試使用類別,但有一些問題

[英]Order dataframe according to an independent categorical list. Trying to use categories, but having some issues

假設我有一個分類mtg_sets_order 。 我認為我現在可以使用這個分類來訂購不同的數據庫,例如: 期望這些項目遵循先前建立的順序。 顯然,這是不可能的,或者我在路上的某個地方做了一些愚蠢的事情。 編輯:為清楚起見,添加了我得到的錯誤,因為我的問題有點模糊。 ...

將一個單元格中的大量文本轉換為數值

[英]Convert lots of text in one cell into numeric values

我得到了一個數據集,其中有一列包含人們在 4 次以上的遭遇過程中為特定服務支付的方式。 在這一列中,一個單元格包含約 4 種患者以列表格式支付的方式(例如,信用卡、支票等)。 我想計算此列的模式(以獲取每個人最常使用的支付方法),為此我想將文本轉換為數字代碼並基於此計算模式。 我已經找到了很多方法 ...

如何重塑我的 df 並將一個分類列拆分為多個?

[英]How can I reshape my df and split one categorical column into several?

對於每個氣象站、每個氣候情景、每個 RCP 和每個變量,我都有單獨的 csv 數據。 附加數據后,它的示例如下所示: 例子: df_before 但是,我想將 value 列拆分到 var (tas, tasmin, tasmax, pr) 列,而不丟失來自 RCP 和站的信息: 這樣它看起來像 ...

Scikit 優化和離散變量

[英]Scikit optimize and discrete variables

scikit-optimize有兩個類用於定義變量類型:Integer 和 Categorical。 問題是 integer 空間 class 只處理真正的整數,而分類 class 不將值解釋為數字(不定義點之間的距離 - 根據數據)。 有沒有辦法將變量定義為離散值列表,例如 [1, 2, 4, ...

有沒有辦法在 seaborn 中為 hue 命令使用多個分類變量?

[英]Is there a way to use more than one categorical variable for the hue command in seaborn?

我正在嘗試創建我感興趣的變量的條帶圖,在 x 軸上按組分隔,並根據性別着色。 治療性別多變的葯品男性 0.24 葯品男性 -0.42 葯品男性 0.43 葯品男性 1.39 葯品男性 1.62 葯品女性 1.53 葯品女性 0.08 葯品女性 0.68 葯品女性 2.46 葯品女性 0.02 安慰 ...

如何按組獲取分類變量的百分比?

[英]How to get the percentage of categorical variables by group?

我有這個 dataframe A和B是獨立的組,C是一個類別變量,我想找到A組和B組的C的百分比。 C的類別太多了,所以我嘗試不使用虛擬變量來解決。 像這樣 如果沒有重疊組(例如,A = x,B = k),則它們不應包含在結果表中。 我為一組解決了這個問題,但我陷入了兩個獨立的組.. ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM