簡體   English   中英

在R中使用不同的規范化方法

[英]Using different normalization methods in R

大約6個月前,我使用名為Predixion的軟件運行了k均值聚類算法。 我寫了一個R腳本,希望可以從Predixion復制相同的結果。 但是,結果卻大不相同。 我相信結果會有所不同,因為我們對數據進行了標准化。 我需要能夠為每列使用不同的規范化方法。

account = c("A","B","C", "D","E")
var_num1= c(67,69,71,33,19)
var_num2= c(7175,12018, 6075, 3128, 4002)
var_percent= c(.22,.57,.33,.87,.62)
df = data.frame(account, var_num1,var_num2, var_percent)

我想在“ var_num1”列上使用日志規范化。 我想對“ var_num2”和“ var_percent”列使用最小/最大規范化。

謝謝你的幫助。

你有沒有嘗試過:

df$var_num1 <- scale(df$var_num1)

這將獲取一列的值並縮放它們。 使用其他列和不同的縮放方法可以完成相同的操作。

編輯:
最小/最大規格化的一種可能性:

df$var_num1_minmax <- lapply(df$var_num1, function(x) (x-min(df$var_num1))/(max(df$var_num1)-min(df$var_num1)))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM