[英]Correlation Matrix in R with Non-numeric Data
我正在尋找在包含數字和非數字數據的名為“航班”的數據集上使用cor()
創建一個相關矩陣。 我已經使用createDataPartition()
對數據進行了分區。
# create a data partition
flights_sampling_vector <- caret::createDataPartition(flights$delay, p = 0.8, list = FALSE, times = 1)
flights_train <- flights[flights_sampling_vector]
flights_test <- flights[-flights_sampling_vector]
flights_matrix=cor(flights, y=NULL)
cor(flights,y = NULL)中的錯誤:“ x”必須為數字
我的原則問題是cor()
函數不允許數字數據。
如何使用包含數字和非數字數據的數據創建相關矩陣?
我將簽出dplyr :: select_if()來對數字列進行子集化,然后為這些列計算相關矩陣。
library(tidyverse)
library(caret)
flights_matrix <- flights %>%
select_if(is.numeric) %>%
cor(.)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.