[英]How can I peform a simple linear regression model on this data?
所以我想創建一個線性回歸模型,將火箭價格(寫成火箭)與發射數據(數據)進行對比。 我相信我可以通過這樣做來做到這一點:lm(Y ~ X)。 但是,我如何才能將價格從 chr 轉換為 num,以及日期?
謝謝!
數據:https ://www.kaggle.com/agirlcoding/all-space-missions-from-1957
實際上,您是在問 3 個不同但非常基本的問題,閱讀介紹性文本比在 Stack Overflow 上發布問題會更好地學習這些問題。
Rocket
列的字符數據轉換為數字數據? 根據您使用的 R 版本,列spaceData$Rocket
將是字符向量或因子向量。 要涵蓋這兩種可能性,您可以執行以下操作:
spaceData$Rocket <- as.numeric(as.character(spaceData$Rocket))
這將警告您產生了一些NA
值。 沒關系 - 列中有一些空白單元格,所以您希望它們是NA
。
spaceData$Datum
從文本轉換為實際日期時間? 在這種情況下,您可以使用strptime
,並指定日期字符串的格式。 我們還將把它包裝在as.POSIXct
以確保數據的格式更易於繪制:
spaceData$Datum <- as.POSIXct(strptime(spaceData$Datum, "%a %b %d, %Y %H:%M"))
在您嘗試線性回歸之前,最好確保進行線性回歸是明智的。 要使線性回歸有意義,您應該知道兩個變量之間存在近似線性關系,並且殘差近似正態分布。 檢查這些假設的一種簡單方法是繪制兩個變量:
plot(spaceData$Datum, spaceData$Rocket)
你不需要成為一名統計學家,就能看出通過這些點的任何直線作為關系的描述都將是毫無希望的。 如果我們嘗試一下,我們可以看到:
abline(lm(Rocket ~ Datum, data = spaceData), col = "red")
因此,通過對這些數據進行線性回歸,我們可以預測火箭的價格將在 2036 年 5 月 13 日降至零。顯然這是無稽之談。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.