簡體   English   中英

如何對這些數據執行簡單的線性回歸模型?

[英]How can I peform a simple linear regression model on this data?

所以我想創建一個線性回歸模型,將火箭價格(寫成火箭)與發射數據(數據)進行對比。 我相信我可以通過這樣做來做到這一點:lm(Y ~ X)。 但是,我如何才能將價格從 chr 轉換為 num,以及日期?

謝謝!

空間數據截圖

數據:https ://www.kaggle.com/agirlcoding/all-space-missions-from-1957

實際上,您是在問 3 個不同但非常基本的問題,閱讀介紹性文本比在 Stack Overflow 上發布問題會更好地學習這些問題。

  1. 如何將Rocket列的字符數據轉換為數字數據?

根據您使用的 R 版本,列spaceData$Rocket將是字符向量或因子向量。 要涵蓋這兩種可能性,您可以執行以下操作:

spaceData$Rocket <- as.numeric(as.character(spaceData$Rocket))

這將警告您產生了一些NA值。 沒關系 - 列中有一些空白單元格,所以您希望它們是NA

  1. 如何將列spaceData$Datum從文本轉換為實際日期時間?

在這種情況下,您可以使用strptime ,並指定日期字符串的格式。 我們還將把它包裝在as.POSIXct以確保數據的格式更易於繪制:

spaceData$Datum <- as.POSIXct(strptime(spaceData$Datum, "%a %b %d, %Y %H:%M"))
  1. 如何使用這兩個變量進行線性回歸?

在您嘗試線性回歸之前,最好確保進行線性回歸是明智的。 要使線性回歸有意義,您應該知道兩個變量之間存在近似線性關系,並且殘差近似正態分布。 檢查這些假設的一種簡單方法是繪制兩個變量:

plot(spaceData$Datum, spaceData$Rocket)

在此處輸入圖片說明

你不需要成為一名統計學家,就能看出通過這些點的任何直線作為關系的描述都將是毫無希望的。 如果我們嘗試一下,我們可以看到:

abline(lm(Rocket ~ Datum, data = spaceData), col = "red")

在此處輸入圖片說明

因此,通過對這些數據進行線性回歸,我們可以預測火箭的價格將在 2036 年 5 月 13 日降至零。顯然這是無稽之談。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM