簡體   English   中英

我不明白為什么 R 認為我的數據集在我的數據集中包含元素對重復項?

[英]I can't figure out why R thinks that my dataset contains element pair duplicats in my dataset?

當我運行如下所示的固定效果回歸時,我收到一條錯誤消息,指出我的數據集中有重復項。 這是錯誤:“pdim.default(索引[ 1 ],索引[[2]])中的錯誤:重復的情侶(id-time)”!

fe_distance <- plm(total_trip_distance ~ apparentTemperature+summary+AREA+POPULATION+bar+nightclub+hospital+social_facility, data = regression1, model= "within", index=c("ZIPCODE", "time"))

這是我的數據框的圖像

為了形成我按 ZIPCODE 和時間分組的數據集,所以我不明白我怎么可能在元素中得到重復項。 我在想這可能是因為變量存儲的變量類型,但是改變它似乎並不能解決我的錯誤。

任何建議將不勝感激!

您可以通過sum(duplicated(regression1[,c('ZIPCODE','time')]))檢查郵政編碼和時間之間的任何重復配對。 如果這大於 0,那么您確實有重復,並且應該檢查原始數據中是否有任何意外(或可能導致分組步驟的任何錯誤)。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM