刪除 r 中數據集的重復列字符

Question

我是 r 的新手，我在刪除重復字符時遇到問題。

這是我的代碼：

library(RCurl)
x <- getURL("https://raw.githubusercontent.com/eparker12/nCoV_tracker/master/input_data/coronavirus.csv")
y <- read.csv(text = x)
z <- duplicated(y$jhuID)

我嘗試了類似 z <-... 的東西，但它沒有用。 對於jhuID中的 jhuID 列，它是 class character ，但是有很多國家的名稱重復多次，我的目標是刪除那些重復的國家名稱，並確保它只保留一次具有相同的 ZA2F2ED4F8EBC2CBBD4C2A character

例如，如果我通過y$jhuID查看數據，我將看到多次出現的所有國家/地區名稱。 我想要新的 dataframe 例如z當我查看z$jhulD時，我會看到每個國家的名稱只出現一次。

對此的任何幫助將不勝感激！ 提前致謝

Answer 1

具有 h distinct和arrange的選項

library(dplyr)
y %>%
     distinct(jhu_ID, .keep_all = TRUE) %>%
     arrange(jhu_ID)

刪除 r 中數據集的重復列字符

問題描述

1 個解決方案

解決方案1
1 已采納 2020-05-14 21:17:05

刪除 r 中數據集的重復列字符

問題描述

1 個解決方案

解決方案1 1 已采納 2020-05-14 21:17:05

解決方案1
1 已采納 2020-05-14 21:17:05