簡體   English   中英

刪除 r 中數據集的重復列字符

[英]Removing duplicated column characters of dataset in r

我是 r 的新手,我在刪除重復字符時遇到問題。

這是我的代碼:

library(RCurl)
x <- getURL("https://raw.githubusercontent.com/eparker12/nCoV_tracker/master/input_data/coronavirus.csv")
y <- read.csv(text = x)
z <- duplicated(y$jhuID)

我嘗試了類似 z <-... 的東西,但它沒有用。 對於jhuID中的 jhuID 列,它是 class character ,但是有很多國家的名稱重復多次,我的目標是刪除那些重復的國家名稱,並確保它只保留一次具有相同的 ZA2F2ED4F8EBC2CBBD4C2A character

例如,如果我通過y$jhuID查看數據,我將看到多次出現的所有國家/地區名稱。 我想要新的 dataframe 例如z當我查看z$jhulD時,我會看到每個國家的名稱只出現一次。

對此的任何幫助將不勝感激! 提前致謝

具有 h distinctarrange的選項

library(dplyr)
y %>%
     distinct(jhu_ID, .keep_all = TRUE) %>%
     arrange(jhu_ID)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM