在R中自動查找和轉換值

Question

我有一個包含45行的樣本數據集，如下所示。

 itemid                    title release_date
16    573          Body Snatchers          1993
17    670          Body Snatchers          1993
41   1645        Butcher Boy, The          1998
42   1650        Butcher Boy, The          1998
1     218               Cape Fear          1991
18    673               Cape Fear          1962
27   1234   Chairman of the Board          1998
43   1654   Chairman of the Board          1998
2     246             Chasing Amy          1997
5     268             Chasing Amy          1997
11    309                Deceiver          1997
37   1606                Deceiver          1997
28   1256 Designated Mourner, The          1997
29   1257 Designated Mourner, The          1997
12    329      Desperate Measures          1998
13    348      Desperate Measures          1998
9     304           Fly Away Home          1996
15    500           Fly Away Home          1996
26   1175               Hugo Pool          1997
39   1617               Hugo Pool          1997
31   1395       Hurricane Streets          1998
38   1607       Hurricane Streets          1998
10    305          Ice Storm, The          1997
21    865          Ice Storm, The          1997
4     266      Kull the Conqueror          1997
19    680      Kull the Conqueror          1997
22    876             Money Talks          1997
24    881             Money Talks          1997
35   1477              Nightwatch          1997
40   1625              Nightwatch          1997
6     274                 Sabrina          1995
14    486                 Sabrina          1954
33   1442     Scarlet Letter, The          1995
36   1542     Scarlet Letter, The          1926
3     251         Shall We Dance?          1996
30   1286         Shall We Dance?          1937
32   1429           Sliding Doors          1998
45   1680           Sliding Doors          1998
20    711  Substance of Fire, The          1996
44   1658  Substance of Fire, The          1996
23    878          That Darn Cat!          1997
25   1003          That Darn Cat!          1997
34   1444          That Darn Cat!          1965
7     297             Ulee's Gold          1997
8     303             Ulee's Gold          1997

我想做的是根據電影名稱以及電影的發行日期是否相同來轉換itemid。 例如，電影“ Ulee's Gold”的兩個項目ID為297和303。我正在嘗試尋找一種方法來自動檢查電影的發行日期，如果相同，該電影的itemid [2]應該為替換為itemid [1]。 目前，我已經通過將itemid提取為兩個向量x和y，然后使用矢量化更改它們來手動完成了操作。 我想知道是否有更好的方法來完成此任務，因為只有18部具有多個ID的電影，而數據集卻只有幾百部。 手動查找和處理此過程非常耗時。

我提供了用於完成此任務的代碼。

x <- c(670,1650,1654,268,1606,1257,348,500,1617,1607,865,680,881,1625,1680,1658,1003,303)
y<- c(573,1645,1234,246,309,1256,329,304,1175,1395,305,266,876,1477,1429,711,878,297)


for(i in 1:18)
{
  df$itemid[x[i]] <- y[i]

}

有沒有更好的方法來完成此任務？

Answer 1

我認為您可以直接在dplyr執行此dplyr ：

使用上面的評論，一個簡單的示例：

itemid <- c(878,1003,1444,297,303)
title <- c(rep("That Darn Cat!", 3), rep("Ulee's Gold", 2))
year <- c(1997,1997,1965,1997,1997)

temp <- data.frame(itemid,title,year)
temp

library(dplyr)

temp %>% group_by(title,year) %>% mutate(itemid1 = min(itemid))

（由於某種原因，我將'release_date'更改為'year'……但是這基本上將標題/年份分組在一起，搜索最小的itemid，然后mutate創建了一個具有最低的'itemid'的新變量。

這使：

#  itemid          title year itemid1
#1    878 That Darn Cat! 1997     878
#2   1003 That Darn Cat! 1997     878
#3   1444 That Darn Cat! 1965    1444
#4    297    Ulee's Gold 1997     297
#5    303    Ulee's Gold 1997     297

在R中自動查找和轉換值

問題描述

1 個解決方案

解決方案1
0 已采納 2015-01-28 20:01:06

在R中自動查找和轉換值

問題描述

1 個解決方案

解決方案1 0 已采納 2015-01-28 20:01:06

解決方案1
0 已采納 2015-01-28 20:01:06