如何從R中的名稱列表中查找唯一的名稱/字符

Question

我有很多公司名稱。 如下圖所示，如果名稱公司為ABBEYCREST.DEAD ... 10.10.14 ... ASK.PRICE，則表示ABBEYCREST.DEAD ... 10.10.14 ...為公司名稱，而ASK.PRICE為ASK價格數據當以BID.PRICE結尾時，表示其BID PRICE數據。 我想識別在數據框中只有一個列名稱可用的公司。 其實我有一個數據框，具有如下所示的列標題，這意味着每個公司應該有2列，如果有4000家公司，那么我的數據框中應該有8000列，但是我有7999個（盡管我的數據框有一個日期列，但我排除了當我計算列時）。

df<-AskBid

    ABBEYCREST.DEAD...10.10.14...ASK.PRICE
    ABBEYCREST.DEAD...10.10.14...BID.PRICE
    ABBOT.GROUP.DEAD...07.03.08...ASK.PRICE
    ABBOT.GROUP.DEAD...07.03.08...BID.PRICE
    ABERDEEN.ASSET.MAN..FULLY.PAID.23.09.05...ASK.PRICE
    ABERDEEN.ASSET.MAN..FULLY.PAID.23.09.05...BID.PRICE
    ABERDEEN.ASSET.MAN..NIL.PAID.23.09.05...ASK.PRICE
    ABERDEEN.ASSET.MAN..NIL.PAID.23.09.05...BID.PRICE
    ABERDEEN.FTBL.CLUB.DEAD...DEAD.04.08.03...ASK.PRICE
    ABERDEEN.FTBL.CLUB.DEAD...DEAD.04.08.03...BID.PRICE
    ABERTIS..IRS....BID.PRICE
    ABGENIX..IRS..DEAD...12.11.07...ASK.PRICE
    ABGENIX..IRS..DEAD...12.11.07...BID.PRICE
    ABLON.GROUP.DEAD...31.05.13...ASK.PRICE
    ABLON.GROUP.DEAD...31.05.13...BID.PRICE
    ACAMBIS.DEAD...25.09.08...ASK.PRICE
    ACAMBIS.DEAD...25.09.08...BID.PRICE

我想找到的是

missing <- df
ABERTIS..IRS....BID.PRICE

我將衷心感謝您的幫助。 這在我的估計中引起問題。

Answer 1

您可以刪除ASK.PRICE和BID.PRICE部分，並duplicated調用兩次（按相反的順序第二次調用）：

cn <- readLines(textConnection(
"ABBEYCREST.DEAD...10.10.14...ASK.PRICE
ABBEYCREST.DEAD...10.10.14...BID.PRICE
ABBOT.GROUP.DEAD...07.03.08...ASK.PRICE
ABBOT.GROUP.DEAD...07.03.08...BID.PRICE
ABERDEEN.ASSET.MAN..FULLY.PAID.23.09.05...ASK.PRICE
ABERDEEN.ASSET.MAN..FULLY.PAID.23.09.05...BID.PRICE
ABERDEEN.ASSET.MAN..NIL.PAID.23.09.05...ASK.PRICE
ABERDEEN.ASSET.MAN..NIL.PAID.23.09.05...BID.PRICE
ABERDEEN.FTBL.CLUB.DEAD...DEAD.04.08.03...ASK.PRICE
ABERDEEN.FTBL.CLUB.DEAD...DEAD.04.08.03...BID.PRICE
ABERTIS..IRS....BID.PRICE
ABGENIX..IRS..DEAD...12.11.07...ASK.PRICE
ABGENIX..IRS..DEAD...12.11.07...BID.PRICE
ABLON.GROUP.DEAD...31.05.13...ASK.PRICE
ABLON.GROUP.DEAD...31.05.13...BID.PRICE
ACAMBIS.DEAD...25.09.08...ASK.PRICE
ACAMBIS.DEAD...25.09.08...BID.PRICE"))

## remove (ASK|BID).PRICE
cn.sub <- gsub("(ASK|BID)\\.PRICE$", "", cn)

cn[!(duplicated(cn.sub) | rev(duplicated(rev(cn.sub))))]
# [1] "ABERTIS..IRS....BID.PRICE"

Answer 2

這是另一種解決方案，假設文本是讀入的數據框中的列名：

library(dplyr)
df$text <- gsub(("(ASK|BID)", "", df$text)
df %>% group_by(text) %>% filter(n() != 2)

如何從R中的名稱列表中查找唯一的名稱/字符

問題描述

2 個解決方案

解決方案1
2 已采納 2016-01-03 18:31:58

解決方案2
0 2016-01-03 22:36:55

如何從R中的名稱列表中查找唯一的名稱/字符

問題描述

2 個解決方案

解決方案1 2 已采納 2016-01-03 18:31:58

解決方案2 0 2016-01-03 22:36:55

解決方案1
2 已采納 2016-01-03 18:31:58

解決方案2
0 2016-01-03 22:36:55