簡體   English   中英

檢查一對一關系 R 腳本

[英]Checking one-to one relationship R script

我正在尋找一種檢查指定標簽表中一對一關系的好方法。 我有三種類型的標簽:主要標簽 (P) 和兩個次要標簽 (A) 和 (B) 在如下表格中:

P1 A1 B1

P1 A1 B2

P2 A2 B2

對於每個主標簽 (P) 可以存在多種類型的輔助標簽,我需要檢查它們是否具有一對一的關系。 也就是說,對於每個 P,每種類型的標簽 A 只能與一種類型的標簽 B 相關聯,反之亦然。 例如,在上面的玩具桌中,只有最后一行是好的。

現在,對於小表,檢查可以很容易地完成:按主標簽對表進行分組,然后對每個組再進行兩次分組:一次按輔助標簽 A,一次按 B。在一對一關系的情況下,每個子-group 的大小為 1。

問題是如果我需要遍歷巨大的表(數百萬或千萬行),這種方法會變得非常慢。 有什么好的方法可以加快這個過程?

正如 user2554330 所指出的,您可以按所有三個分組。 然后在一個大表中,添加一個計數元素,方便排序或過濾:

df <- df %>%
group_by(col1, col2, col3) %>%
summarise(count = n())

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM