提取多個字符串的相同開頭部分

Question

我有多個這樣的字符串（所謂的 DOI）：

doi1 <- "10.1057/bp.2009.9"
doi2 <- "10.1057/bp.2015.4"
doi3 <- "10.1057/bp.2008.12"

如何最好地提取字符串的共同開頭？

正確的 output 應該是10.1057/bp.20 。

（我的第一個猜測是使用 same identical() ，但是 function 只能比較兩個完整的字符串）

Answer 1

package ' Biobase ' 已將其實現為lcPrefix 。

但是自己實現這一點並不難。 這是另一個快速而骯臟的版本（小心，這僅在少數情況下進行了測試）：

find_longest_prefix = function (strings) {
    stopifnot(is.character(strings) && length(strings) > 0L)

    for (len in seq_len(nchar(strings[1L]))) {
        prefixes = substr(strings, 1L, len)
        if (! Reduce(\(prev, p) prev && p == prefixes[1L], prefixes[-1L], TRUE)) {
            len = len - 1L
            break
        }
    }
    substr(strings[1L], 1L, len)
}

提取多個字符串的相同開頭部分

問題描述

1 個解決方案

解決方案1
0 已采納 2022-01-12 14:04:40

提取多個字符串的相同開頭部分

問題描述

1 個解決方案

解決方案1 0 已采納 2022-01-12 14:04:40

解決方案1
0 已采納 2022-01-12 14:04:40