簡體   English   中英

從列中提取數據以在R中創建另一個列

[英]Extract data from a column to create another column in R

我有一個包含3個變量的數據框,我想將其分為4個變量。 數據框如下所示:

Species_Name    SIXTEENS_Title                           SIXTEENS_Sequence
Daphnia magna   LC382445.1 Daphnia magna mitochondrial   TTCGGAGAAAAGGGGTAC...
Daphnia magna   KY694374.1 Daphnia magna mitochondrial   TTCGGAGAAAAGGGGTAC...

從這個數據框的SIXTEENS_Title ,我想提取Daphnia之前的所有內容(字母數字LC382445.1,KY694374.1;但是有100多個觀察值不同)。

我試過使用str_extract()str_detect()但似乎無法做到這一點。 我想使用登錄號(LC382445.1)在R中創建另一列。

您可以使用sub和正則表達式執行此操作。

df = read.table(text="Species_Name    SIXTEENS_Title         SIXTEENS_Sequence
'Daphnia magna'   'LC382445.1 Daphnia magna mitochondrial'   'TTCGGAGAAAAGGGGTAC...'
'Daphnia magna'   'KY694374.1 Daphnia magna mitochondrial'   'TTCGGAGAAAAGGGGTAC...'",
header=T, stringsAsFactors=F)

sub("\\s*Daphnia.*", "", df$SIXTEENS_Title)
[1] "LC382445.1" "KY694374.1"

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM