![](/img/trans.png)
[英]Extract values for a column from another column based on another column in data frame R
[英]Extract data from a column to create another column in R
我有一個包含3個變量的數據框,我想將其分為4個變量。 數據框如下所示:
Species_Name SIXTEENS_Title SIXTEENS_Sequence
Daphnia magna LC382445.1 Daphnia magna mitochondrial TTCGGAGAAAAGGGGTAC...
Daphnia magna KY694374.1 Daphnia magna mitochondrial TTCGGAGAAAAGGGGTAC...
從這個數據框的SIXTEENS_Title
,我想提取Daphnia
之前的所有內容(字母數字LC382445.1,KY694374.1;但是有100多個觀察值不同)。
我試過使用str_extract()
和str_detect()
但似乎無法做到這一點。 我想使用登錄號(LC382445.1)
在R中創建另一列。
您可以使用sub
和正則表達式執行此操作。
df = read.table(text="Species_Name SIXTEENS_Title SIXTEENS_Sequence
'Daphnia magna' 'LC382445.1 Daphnia magna mitochondrial' 'TTCGGAGAAAAGGGGTAC...'
'Daphnia magna' 'KY694374.1 Daphnia magna mitochondrial' 'TTCGGAGAAAAGGGGTAC...'",
header=T, stringsAsFactors=F)
sub("\\s*Daphnia.*", "", df$SIXTEENS_Title)
[1] "LC382445.1" "KY694374.1"
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.