簡體   English   中英

如何在數據幀中操作變量

[英]how to manipulate variables in a factor of a data frame

我需要在數據框內使用姓名電話號碼的一個因素中進行一些操作。 變量必須是長度為5的數字,並且也不能包含特殊字符,我想將AO-11111,VQ-11111的格式從更改為111111,這意味着擦除第一個字符,最后將其余變量轉換為na

我的data.frame是從.csv文件派生的.initial phone_number是一個因素數據,例如phone_number VQ-40773 VQ-43685 VQ-44986 40270 41694 42623。

strsplit函數將幫助您從字符串中獲取值。

 str="VQ-40773"
(strsplit(str,"-"))[[1]][2] //will return 40773

如果要刪除破折號之前的所有內容,則:

 sub("^([^-]+[-])(.+)", "\\2", phone_number)

> phone_number <- scan(what="")
1:     VQ-40773
2:     VQ-43685
3:     VQ-44986
4:     40270
5:     41694
6:     42623
7: 
Read 6 items
> sub("^([^-]+[-])(.+)", "\\2", phone_number)
[1] "40773" "43685" "44986" "40270" "41694" "42623"
> as.numeric(sub("^([^-]+[-])(.+)", "\\2", phone_number))
[1] 40773 43685 44986 40270 41694 42623

nchar函數將允許檢查字符向量的長度。 發布適當的示例,請盡最大努力使標點符號和大寫字母正確無誤。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM