[英]how to manipulate variables in a factor of a data frame
我需要在數據框內使用姓名電話號碼的一個因素中進行一些操作。 變量必須是長度為5的數字,並且也不能包含特殊字符,我想將AO-11111,VQ-11111的格式從更改為111111,這意味着擦除第一個字符,最后將其余變量轉換為na
我的data.frame是從.csv文件派生的.initial phone_number是一個因素數據,例如phone_number VQ-40773 VQ-43685 VQ-44986 40270 41694 42623。 。
strsplit函數將幫助您從字符串中獲取值。
str="VQ-40773"
(strsplit(str,"-"))[[1]][2] //will return 40773
如果要刪除破折號之前的所有內容,則:
sub("^([^-]+[-])(.+)", "\\2", phone_number)
> phone_number <- scan(what="")
1: VQ-40773
2: VQ-43685
3: VQ-44986
4: 40270
5: 41694
6: 42623
7:
Read 6 items
> sub("^([^-]+[-])(.+)", "\\2", phone_number)
[1] "40773" "43685" "44986" "40270" "41694" "42623"
> as.numeric(sub("^([^-]+[-])(.+)", "\\2", phone_number))
[1] 40773 43685 44986 40270 41694 42623
nchar
函數將允許檢查字符向量的長度。 發布適當的示例,請盡最大努力使標點符號和大寫字母正確無誤。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.