[英]Remove characters from tibble
我將一個xlx文件導入到Rstudio。 它在該列的開頭有一些注釋。 我希望能夠自動刪除。
例如,在下面的列中,我要刪除前8行。 通常,tibble_df在每列中都有不同的行要刪除。 有什么辦法可以刪除所有帶有任何字符或字符串的行?
A tibble: 326 x 1
X__1
<chr>
1 NA
2 NA
3 Start
4 End
5 Frequency
6 Name
7 Code
8 CURRENCY
9 Q1 1980
10 Q2 1980
有什么辦法可以刪除所有帶有任何字符或字符串的行?
不,可能不會。 當有字符時,整列將被強制為“字符”類,因此每一行將為字符。
您始終可以使用正則表達式檢查給定值是否僅由“字符”組成(並且不包含任何數字):
grepl("^[[:alpha:]]*$", df$X_1)
或(不太一般)
grepl("^[a-zA-Z]*$", df$X_1)
您還可以在正則表達式中添加空格:
grepl("^[[:alpha:][:space:]]*$", df$X_1)
要過濾,您可以使用:
df %>% filter(!grepl("^[[:alpha:][:space:]]*$", X_1))
二,不-三評論。
也許最好不要嘗試刪除所有看起來都不是數字的東西,而是嘗試搜索您感興趣的數據類型,例如模式“ Q [0-9] [0- 9] {4}”。
下次您發布問題時,請提供一些示例數據(例如dput(data)
),並顯示一些示例代碼,說明您如何嘗試自行解決問題。
您寫的是“字符”,但是意思是“字母字符”而不是“數字”。 這就是為什么其他答案之一說“您不能”的原因,因為數字也是字符串中的字符。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.