R 根據其他列中的值范圍改變新列

Question

我有以下格式的 r dataframe

+--------+---------------+--------------------+--------+
| time   | Stress_ratio  | shear_displacement |   CX   |
+--------+---------------+--------------------+--------+
| <dbl>  |    <dbl>      |    <dbl>           | <dbl>  | 
| 50.1   |    -0.224     |    4.9             |  0     | 
| 50.2   |    -0.219     |    4.98            | 0.0100 | 
| .      | .             | .                  | .      |
| .      | .             | .                  | .      | 
| 249.3  |    -0.217     | 4.97               | 0.0200 |  
| 250.4  |    -0.214     | 4.96               | 0.0300 | 
| 251.1  | -0.222        | 4.91               | 0.06   | 
| 252.1  | -0.222        | 4.91               | 0.06   | 
| 253.3  | -0.222        | 4.91               | 0.06   | 
| 254.5  | -0.222        | 4.91               | 0.06   | 
| 256.8  | -0.222        | 4.91               | 0.06   | 
| .      | .             | .                  | .      | 
| .      | .             | .                  | .      |
| 500.1  | -0.22         | 4.91               | 0.6    |    
| 501.4  | -0.22         | 4.91               | 0.6    | 
| 503.1  | -0.22         | 4.91               | 0.6    | 
+--------+---------------+--------------------+--------+

我想要一個新列，它具有基於列時間中一系列值之間的差異的重復值。 列時間的范圍應為 250。 例如，在new_column的所有行中，當df$time[1]和df$time[1]*4.98為 250 時，我應該得到數字 1。類似地，當下一個塊開始時相差 250 時，這個數字 1 應該變為 2。所以新的 dataframe 應該是這樣的

+--------+---------------+--------------------+--------+------------+
| time   | Stress_ratio  | shear_displacement |   CX   | new_column |
+--------+---------------+--------------------+--------+------------+
| <dbl>  |    <dbl>      |    <dbl>           | <dbl>  | <dbl>      |
| 50.1   |    -0.224     |    4.9             |  0     | 1          |
| 50.2   |    -0.219     |    4.98            | 0.0100 | 1          |
| .      | .             | .                  | .      | 1          |
| .      | .             | .                  | .      | 1          |
| 249.3  |    -0.217     | 4.97               | 0.0200 | 1          |
| 250.4  |    -0.214     | 4.96               | 0.0300 | 2          |
| 251.1  | -0.222        | 4.91               | 0.06   | 2          |
| 252.1  | -0.222        | 4.91               | 0.06   | 2          |
| 253.3  | -0.222        | 4.91               | 0.06   | 2          |
| 254.5  | -0.222        | 4.91               | 0.06   | 2          |
| 256.8  | -0.222        | 4.91               | 0.06   | 2          |
| .      | .             | .                  | .      | .          |
| .      | .             | .                  | .      | .          |
| 499.1  | -0.22         | 4.91               | 0.6    | 2          |
| 501.4  | -0.22         | 4.91               | 0.6    | 3          |
| 503.1  | -0.22         | 4.91               | 0.6    | 3          |
+--------+---------------+--------------------+--------+------------+

Answer 1

如果我明白你想做什么，一個base的 R 解決方案可能是：

df$new_column <- df$time %/% 250 + 1

%/%運算符是 integer 除法（模數運算符的補碼）並告訴您 250 的副本有多少適合您的數字； 我們加 1 以獲得您想要的值。

tidyverse版本：

df <- df %>%
  mutate(new_column = time %/% 250 + 1)

Answer 2

library(data.table)
setDT(df)[, new_column := rleid(time %/% 250)][]

R 根據其他列中的值范圍改變新列

問題描述

2 個解決方案

解決方案1
0 已采納 2022-04-05 14:46:47

解決方案2
0 2022-04-05 14:47:49

R 根據其他列中的值范圍改變新列

問題描述

2 個解決方案

解決方案1 0 已采納 2022-04-05 14:46:47

解決方案2 0 2022-04-05 14:47:49

解決方案1
0 已采納 2022-04-05 14:46:47

解決方案2
0 2022-04-05 14:47:49