Comment empêcher la fonction slide () de calculer un vecteur numérique dans une liste?

Nov 25 2020

J'ai un data.framed'une colonne:

Price <- c(1, 2, 5, 3, 1, 4, 7, 10, 6)
df <- data.frame(Price)

Je veux calculer la valeur maximale de chaque sept nombres, ce qui donne:

df$MaxPrice <- c(1, 2, 5, 5, 5, 5, 7, 10, 10)

Cependant, lorsque j'essaye de calculer cette nouvelle colonne avec mutate()et slide(), cela me renvoie une liste à l'intérieur du dataframe, au lieu d'une variable numérique:

library(dplyr)
library(slider)

df <- df %>% 
  mutate(MaxPrice = slide(Price, max, .before = 7, .after = 0, .complete = F))

Pourquoi cela se produit-il et comment faire slide()renvoyer une variable numérique?

Réponses

3 akrun Nov 25 2020 at 20:18

Il semble que la méthode par défaut appelle la listsortie. Selon?slide

vec_ptype (diapositive (.x)) == liste ()

et la description de .ptypeest

.ptype - [vecteur (0) / NULL]

Un prototype correspondant au type de sortie.

Si NULL, la valeur par défaut, le type de sortie est déterminé en calculant le type commun à travers les résultats des appels à .f.

S'il est fourni, le résultat de chaque appel à .f sera converti en ce type et la sortie finale aura ce type.

Si getOption ("vctrs.no_guessing") est TRUE, le .ptype doit être fourni. C'est un moyen de faire en sorte que le code de production demande des types fixes.

Essentiellement basé sur le code source (ci-dessous), il renvoie par défaut a listet il ne semble y avoir aucune option pour empêcher cela à moins que nous n'options pour des méthodes spécifiques décrites, c'est-à-dire _vecou_dbl

Soit nous pourrions flatten

library(dplyr)
library(slider)
library(purrr)
out <- df %>% 
    mutate(MaxPrice = slide(Price, max, .before = 7, .after = 0,
       .complete = FALSE) %>% flatten_dbl) 

str(out)
#'data.frame':  9 obs. of  2 variables:
# $ Price : num 1 2 5 3 1 4 7 10 6 # $ MaxPrice: num  1 2 5 5 5 5 7 10 10

Ou utilisez la méthode spécifique au type, c'est-à-dire slide_dbl

out <- df %>% 
    mutate(MaxPrice = slide_dbl(Price, max, .before = 7, .after = 0,
       .complete = FALSE) )

str(out)
#'data.frame':  9 obs. of  2 variables:
# $ Price : num 1 2 5 3 1 4 7 10 6 # $ MaxPrice: num  1 2 5 5 5 5 7 10 10

Si nous vérifions le code source de slide, il appelle slide_implet suppose qu'au .ptypefur listet à mesure , il n'y a pas d'option pour transmettre ces informationsslide

slide
function (.x, .f, ..., .before = 0L, .after = 0L, .step = 1L, 
    .complete = FALSE) 
{
    slide_impl(.x, .f, ..., .before = .before, .after = .after, 
        .step = .step, .complete = .complete, .ptype = list(), 
        .constrain = FALSE, .atomic = FALSE)
}

Maintenant, comparez cela avec la _dblméthode

slide_dbl
function (.x, .f, ..., .before = 0L, .after = 0L, .step = 1L, 
    .complete = FALSE) 
{
    slide_vec_direct(.x, .f, ..., .before = .before, .after = .after, 
        .step = .step, .complete = .complete, .ptype = double())
}

1 SteveM Nov 25 2020 at 21:01

Vous pouvez simplement utiliser la cummaxfonction en base R:

Price <- c(1, 2, 5, 3, 1, 4, 7, 10, 6)
cummax(Price)
[1]  1  2  5  5  5  5  7 10 10

Pour cas multi-vecteurs. Chargez le vecteur de données dans une matrice et appliquez cummax aux colonnes. Génère une matrice de vecteurs cummax pour le traitement de suivi: