Como parar a função slide () de computar um vetor numérico em uma lista?

Nov 25 2020

Eu tenho uma data.framecoluna:

Price <- c(1, 2, 5, 3, 1, 4, 7, 10, 6)
df <- data.frame(Price)

Quero calcular o valor máximo de cada sete números, resultando em:

df$MaxPrice <- c(1, 2, 5, 5, 5, 5, 7, 10, 10)

No entanto, quando tento calcular essa nova coluna com mutate()e slide(), ele me retorna uma lista dentro do dataframe, em vez de uma variável numérica:

library(dplyr)
library(slider)

df <- df %>% 
  mutate(MaxPrice = slide(Price, max, .before = 7, .after = 0, .complete = F))

Por que isso está acontecendo e como fazer slide()retornar uma variável numérica?

Respostas

3 akrun Nov 25 2020 at 20:18

Parece que o método padrão exige a listsaída. De acordo com?slide

vec_ptype (slide (.x)) == list ()

e a descrição para .ptypeé

.ptype - [vetor (0) / NULL]

Um protótipo correspondente ao tipo de saída.

Se NULL, o padrão, o tipo de saída é determinado pelo cálculo do tipo comum nos resultados das chamadas para .f.

Se fornecido, o resultado de cada chamada para .f será convertido para esse tipo e a saída final terá esse tipo.

Se getOption ("vctrs.no_guessing") for TRUE, o .ptype deve ser fornecido. Esta é uma forma de fazer com que o código de produção exija tipos fixos.

Basicamente, com base no código-fonte (abaixo), ele retorna por padrão um liste parece não haver opção para evitar que, a menos que optemos por métodos específicos descritos, _vecou_dbl

Ou poderíamos flatten

library(dplyr)
library(slider)
library(purrr)
out <- df %>% 
    mutate(MaxPrice = slide(Price, max, .before = 7, .after = 0,
       .complete = FALSE) %>% flatten_dbl) 

str(out)
#'data.frame':  9 obs. of  2 variables:
# $ Price : num 1 2 5 3 1 4 7 10 6 # $ MaxPrice: num  1 2 5 5 5 5 7 10 10

Ou use o método específico do tipo, ou seja slide_dbl

out <- df %>% 
    mutate(MaxPrice = slide_dbl(Price, max, .before = 7, .after = 0,
       .complete = FALSE) )

str(out)
#'data.frame':  9 obs. of  2 variables:
# $ Price : num 1 2 5 3 1 4 7 10 6 # $ MaxPrice: num  1 2 5 5 5 5 7 10 10

Se verificarmos o código-fonte de slide, ele chama slide_imple assume que .ptypecomo liste que não há opção de passar essa informaçãoslide

slide
function (.x, .f, ..., .before = 0L, .after = 0L, .step = 1L, 
    .complete = FALSE) 
{
    slide_impl(.x, .f, ..., .before = .before, .after = .after, 
        .step = .step, .complete = .complete, .ptype = list(), 
        .constrain = FALSE, .atomic = FALSE)
}

Agora, compare isso com o _dblmétodo

slide_dbl
function (.x, .f, ..., .before = 0L, .after = 0L, .step = 1L, 
    .complete = FALSE) 
{
    slide_vec_direct(.x, .f, ..., .before = .before, .after = .after, 
        .step = .step, .complete = .complete, .ptype = double())
}

1 SteveM Nov 25 2020 at 21:01

Você pode apenas usar a cummaxfunção na base R:

Price <- c(1, 2, 5, 3, 1, 4, 7, 10, 6)
cummax(Price)
[1]  1  2  5  5  5  5  7 10 10

Para o caso de vários vetores. Carregue o vetor de dados em uma matriz e aplique cummax às colunas. Gera uma matriz de vetores cummax para tratamento subsequente: