Come impostare la frequenza dei dati mostrati nei panda? [duplicare]

Aug 23 2020
  1. Ho un set di dati. Supponiamo che sia:

    dataset = pd.read_csv ('some_stock_name_here.csv', index_col = ['Date'], parse_dates = ['Date'])

Il file csv ha 2500 osservazioni (data e posizione del prezzo di chiusura) e voglio creare un nuovo file csv che includa la stessa serie temporale ma con molti meno dati di frequenza sul raw. Ad esempio ogni 40-esimo del precedente? Come posso fare questo? 2. Inoltre mi chiedo se posso manipolare quella frequenza all'interno del notebook senza creare un nuovo file csv. Grazie in anticipo.

Risposte

1 AvivYaniv Aug 23 2020 at 19:13

Puoi tagliare il tuo df usando iloc:
Esaminando tutte le righe e prendendo quelle agli indici che sono divisibili con X.

X = 40
df.iloc[::X]

Il salvataggio del data-frame si ottiene con il codice seguente:

df.to_csv(FILE_PATH_HERE)