Come impostare la frequenza dei dati mostrati nei panda? [duplicare]
Ho un set di dati. Supponiamo che sia:
dataset = pd.read_csv ('some_stock_name_here.csv', index_col = ['Date'], parse_dates = ['Date'])
Il file csv ha 2500 osservazioni (data e posizione del prezzo di chiusura) e voglio creare un nuovo file csv che includa la stessa serie temporale ma con molti meno dati di frequenza sul raw. Ad esempio ogni 40-esimo del precedente? Come posso fare questo? 2. Inoltre mi chiedo se posso manipolare quella frequenza all'interno del notebook senza creare un nuovo file csv. Grazie in anticipo.
Risposte
Puoi tagliare il tuo df usando iloc:
Esaminando tutte le righe e prendendo quelle agli indici che sono divisibili con X
.
X = 40
df.iloc[::X]
Il salvataggio del data-frame si ottiene con il codice seguente:
df.to_csv(FILE_PATH_HERE)