Python Pandas - Introduzione

Pandas è una libreria Python open source che fornisce strumenti di analisi e manipolazione dei dati ad alte prestazioni utilizzando le sue potenti strutture di dati. Il nome Pandas deriva dalla parola Panel Data - an Econometrics from Multidimensional data.

Nel 2008, lo sviluppatore Wes McKinney ha iniziato a sviluppare i panda quando necessitavano di uno strumento flessibile e ad alte prestazioni per l'analisi dei dati.

Prima di Pandas, Python era principalmente utilizzato per il munging e la preparazione dei dati. Ha dato un contributo minimo all'analisi dei dati. I panda hanno risolto questo problema. Utilizzando Pandas, possiamo eseguire cinque passaggi tipici nell'elaborazione e nell'analisi dei dati, indipendentemente dall'origine dei dati: caricare, preparare, manipolare, modellare e analizzare.

Python with Pandas viene utilizzato in una vasta gamma di campi, compresi i domini accademici e commerciali tra cui finanza, economia, statistica, analisi, ecc.

Caratteristiche principali dei panda

Oggetto DataFrame veloce ed efficiente con indicizzazione predefinita e personalizzata.
Strumenti per caricare i dati in oggetti dati in memoria da diversi formati di file.
Allineamento dei dati e gestione integrata dei dati mancanti.
Rimodellamento e rotazione dei set di date.
Affettatura, indicizzazione e sottoinsiemi basati su etichette di grandi set di dati.
Le colonne di una struttura dati possono essere eliminate o inserite.
Raggruppa per dati per aggregazioni e trasformazioni.
Fusione e unione di dati ad alte prestazioni.
Funzionalità Time Series.