ggplot2 - Introduzione

ggplot2 è un pacchetto R progettato appositamente per la visualizzazione dei dati e per fornire la migliore analisi esplorativa dei dati. Fornisce trame belle e senza problemi che si prendono cura di dettagli minuti come disegnare leggende e rappresentarle. I grafici possono essere creati in modo iterativo e modificati successivamente. Questo pacchetto è progettato per funzionare in modo stratificato, iniziando con un livello che mostra i dati grezzi raccolti durante l'analisi esplorativa dei dati con R, quindi aggiungendo livelli di annotazioni e riepiloghi statistici.

Anche gli utenti R più esperti hanno bisogno di aiuto per creare una grafica elegante. Questa libreria è uno strumento fenomenale per creare grafica in R ma anche dopo molti anni di utilizzo quasi quotidiano dobbiamo ancora fare riferimento al nostro Cheat Sheet.

Questo pacchetto funziona sotto una grammatica profonda chiamata "Grammatica della grafica" che è composta da un insieme di componenti indipendenti che possono essere creati in molti modi. La "grammatica della grafica" è l'unica ragione che rende ggplot2 molto potente perché lo sviluppatore R non si limita a un insieme di elementi grafici pre-specificati che vengono utilizzati in altri pacchetti. La grammatica include un semplice insieme di regole e principi fondamentali.

Nell'anno 2005, Wilkinson ha creato o piuttosto ha originato il concetto di grammatica della grafica per descrivere le caratteristiche profonde che è incluso tra tutti i grafici statistici. Si concentra sul primario dei livelli che include l'adattamento delle funzionalità incorporate con R.

Relazione tra "Grammatica della grafica" e R

Indica all'utente o allo sviluppatore che un grafico statistico viene utilizzato per mappare i dati su attributi estetici come colore, forma, dimensione degli oggetti geometrici interessati come punti, linee e barre. Il grafico può anche contenere varie trasformazioni statistiche dei dati interessati che vengono disegnati sul sistema di coordinate citato. Include anche una funzione chiamata "Sfaccettatura" che viene generalmente utilizzata per creare lo stesso grafico per diversi sottoinsiemi del set di dati menzionato. R include vari set di dati integrati. La combinazione di questi componenti indipendenti comprende totalmente una grafica particolare.

Ora concentriamoci su diversi tipi di grafici che possono essere creati con riferimento alla grammatica:

Dati

Se l'utente desidera visualizzare il dato insieme di mappature estetiche che descrive come le variabili richieste nei dati vengono mappate insieme per la creazione di attributi estetici mappati.

Strati

È costituito da elementi geometrici e dalla necessaria trasformazione statistica. I livelli includono oggetti geometrici, geomi per dati brevi che rappresentano effettivamente il grafico con l'aiuto di punti, linee, poligoni e molti altri. La migliore dimostrazione è il raggruppamento e il conteggio delle osservazioni per creare l'istogramma specifico per riassumere la relazione 2D di uno specifico modello lineare.

Bilancia

Le scale vengono utilizzate per mappare i valori nello spazio dati utilizzato per la creazione di valori, indipendentemente dal fatto che si tratti di colore, dimensione e forma. Aiuta a disegnare una legenda o assi necessari per fornire una mappatura inversa che consenta di leggere i valori dei dati originali dal grafico menzionato.

Sistema di coordinate

Descrive come le coordinate dei dati vengono mappate insieme al piano menzionato del grafico. Fornisce inoltre informazioni sugli assi e sulle linee della griglia necessarie per leggere il grafico. Normalmente viene utilizzato come sistema di coordinate cartesiane che include coordinate polari e proiezioni cartografiche.

Sfaccettatura

Include le specifiche su come suddividere i dati in sottoinsiemi richiesti e visualizzare i sottoinsiemi come multipli di dati. Questo è anche chiamato processo di condizionamento o reticolo.

Tema

Controlla i punti più fini di visualizzazione come la dimensione del carattere e le proprietà del colore di sfondo. Per creare una trama attraente, è sempre meglio considerare i riferimenti.

Ora, è altrettanto importante discutere i limiti o le caratteristiche che la grammatica non fornisce:

  • Manca il suggerimento di quale grafica dovrebbe essere utilizzata o che un utente è interessato a fare.

  • Non descrive l'interattività in quanto include solo la descrizione della grafica statica. Per la creazione di grafica dinamica dovrebbe essere applicata un'altra soluzione alternativa.

Il semplice grafico creato con ggplot2 è menzionato di seguito -