ggplot2 - Wprowadzenie
ggplot2 to pakiet R zaprojektowany specjalnie do wizualizacji danych i zapewniający najlepszą eksploracyjną analizę danych. Zapewnia piękne, bezproblemowe fabuły, które dbają o najdrobniejsze szczegóły, takie jak legendy rysowania i ich reprezentowanie. Wykresy można tworzyć iteracyjnie i edytować później. Ten pakiet został zaprojektowany do pracy w sposób warstwowy, zaczynając od warstwy przedstawiającej surowe dane zebrane podczas eksploracyjnej analizy danych za pomocą R, a następnie dodając warstwy adnotacji i podsumowań statystycznych.
Nawet najbardziej doświadczeni użytkownicy języka R potrzebują pomocy przy tworzeniu eleganckiej grafiki. Ta biblioteka jest fenomenalnym narzędziem do tworzenia grafiki w języku R, ale nawet po wielu latach niemal codziennego użytkowania nadal musimy odwoływać się do naszego ściągawki.
Ten pakiet działa w ramach głębokiej gramatyki zwanej „Gramatyka grafiki”, która składa się z zestawu niezależnych komponentów, które można tworzyć na wiele sposobów. „Gramatyka grafiki” to jedyny powód, który sprawia, że ggplot2 jest bardzo potężny, ponieważ programista R nie jest ograniczony do zestawu wstępnie określonej grafiki, która jest używana w innych pakietach. Gramatyka zawiera prosty zestaw podstawowych reguł i zasad.
W 2005 roku Wilkinson stworzył, a raczej zapoczątkował koncepcję gramatyki grafiki, aby opisać głębokie cechy, które są zawarte między wszystkimi grafikami statystycznymi. Koncentruje się na podstawowej warstwie, która obejmuje adaptację funkcji osadzonych w R.
Związek między „Grammar of Graphics” a R.
Informuje użytkownika lub programistę, że do odwzorowania danych na atrybuty estetyczne, takie jak kolor, kształt, rozmiar odnośnych obiektów geometrycznych, takich jak punkty, linie i paski, używana jest grafika statystyczna. Wykres może również zawierać różne transformacje statystyczne danych, które są rysowane na wspomnianym układzie współrzędnych. Zawiera również funkcję zwaną „Faceting”, która jest zwykle używana do tworzenia tego samego wykresu dla różnych podzbiorów wspomnianego zbioru danych. R zawiera różne wbudowane zestawy danych. Połączenie tych niezależnych komponentów całkowicie składa się z określonej grafiki.
Skoncentrujmy się teraz na różnych typach wykresów, które można tworzyć w odniesieniu do gramatyki -
Dane
Jeśli użytkownik chce zwizualizować podany zestaw odwzorowań estetycznych, który opisuje, w jaki sposób wymagane zmienne w danych są mapowane razem w celu utworzenia mapowanych atrybutów estetycznych.
Warstwy
Składa się z elementów geometrycznych i wymaganej transformacji statystycznej. Warstwy obejmują obiekty geometryczne, geomy dla krótkich danych, które w rzeczywistości przedstawiają wykres za pomocą punktów, linii, wielokątów i wielu innych. Najlepszą demonstracją jest binowanie i zliczanie obserwacji w celu utworzenia określonego histogramu podsumowującego zależność 2D określonego modelu liniowego.
Waga
Skale są używane do mapowania wartości w przestrzeni danych, która jest używana do tworzenia wartości, niezależnie od tego, czy jest to kolor, rozmiar i kształt. Pomaga narysować legendę lub osie potrzebne do odwrócenia odwrotnego odwzorowania umożliwiającego odczytanie oryginalnych wartości danych ze wspomnianego wykresu.
System współrzędnych
Opisuje, w jaki sposób współrzędne danych są mapowane razem na wspomnianą płaszczyznę grafiki. Zawiera również informacje o osiach i liniach siatki, które są potrzebne do odczytania wykresu. Zwykle jest używany jako kartezjański układ współrzędnych, który zawiera współrzędne biegunowe i odwzorowania map.
Faceting
Zawiera specyfikację, jak podzielić dane na wymagane podzbiory i wyświetlić podzbiory jako wielokrotności danych. Nazywa się to również procesem kondycjonowania lub siatkowania.
Motyw
Kontroluje szczegóły wyświetlania, takie jak rozmiar czcionki i właściwości koloru tła. Aby stworzyć atrakcyjną działkę, zawsze lepiej wziąć pod uwagę referencje.
Teraz równie ważne jest omówienie ograniczeń lub funkcji, których gramatyka nie zapewnia -
Brakuje sugestii, którą grafikę należy zastosować lub którą użytkownik jest zainteresowany.
Nie opisuje interaktywności, zawiera jedynie opis grafiki statycznej. Do tworzenia dynamicznej grafiki należy zastosować inne alternatywne rozwiązanie.
Prosty wykres utworzony za pomocą ggplot2 jest wymieniony poniżej -