R - Datentypen
Im Allgemeinen müssen Sie beim Programmieren in einer beliebigen Programmiersprache verschiedene Variablen verwenden, um verschiedene Informationen zu speichern. Variablen sind nichts anderes als reservierte Speicherplätze zum Speichern von Werten. Dies bedeutet, dass Sie beim Erstellen einer Variablen Speicherplatz im Speicher reservieren.
Möglicherweise möchten Sie Informationen verschiedener Datentypen wie Zeichen, Breitzeichen, Ganzzahlen, Gleitkommazahlen, Doppelgleitkommazahlen, Boolesche Werte usw. speichern. Basierend auf dem Datentyp einer Variablen weist das Betriebssystem Speicher zu und entscheidet, was in der gespeichert werden kann reservierter Speicher.
Im Gegensatz zu anderen Programmiersprachen wie C und Java in R werden die Variablen nicht als Datentyp deklariert. Den Variablen werden R-Objekte zugewiesen und der Datentyp des R-Objekts wird zum Datentyp der Variablen. Es gibt viele Arten von R-Objekten. Die am häufigsten verwendeten sind -
- Vectors
- Lists
- Matrices
- Arrays
- Factors
- Datenrahmen
Das einfachste dieser Objekte ist das vector objectund es gibt sechs Datentypen dieser Atomvektoren, die auch als sechs Klassen von Vektoren bezeichnet werden. Die anderen R-Objekte bauen auf den Atomvektoren auf.
Datentyp | Beispiel | Überprüfen |
---|---|---|
Logisch | WAHR FALSCH |
es erzeugt das folgende Ergebnis -
|
Numerisch | 12,3, 5, 999 |
es erzeugt das folgende Ergebnis -
|
Ganze Zahl | 2L, 34L, 0L |
es erzeugt das folgende Ergebnis -
|
Komplex | 3 + 2i |
es erzeugt das folgende Ergebnis -
|
Charakter | 'a', '"gut", "WAHR", '23 .4' |
es erzeugt das folgende Ergebnis -
|
Roh | "Hallo" wird als 48 65 6c 6c 6f gespeichert |
es erzeugt das folgende Ergebnis -
|
Bei der R-Programmierung sind die sehr grundlegenden Datentypen die aufgerufenen R-Objekte vectorsdie Elemente verschiedener Klassen enthalten, wie oben gezeigt. Bitte beachten Sie, dass in R die Anzahl der Klassen nicht nur auf die oben genannten sechs Typen beschränkt ist. Zum Beispiel können wir viele Atomvektoren verwenden und ein Array erstellen, dessen Klasse zu einem Array wird.
Vektoren
Wenn Sie einen Vektor mit mehr als einem Element erstellen möchten, sollten Sie verwenden c() Funktion, die bedeutet, die Elemente zu einem Vektor zu kombinieren.
# Create a vector.
apple <- c('red','green',"yellow")
print(apple)
# Get the class of the vector.
print(class(apple))
Wenn wir den obigen Code ausführen, wird das folgende Ergebnis erzeugt:
[1] "red" "green" "yellow"
[1] "character"
Listen
Eine Liste ist ein R-Objekt, das viele verschiedene Arten von Elementen wie Vektoren, Funktionen und sogar eine andere Liste enthalten kann.
# Create a list.
list1 <- list(c(2,5,3),21.3,sin)
# Print the list.
print(list1)
Wenn wir den obigen Code ausführen, wird das folgende Ergebnis erzeugt:
[[1]]
[1] 2 5 3
[[2]]
[1] 21.3
[[3]]
function (x) .Primitive("sin")
Matrizen
Eine Matrix ist ein zweidimensionaler rechteckiger Datensatz. Sie kann mithilfe einer Vektoreingabe in die Matrixfunktion erstellt werden.
# Create a matrix.
M = matrix( c('a','a','b','c','b','a'), nrow = 2, ncol = 3, byrow = TRUE)
print(M)
Wenn wir den obigen Code ausführen, wird das folgende Ergebnis erzeugt:
[,1] [,2] [,3]
[1,] "a" "a" "b"
[2,] "c" "b" "a"
Arrays
Während Matrizen auf zwei Dimensionen beschränkt sind, können Arrays eine beliebige Anzahl von Dimensionen haben. Die Array-Funktion verwendet ein dim-Attribut, das die erforderliche Anzahl von Dimensionen erstellt. Im folgenden Beispiel erstellen wir ein Array mit zwei Elementen, die jeweils 3x3-Matrizen sind.
# Create an array.
a <- array(c('green','yellow'),dim = c(3,3,2))
print(a)
Wenn wir den obigen Code ausführen, wird das folgende Ergebnis erzeugt:
, , 1
[,1] [,2] [,3]
[1,] "green" "yellow" "green"
[2,] "yellow" "green" "yellow"
[3,] "green" "yellow" "green"
, , 2
[,1] [,2] [,3]
[1,] "yellow" "green" "yellow"
[2,] "green" "yellow" "green"
[3,] "yellow" "green" "yellow"
Faktoren
Faktoren sind die r-Objekte, die mit einem Vektor erstellt werden. Es speichert den Vektor zusammen mit den unterschiedlichen Werten der Elemente im Vektor als Beschriftungen. Die Beschriftungen sind immer Zeichen, unabhängig davon, ob sie numerisch oder zeichen- oder boolesch usw. im Eingabevektor sind. Sie sind nützlich bei der statistischen Modellierung.
Faktoren werden mit dem erstellt factor()Funktion. Dasnlevels Funktionen gibt die Anzahl der Ebenen an.
# Create a vector.
apple_colors <- c('green','green','yellow','red','red','red','green')
# Create a factor object.
factor_apple <- factor(apple_colors)
# Print the factor.
print(factor_apple)
print(nlevels(factor_apple))
Wenn wir den obigen Code ausführen, wird das folgende Ergebnis erzeugt:
[1] green green yellow red red red green
Levels: green red yellow
[1] 3
Datenrahmen
Datenrahmen sind tabellarische Datenobjekte. Im Gegensatz zu einer Matrix im Datenrahmen kann jede Spalte unterschiedliche Datenmodi enthalten. Die erste Spalte kann numerisch sein, während die zweite Spalte ein Zeichen und die dritte Spalte logisch sein kann. Es ist eine Liste von Vektoren gleicher Länge.
Datenrahmen werden mit dem erstellt data.frame() Funktion.
# Create the data frame.
BMI <- data.frame(
gender = c("Male", "Male","Female"),
height = c(152, 171.5, 165),
weight = c(81,93, 78),
Age = c(42,38,26)
)
print(BMI)
Wenn wir den obigen Code ausführen, wird das folgende Ergebnis erzeugt:
gender height weight Age
1 Male 152.0 81 42
2 Male 171.5 93 38
3 Female 165.0 78 26