R - Datentypen

Im Allgemeinen müssen Sie beim Programmieren in einer beliebigen Programmiersprache verschiedene Variablen verwenden, um verschiedene Informationen zu speichern. Variablen sind nichts anderes als reservierte Speicherplätze zum Speichern von Werten. Dies bedeutet, dass Sie beim Erstellen einer Variablen Speicherplatz im Speicher reservieren.

Möglicherweise möchten Sie Informationen verschiedener Datentypen wie Zeichen, Breitzeichen, Ganzzahlen, Gleitkommazahlen, Doppelgleitkommazahlen, Boolesche Werte usw. speichern. Basierend auf dem Datentyp einer Variablen weist das Betriebssystem Speicher zu und entscheidet, was in der gespeichert werden kann reservierter Speicher.

Im Gegensatz zu anderen Programmiersprachen wie C und Java in R werden die Variablen nicht als Datentyp deklariert. Den Variablen werden R-Objekte zugewiesen und der Datentyp des R-Objekts wird zum Datentyp der Variablen. Es gibt viele Arten von R-Objekten. Die am häufigsten verwendeten sind -

  • Vectors
  • Lists
  • Matrices
  • Arrays
  • Factors
  • Datenrahmen

Das einfachste dieser Objekte ist das vector objectund es gibt sechs Datentypen dieser Atomvektoren, die auch als sechs Klassen von Vektoren bezeichnet werden. Die anderen R-Objekte bauen auf den Atomvektoren auf.

Datentyp Beispiel Überprüfen
Logisch WAHR FALSCH
v <- TRUE 
print(class(v))

es erzeugt das folgende Ergebnis -

[1] "logical"
Numerisch 12,3, 5, 999
v <- 23.5
print(class(v))

es erzeugt das folgende Ergebnis -

[1] "numeric"
Ganze Zahl 2L, 34L, 0L
v <- 2L
print(class(v))

es erzeugt das folgende Ergebnis -

[1] "integer"
Komplex 3 + 2i
v <- 2+5i
print(class(v))

es erzeugt das folgende Ergebnis -

[1] "complex"
Charakter 'a', '"gut", "WAHR", '23 .4'
v <- "TRUE"
print(class(v))

es erzeugt das folgende Ergebnis -

[1] "character"
Roh "Hallo" wird als 48 65 6c 6c 6f gespeichert
v <- charToRaw("Hello")
print(class(v))

es erzeugt das folgende Ergebnis -

[1] "raw"

Bei der R-Programmierung sind die sehr grundlegenden Datentypen die aufgerufenen R-Objekte vectorsdie Elemente verschiedener Klassen enthalten, wie oben gezeigt. Bitte beachten Sie, dass in R die Anzahl der Klassen nicht nur auf die oben genannten sechs Typen beschränkt ist. Zum Beispiel können wir viele Atomvektoren verwenden und ein Array erstellen, dessen Klasse zu einem Array wird.

Vektoren

Wenn Sie einen Vektor mit mehr als einem Element erstellen möchten, sollten Sie verwenden c() Funktion, die bedeutet, die Elemente zu einem Vektor zu kombinieren.

# Create a vector.
apple <- c('red','green',"yellow")
print(apple)

# Get the class of the vector.
print(class(apple))

Wenn wir den obigen Code ausführen, wird das folgende Ergebnis erzeugt:

[1] "red"    "green"  "yellow"
[1] "character"

Listen

Eine Liste ist ein R-Objekt, das viele verschiedene Arten von Elementen wie Vektoren, Funktionen und sogar eine andere Liste enthalten kann.

# Create a list.
list1 <- list(c(2,5,3),21.3,sin)

# Print the list.
print(list1)

Wenn wir den obigen Code ausführen, wird das folgende Ergebnis erzeugt:

[[1]]
[1] 2 5 3

[[2]]
[1] 21.3

[[3]]
function (x)  .Primitive("sin")

Matrizen

Eine Matrix ist ein zweidimensionaler rechteckiger Datensatz. Sie kann mithilfe einer Vektoreingabe in die Matrixfunktion erstellt werden.

# Create a matrix.
M = matrix( c('a','a','b','c','b','a'), nrow = 2, ncol = 3, byrow = TRUE)
print(M)

Wenn wir den obigen Code ausführen, wird das folgende Ergebnis erzeugt:

[,1] [,2] [,3]
[1,] "a"  "a"  "b" 
[2,] "c"  "b"  "a"

Arrays

Während Matrizen auf zwei Dimensionen beschränkt sind, können Arrays eine beliebige Anzahl von Dimensionen haben. Die Array-Funktion verwendet ein dim-Attribut, das die erforderliche Anzahl von Dimensionen erstellt. Im folgenden Beispiel erstellen wir ein Array mit zwei Elementen, die jeweils 3x3-Matrizen sind.

# Create an array.
a <- array(c('green','yellow'),dim = c(3,3,2))
print(a)

Wenn wir den obigen Code ausführen, wird das folgende Ergebnis erzeugt:

, , 1

     [,1]     [,2]     [,3]    
[1,] "green"  "yellow" "green" 
[2,] "yellow" "green"  "yellow"
[3,] "green"  "yellow" "green" 

, , 2

     [,1]     [,2]     [,3]    
[1,] "yellow" "green"  "yellow"
[2,] "green"  "yellow" "green" 
[3,] "yellow" "green"  "yellow"

Faktoren

Faktoren sind die r-Objekte, die mit einem Vektor erstellt werden. Es speichert den Vektor zusammen mit den unterschiedlichen Werten der Elemente im Vektor als Beschriftungen. Die Beschriftungen sind immer Zeichen, unabhängig davon, ob sie numerisch oder zeichen- oder boolesch usw. im Eingabevektor sind. Sie sind nützlich bei der statistischen Modellierung.

Faktoren werden mit dem erstellt factor()Funktion. Dasnlevels Funktionen gibt die Anzahl der Ebenen an.

# Create a vector.
apple_colors <- c('green','green','yellow','red','red','red','green')

# Create a factor object.
factor_apple <- factor(apple_colors)

# Print the factor.
print(factor_apple)
print(nlevels(factor_apple))

Wenn wir den obigen Code ausführen, wird das folgende Ergebnis erzeugt:

[1] green  green  yellow red    red    red    green 
Levels: green red yellow
[1] 3

Datenrahmen

Datenrahmen sind tabellarische Datenobjekte. Im Gegensatz zu einer Matrix im Datenrahmen kann jede Spalte unterschiedliche Datenmodi enthalten. Die erste Spalte kann numerisch sein, während die zweite Spalte ein Zeichen und die dritte Spalte logisch sein kann. Es ist eine Liste von Vektoren gleicher Länge.

Datenrahmen werden mit dem erstellt data.frame() Funktion.

# Create the data frame.
BMI <- 	data.frame(
   gender = c("Male", "Male","Female"), 
   height = c(152, 171.5, 165), 
   weight = c(81,93, 78),
   Age = c(42,38,26)
)
print(BMI)

Wenn wir den obigen Code ausführen, wird das folgende Ergebnis erzeugt:

gender height weight Age
1   Male  152.0     81  42
2   Male  171.5     93  38
3 Female  165.0     78  26