आर - कारक

कारक डेटा ऑब्जेक्ट हैं जो डेटा को वर्गीकृत करने और इसे स्तर के रूप में संग्रहीत करने के लिए उपयोग किया जाता है। वे तार और पूर्णांक दोनों को स्टोर कर सकते हैं। वे उन स्तंभों में उपयोगी हैं जिनमें सीमित संख्या में अद्वितीय मूल्य हैं। जैसे "पुरुष," महिला "और सच्चा, गलत आदि। वे सांख्यिकीय मॉडलिंग के लिए डेटा विश्लेषण में उपयोगी हैं।

कारकों का उपयोग कर बनाया जाता है factor () एक वेक्टर को इनपुट के रूप में कार्य करके।

उदाहरण

# Create a vector as input.
data <- c("East","West","East","North","North","East","West","West","West","East","North")

print(data)
print(is.factor(data))

# Apply the factor function.
factor_data <- factor(data)

print(factor_data)
print(is.factor(factor_data))

जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -

[1] "East"  "West"  "East"  "North" "North" "East"  "West"  "West"  "West"  "East" "North"
[1] FALSE
[1] East  West  East  North North East  West  West  West  East  North
Levels: East North West
[1] TRUE

डेटा फ्रेम में कारक

टेक्स्ट डेटा के कॉलम के साथ कोई डेटा फ़्रेम बनाने पर, R टेक्स्ट कॉलम को श्रेणीबद्ध डेटा के रूप में मानता है और इस पर कारक बनाता है।

# Create the vectors for data frame.
height <- c(132,151,162,139,166,147,122)
weight <- c(48,49,66,53,67,52,40)
gender <- c("male","male","female","female","male","female","male")

# Create the data frame.
input_data <- data.frame(height,weight,gender)
print(input_data)

# Test if the gender column is a factor.
print(is.factor(input_data$gender))

# Print the gender column so see the levels.
print(input_data$gender)

जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -

height weight gender
1    132     48   male
2    151     49   male
3    162     66 female
4    139     53 female
5    166     67   male
6    147     52 female
7    122     40   male
[1] TRUE
[1] male   male   female female male   female male  
Levels: female male

स्तरों के आदेश को बदलना

एक कारक में स्तरों के क्रम को नए स्तर के साथ कारक फ़ंक्शन को फिर से लागू करके बदला जा सकता है।

data <- c("East","West","East","North","North","East","West",
   "West","West","East","North")
# Create the factors
factor_data <- factor(data)
print(factor_data)

# Apply the factor function with required order of the level.
new_order_data <- factor(factor_data,levels = c("East","West","North"))
print(new_order_data)

जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -

[1] East  West  East  North North East  West  West  West  East  North
Levels: East North West
 [1] East  West  East  North North East  West  West  West  East  North
Levels: East West North

कारक स्तर उत्पन्न करना

हम का उपयोग करके कारक स्तर उत्पन्न कर सकते हैं gl()समारोह। यह दो पूर्णांकों को इनपुट के रूप में लेता है जो इंगित करता है कि प्रत्येक स्तर कितने स्तर और कितनी बार है।

वाक्य - विन्यास

gl(n, k, labels)

निम्नलिखित मापदंडों का वर्णन है -

  • n स्तरों की संख्या देने वाला पूर्णांक है।

  • k प्रतिकृति की संख्या देने वाला पूर्णांक है।

  • labels परिणामी कारक स्तरों के लिए लेबल का एक वेक्टर है।

उदाहरण

v <- gl(3, 4, labels = c("Tampa", "Seattle","Boston"))
print(v)

जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम उत्पन्न करता है -

Tampa   Tampa   Tampa   Tampa   Seattle Seattle Seattle Seattle Boston 
[10] Boston  Boston  Boston 
Levels: Tampa Seattle Boston