आर - बाइनरी फाइलें

एक बाइनरी फ़ाइल एक फ़ाइल है जिसमें केवल बिट्स और बाइट्स के रूप में संग्रहीत जानकारी होती है। (0 और 1)। वे मानव पठनीय नहीं हैं क्योंकि इसमें बाइट्स उन वर्णों और प्रतीकों का अनुवाद करते हैं जिनमें कई अन्य गैर-मुद्रण योग्य वर्ण होते हैं। किसी भी टेक्स्ट एडिटर का उपयोग करके एक बाइनरी फ़ाइल को पढ़ने का प्रयास Ø और read जैसे अक्षर दिखाएगा।

बाइनरी फ़ाइल को उपयोगी होने के लिए विशिष्ट कार्यक्रमों द्वारा पढ़ा जाना चाहिए। उदाहरण के लिए, Microsoft Word प्रोग्राम की बाइनरी फ़ाइल को केवल Word प्रोग्राम द्वारा मानव पठनीय रूप में पढ़ा जा सकता है। जो इंगित करता है कि, मानव पठनीय पाठ के अलावा, वर्णों के प्रारूपण और पृष्ठ संख्या आदि जैसी बहुत अधिक जानकारी है, जो अल्फ़ान्यूमेरिक वर्णों के साथ संग्रहीत भी हैं। और अंत में एक बाइनरी फ़ाइल बाइट्स का एक निरंतर अनुक्रम है। एक पाठ फ़ाइल में हम जो लाइन ब्रेक देखते हैं, वह एक चरित्र है जो पहली पंक्ति से अगली पंक्ति में शामिल होता है।

कभी-कभी, अन्य कार्यक्रमों द्वारा उत्पन्न डेटा को बाइनरी फ़ाइल के रूप में आर द्वारा संसाधित करने की आवश्यकता होती है। साथ ही आर को बाइनरी फाइल बनाने की आवश्यकता होती है जिसे अन्य कार्यक्रमों के साथ साझा किया जा सकता है।

R के दो कार्य हैं WriteBin() तथा readBin() बाइनरी फ़ाइलों को बनाने और पढ़ने के लिए।

वाक्य - विन्यास

writeBin(object, con)
readBin(con, what, n )

निम्नलिखित मापदंडों का वर्णन है -

  • con बाइनरी फ़ाइल को पढ़ने या लिखने के लिए कनेक्शन ऑब्जेक्ट है।

  • object बाइनरी फ़ाइल है जिसे लिखा जाना है।

  • what वर्ण, पूर्णांक आदि जैसी विधा है जिसे पढ़ने के लिए बाइट का प्रतिनिधित्व किया जाता है।

  • n बाइनरी फ़ाइल से पढ़ने के लिए बाइट्स की संख्या है।

उदाहरण

हम आर इनबिल्ट डेटा "mtcars" पर विचार करते हैं। पहले हम इससे एक csv फ़ाइल बनाते हैं और इसे एक बाइनरी फ़ाइल में परिवर्तित करते हैं और इसे OS फ़ाइल के रूप में संग्रहीत करते हैं। आगे हमने R में बनाई गई इस बाइनरी फाइल को पढ़ा।

बाइनरी फ़ाइल लिखना

हम डेटा फ्रेम "mtcars" को सीएसवी फ़ाइल के रूप में पढ़ते हैं और फिर इसे ओएस पर एक बाइनरी फ़ाइल के रूप में लिखते हैं।

# Read the "mtcars" data frame as a csv file and store only the columns 
   "cyl", "am" and "gear".
write.table(mtcars, file = "mtcars.csv",row.names = FALSE, na = "", 
   col.names = TRUE, sep = ",")

# Store 5 records from the csv file as a new data frame.
new.mtcars <- read.table("mtcars.csv",sep = ",",header = TRUE,nrows = 5)

# Create a connection object to write the binary file using mode "wb".
write.filename = file("/web/com/binmtcars.dat", "wb")

# Write the column names of the data frame to the connection object.
writeBin(colnames(new.mtcars), write.filename)

# Write the records in each of the column to the file.
writeBin(c(new.mtcars$cyl,new.mtcars$am,new.mtcars$gear), write.filename)

# Close the file for writing so that it can be read by other program.
close(write.filename)

बाइनरी फ़ाइल पढ़ना

उपरोक्त बाइनरी फ़ाइल सभी डेटा को निरंतर बाइट्स के रूप में संग्रहीत करती है। इसलिए हम कॉलम नामों के साथ-साथ कॉलम मानों के उचित मूल्यों को चुनकर इसे पढ़ेंगे।

# Create a connection object to read the file in binary mode using "rb".
read.filename <- file("/web/com/binmtcars.dat", "rb")

# First read the column names. n = 3 as we have 3 columns.
column.names <- readBin(read.filename, character(),  n = 3)

# Next read the column values. n = 18 as we have 3 column names and 15 values.
read.filename <- file("/web/com/binmtcars.dat", "rb")
bindata <- readBin(read.filename, integer(),  n = 18)

# Print the data.
print(bindata)

# Read the values from 4th byte to 8th byte which represents "cyl".
cyldata = bindata[4:8]
print(cyldata)

# Read the values form 9th byte to 13th byte which represents "am".
amdata = bindata[9:13]
print(amdata)

# Read the values form 9th byte to 13th byte which represents "gear".
geardata = bindata[14:18]
print(geardata)

# Combine all the read values to a dat frame.
finaldata = cbind(cyldata, amdata, geardata)
colnames(finaldata) = column.names
print(finaldata)

जब हम उपरोक्त कोड निष्पादित करते हैं, तो यह निम्नलिखित परिणाम और चार्ट तैयार करता है -

[1]    7108963 1728081249    7496037          6          6          4
 [7]          6          8          1          1          1          0
[13]          0          4          4          4          3          3

[1] 6 6 4 6 8

[1] 1 1 1 0 0

[1] 4 4 4 3 3

     cyl am gear
[1,]   6  1    4
[2,]   6  1    4
[3,]   4  1    4
[4,]   6  0    3
[5,]   8  0    3

जैसा कि हम देख सकते हैं, आर में बाइनरी फ़ाइल को पढ़ने से हमें मूल डेटा वापस मिल गया।