R - คำถามสัมภาษณ์

เรียนผู้อ่านคำถามสัมภาษณ์ R เหล่านี้ได้รับการออกแบบมาเป็นพิเศษเพื่อให้คุณได้ทำความคุ้นเคยกับลักษณะของคำถามที่คุณอาจพบในระหว่างการสัมภาษณ์เรื่องการเขียนโปรแกรม R จากประสบการณ์ของฉันผู้สัมภาษณ์ที่ดีแทบจะไม่ได้วางแผนที่จะถามคำถามใด ๆ โดยเฉพาะในระหว่างการสัมภาษณ์ของคุณโดยปกติแล้วคำถามจะเริ่มต้นด้วยแนวคิดพื้นฐานบางอย่างของเรื่องและหลังจากนั้นพวกเขาจะดำเนินต่อไปตามการอภิปรายเพิ่มเติมและสิ่งที่คุณตอบ -

R เป็นภาษาโปรแกรมที่มีไว้สำหรับการวิเคราะห์ทางสถิติและการสร้างกราฟเพื่อจุดประสงค์นี้ แต่จะมีวัตถุข้อมูลที่ใช้สำหรับการคำนวณแทนประเภทข้อมูล ใช้ในด้านการขุดข้อมูลการวิเคราะห์การถดถอยการประมาณความน่าจะเป็น ฯลฯ โดยใช้แพ็คเกจมากมายที่มีอยู่ในนั้น

มีวัตถุข้อมูล 6 รายการใน R คือเวกเตอร์รายการอาร์เรย์เมทริกซ์เฟรมข้อมูลและตาราง

ชื่อตัวแปรที่ถูกต้องประกอบด้วยตัวอักษรตัวเลขและจุดหรืออักขระขีดเส้นใต้ ชื่อตัวแปรเริ่มต้นด้วยตัวอักษรหรือจุดที่ไม่ได้ตามด้วยตัวเลข

เมทริกซ์เป็นสองมิติเสมอเนื่องจากมีเฉพาะแถวและคอลัมน์ แต่อาร์เรย์สามารถมีขนาดเท่าใดก็ได้และแต่ละมิติเป็นเมทริกซ์ ตัวอย่างเช่นอาร์เรย์ 3x3x2 แทน 2 เมทริกซ์แต่ละมิติ 3x3

อ็อบเจ็กต์ข้อมูล Factor ใน R ใช้เพื่อจัดเก็บและประมวลผลข้อมูลหมวดหมู่ใน R

สามารถโหลดไฟล์ csv ได้โดยใช้ฟังก์ชัน read.csv R สร้างกรอบข้อมูลในการอ่านไฟล์ csv โดยใช้ฟังก์ชันนี้

คำสั่ง getwd () ให้ไดเร็กทอรีการทำงานปัจจุบันในสภาวะแวดล้อม R

นี่คือแพ็กเกจที่โหลดโดยค่าเริ่มต้นเมื่อตั้งค่าสภาพแวดล้อม R มีฟังก์ชันพื้นฐานเช่นอินพุต / เอาต์พุตการคำนวณเลขคณิต ฯลฯ ในสภาพแวดล้อม R

การถดถอยโลจิสติกเกี่ยวข้องกับการวัดความน่าจะเป็นของตัวแปรตอบสนองแบบไบนารี ใน R ฟังก์ชัน glm () ถูกใช้เพื่อสร้างการถดถอยโลจิสติก

นิพจน์ M [4,2] ให้องค์ประกอบที่แถวที่ 4 และคอลัมน์ที่ 2

เมื่อเวกเตอร์สองเวกเตอร์ที่มีความยาวต่างกันเข้ามาเกี่ยวข้องในการดำเนินการองค์ประกอบของเวกเตอร์ที่สั้นกว่าจะถูกนำมาใช้ซ้ำเพื่อดำเนินการให้เสร็จสมบูรณ์ สิ่งนี้เรียกว่าการรีไซเคิลองค์ประกอบ ตัวอย่าง - v1 <- c (4,1,0,6) และ V2 <- c (2,4) จากนั้น v1 * v2 จะให้ (8,4,0,24) องค์ประกอบ 2 และ 4 ซ้ำกัน

เราสามารถเรียกใช้ฟังก์ชันใน R ได้ 3 วิธี วิธีแรกคือการเรียกโดยใช้ตำแหน่งของอาร์กิวเมนต์ รหัสวิธีที่สองในการเรียกโดยใช้ชื่อของอาร์กิวเมนต์และวิธีที่สามคือการเรียกตามอาร์กิวเมนต์เริ่มต้น

การประเมินฟังก์ชันแบบเกียจคร้านหมายความว่าอาร์กิวเมนต์จะได้รับการประเมินก็ต่อเมื่อมีการใช้ภายในเนื้อหาของฟังก์ชัน หากไม่มีการอ้างอิงถึงอาร์กิวเมนต์ในเนื้อหาของฟังก์ชันก็จะถูกละเว้น

ในการติดตั้งแพ็คเกจใน R เราใช้คำสั่งด้านล่าง

install.packages("package Name")

แพ็กเกจชื่อ "XML" ใช้เพื่ออ่านและประมวลผลไฟล์ XML

เราสามารถอัปเดตองค์ประกอบใด ๆ ก็ได้ แต่เราสามารถลบได้เฉพาะองค์ประกอบที่อยู่ท้ายรายการ

นิพจน์ทั่วไปในการสร้างเมทริกซ์ใน R คือ - เมทริกซ์ (data, nrow, ncol, byrow, dimnames)

ฟังก์ชัน boxplot () ถูกใช้เพื่อสร้าง boxplots ใน R โดยใช้สูตรและกรอบข้อมูลเป็นอินพุตในการสร้าง boxplots

ความถี่ 6 ระบุช่วงเวลาสำหรับข้อมูลอนุกรมเวลาคือทุกๆ 10 นาทีของหนึ่งชั่วโมง

ใน R วัตถุข้อมูลสามารถแปลงจากรูปแบบหนึ่งไปเป็นอีกรูปแบบหนึ่งได้ ตัวอย่างเช่นเราสามารถสร้าง data frame โดยการรวมหลาย ๆ รายการ สิ่งนี้เกี่ยวข้องกับชุดคำสั่ง R เพื่อนำข้อมูลไปสู่รูปแบบใหม่ ซึ่งเรียกว่าการสร้างข้อมูลใหม่

สร้างตัวเลขสุ่ม 4 หมายเลขระหว่าง 0 ถึง 1

ใช้คำสั่ง

installed.packages()

มันแยกสตริงในเวกเตอร์ x เป็นสตริงย่อยที่ตำแหน่งของตัวอักษร e

x <- "The quick brown fox jumps over the lazy dog"
split.string <- strsplit(x, " ")
extract.words <- split.string[[1]]
result <- unique(tolower(extract.words))
print(result)

ข้อผิดพลาดใน v * x [1]: อาร์กิวเมนต์ที่ไม่ใช่ตัวเลขสำหรับตัวดำเนินการไบนารี

[1] 5 12 21 32 วินาที

จะแปลงรายการเป็นเวกเตอร์

x <- pbinom(26,51,0.5)
print(x)

NA

ใช้ฟังก์ชัน as.data.frame ()

function(x) { x[is.na(x)] <- sum(x, na.rm = TRUE); x }

ใช้เพื่อใช้ฟังก์ชันเดียวกันกับแต่ละองค์ประกอบใน Array ตัวอย่างเช่นการหาค่าเฉลี่ยของแถวในทุกแถว

ทุกเมทริกซ์สามารถเรียกได้ว่าเป็นอาร์เรย์ แต่ไม่ใช่การย้อนกลับ เมทริกซ์เป็นสองมิติเสมอ แต่อาร์เรย์สามารถเป็นมิติใดก็ได้

? NA

sd (x, na.rm = จริง)

setwd ("เส้นทาง")

"%%" ให้ส่วนที่เหลือของการหารเวกเตอร์แรกกับวินาทีในขณะที่ "% /%" ให้ผลหารของเวกเตอร์ตัวแรกกับวินาที

ค้นหาคอลัมน์มีค่าสูงสุดสำหรับแต่ละแถว

ประวัติ ()

rm (x)

ข้อมูล (แพ็คเกจ = "MASS")

data(package = .packages(all.available = TRUE))

ใช้เพื่อติดตั้งแพ็กเกจ ar จากไดเร็กทอรีโลคัลโดยการเรียกดูและเลือกไฟล์

15 %in% x
pairs(formula, data)

โดยที่สูตรแสดงถึงชุดของตัวแปรที่ใช้เป็นคู่และข้อมูลแสดงถึงชุดข้อมูลที่จะใช้ตัวแปร

ฟังก์ชัน subset () ใช้เพื่อเลือกตัวแปรและการสังเกต ฟังก์ชัน sample () ใช้เพื่อเลือกตัวอย่างสุ่มขนาด n จากชุดข้อมูล

is.matrix (m) ควรเรียกใช้ TRUE อีกครั้ง

[1] NA

ฟังก์ชัน t () ใช้สำหรับการย้ายเมทริกซ์ ตัวอย่าง - t (m) โดยที่ m เป็นเมทริกซ์

คำสั่ง "next" ในภาษาโปรแกรม R มีประโยชน์เมื่อเราต้องการข้ามการวนซ้ำปัจจุบันของลูปโดยไม่ต้องยุติ

Next คืออะไร?

นอกจากนี้คุณสามารถดูงานที่ได้รับมอบหมายที่ผ่านมาของคุณที่คุณทำกับหัวเรื่องและตรวจสอบให้แน่ใจว่าคุณสามารถพูดกับพวกเขาได้อย่างมั่นใจ หากคุณเป็นคนใหม่ผู้สัมภาษณ์ไม่คาดหวังว่าคุณจะตอบคำถามที่ซับซ้อนมากนัก แต่คุณต้องทำให้แนวคิดพื้นฐานของคุณแข็งแกร่งมาก

ประการที่สองมันไม่สำคัญมากนักหากคุณไม่สามารถตอบคำถามสองสามข้อได้ แต่สิ่งที่สำคัญคือสิ่งที่คุณตอบคุณต้องตอบด้วยความมั่นใจ ดังนั้นเพียงแค่รู้สึกมั่นใจในระหว่างการสัมภาษณ์ของคุณ พวกเราขอให้คุณโชคดีที่มีผู้สัมภาษณ์ที่ดีและสิ่งที่ดีที่สุดสำหรับความพยายามในอนาคตของคุณ ไชโย :-)