R-면접 질문
독자 여러분,이 R 인터뷰 질문은 R 프로그래밍 주제에 대한 인터뷰 중에 접할 수있는 질문의 성격을 알 수 있도록 특별히 고안되었습니다. 내 경험에 따르면 좋은 면접관은 면접 중에 특정 질문을 할 계획이 거의 없습니다. 일반적으로 질문은 주제에 대한 기본 개념으로 시작하고 나중에 추가 토론과 답변에 따라 계속됩니다.
R은이를위한 통계 분석 및 그래프 생성을위한 프로그래밍 언어로, 데이터 유형 대신 계산에 사용되는 데이터 개체가 있습니다. 데이터 마이닝, 회귀 분석, 확률 추정 등의 분야에서 사용 가능한 많은 패키지를 사용하여 사용됩니다.
R에는 6 개의 데이터 객체가 있습니다. 이들은 벡터, 목록, 배열, 행렬, 데이터 프레임 및 테이블입니다.
유효한 변수 이름은 문자, 숫자 및 점 또는 밑줄 문자로 구성됩니다. 변수 이름은 문자 또는 점으로 시작하며 뒤에 숫자가 없습니다.
행렬은 행과 열만 있으므로 항상 2 차원입니다. 그러나 배열은 여러 차원이 될 수 있으며 각 차원은 행렬입니다. 예를 들어 3x3x2 배열은 3x3 차원의 행렬 2 개를 각각 나타냅니다.
R의 요인 데이터 개체는 R의 범주 형 데이터를 저장하고 처리하는 데 사용됩니다.
read.csv 함수를 사용하여 csv 파일을로드 할 수 있습니다. R은이 함수를 사용하여 csv 파일을 읽을 때 데이터 프레임을 만듭니다.
getwd () 명령은 R 환경의 현재 작업 디렉토리를 제공합니다.
R 환경 설정시 기본적으로로드되는 패키지입니다. R 환경에서 입력 / 출력, 산술 계산 등과 같은 기본 기능을 제공합니다.
로지스틱 회귀는 이항 반응 변수의 확률 측정을 다룹니다. R에서 glm () 함수는 로지스틱 회귀를 생성하는 데 사용됩니다.
표현식 M [4,2]는 4 번째 행과 2 번째 열에있는 요소를 제공합니다.
길이가 다른 두 벡터가 연산에 포함되면 더 짧은 벡터의 요소를 재사용하여 연산을 완료합니다. 이를 요소 재활용이라고합니다. 예-v1 <-c (4,1,0,6) 및 V2 <-c (2,4) 다음 v1 * v2는 (8,4,0,24)를 제공합니다. 요소 2와 4가 반복됩니다.
우리는 3 가지 방법으로 R에서 함수를 호출 할 수 있습니다. 첫 번째 방법은 인수의 위치를 사용하여 호출하는 것입니다. 인수의 이름을 사용하여 호출 할 두 번째 메서드 ID와 세 번째 메서드는 기본 인수를 호출하는 것입니다.
함수의 지연 평가는 인수가 함수 본문 내에서 사용되는 경우에만 평가됨을 의미합니다. 함수 본문에 인수에 대한 참조가 없으면 무시됩니다.
R에 패키지를 설치하려면 아래 명령을 사용합니다.
install.packages("package Name")
"XML"이라는 패키지는 XML 파일을 읽고 처리하는 데 사용됩니다.
모든 요소를 업데이트 할 수 있지만 목록 끝에있는 요소 만 삭제할 수 있습니다.
R에서 행렬을 만드는 일반적인 표현식은 다음과 같습니다.-matrix (data, nrow, ncol, byrow, dimnames)
boxplot () 함수는 R에서 상자 그림을 만드는 데 사용됩니다. 상자 그림을 만들기위한 입력으로 수식과 데이터 프레임을 사용합니다.
빈도 6은 시계열 데이터의 시간 간격이 1 시간 10 분임을 나타냅니다.
R에서는 데이터 개체를 한 형식에서 다른 형식으로 변환 할 수 있습니다. 예를 들어 많은 목록을 병합하여 데이터 프레임을 만들 수 있습니다. 여기에는 데이터를 새 형식으로 가져 오는 일련의 R 명령이 포함됩니다. 이를 데이터 재구성이라고합니다.
0과 1 사이의 4 개의 난수를 생성합니다.
명령 사용
installed.packages()
벡터 x의 문자열을 문자 e의 위치에서 하위 문자열로 분할합니다.
x <- "The quick brown fox jumps over the lazy dog"
split.string <- strsplit(x, " ")
extract.words <- split.string[[1]]
result <- unique(tolower(extract.words))
print(result)
v * x [1] 오류 : 이항 연산자에 대한 숫자가 아닌 인수
[1] 5 12 21 32 초
목록을 벡터로 변환합니다.
x <- pbinom(26,51,0.5)
print(x)
NA
as.data.frame () 함수 사용
function(x) { x[is.na(x)] <- sum(x, na.rm = TRUE); x }
Array의 각 요소에 동일한 기능을 적용하는 데 사용됩니다. 예를 들어 모든 행에서 행의 평균을 찾습니다.
모든 행렬은 배열이라고 할 수 있지만 그 반대는 아닙니다. 행렬은 항상 2 차원이지만 배열은 모든 차원이 될 수 있습니다.
? NA
sd (x, na.rm = TRUE)
setwd ( "경로")
"%%"는 첫 번째 벡터와 두 번째 나누기의 나머지 부분을 제공하고 "% / %"는 첫 번째 벡터와 두 번째 나누기의 몫을 제공합니다.
열에 각 행의 최대 값이 있습니다.
hist ()
rm (x)
데이터 (패키지 = "MASS")
data(package = .packages(all.available = TRUE))
파일을 찾아보고 선택하여 로컬 디렉토리에서 ar 패키지를 설치하는 데 사용됩니다.
15 %in% x
pairs(formula, data)
수식은 쌍으로 사용되는 일련의 변수를 나타내고 데이터는 변수를 가져올 데이터 집합을 나타냅니다.
subset () 함수는 변수와 관측치를 선택하는 데 사용됩니다. sample () 함수는 데이터 세트에서 크기 n의 무작위 샘플을 선택하는 데 사용됩니다.
is.matrix (m)은 TRUE를 다시 실행해야합니다.
[1] NA
함수 t ()는 행렬을 전치하는 데 사용됩니다. 예-t (m), 여기서 m은 행렬입니다.
R 프로그래밍 언어의 "next"문은 루프를 종료하지 않고 현재 반복되는 루프를 건너 뛰고 싶을 때 유용합니다.
다음은 무엇입니까?
또한 주제에 대해 수행 한 과거 과제를 살펴보고 자신있게 말할 수 있는지 확인할 수 있습니다. 당신이 더 신선하다면 면접관은 당신이 매우 복잡한 질문에 답할 것이라고 기대하지 않고 오히려 당신의 기본 개념을 매우 강하게 만들어야합니다.
둘째, 몇 가지 질문에 답할 수 없다면 그다지 중요하지 않지만 어떤 답을하든 자신있게 대답 했어야합니다. 그러니 인터뷰 중에 자신감을 느끼십시오. 우리는 tutorialspoint에서 좋은 면접관과 미래의 노력을 위해 최선을 다할 수 있기를 바랍니다. 건배 :-)