컴파일러 설계-상향식 파서
상향식 구문 분석은 트리의 리프 노드에서 시작하여 루트 노드에 도달 할 때까지 위쪽 방향으로 작동합니다. 여기서는 문장에서 시작한 다음 시작 기호에 도달하기 위해 반대 방식으로 생산 규칙을 적용합니다. 아래 주어진 이미지는 사용 가능한 상향식 파서를 보여줍니다.
Shift-Reduce 구문 분석
Shift-reduce 구문 분석은 상향식 구문 분석을 위해 두 가지 고유 한 단계를 사용합니다. 이러한 단계를 시프트 단계 및 감소 단계라고합니다.
Shift step: 시프트 단계는 시프트 된 기호라고하는 다음 입력 기호로 입력 포인터의 전진을 의미합니다. 이 기호는 스택에 푸시됩니다. 이동 된 기호는 구문 분석 트리의 단일 노드로 처리됩니다.
Reduce step: 구문 분석기가 완전한 문법 규칙 (RHS)을 찾아서이를 (LHS)로 대체하는 경우이를 감소 단계라고합니다. 이것은 스택의 맨 위에 핸들이있을 때 발생합니다. 줄이기 위해 스택에서 POP 기능이 수행되어 핸들을 튀어 나와 LHS 비 터미널 기호로 대체합니다.
LR 파서
LR 파서는 비재 귀적, 시프트 감소, 상향식 파서입니다. 그것은 가장 효율적인 구문 분석 기술을 만드는 다양한 종류의 문맥 자유 문법을 사용합니다. LR 파서는 LR (k) 파서라고도합니다. 여기서 L은 입력 스트림의 왼쪽에서 오른쪽 스캔을 나타냅니다. R은 역으로 가장 오른쪽 파생의 구성을 나타내며 k는 결정을 내릴 미리보기 기호의 수를 나타냅니다.
LR 구문 분석기를 구성하는 데 사용할 수있는 널리 사용되는 세 가지 알고리즘이 있습니다.
- SLR (1) – 단순 LR 파서 :
- 최소 클래스의 문법 작업
- 적은 수의 상태, 따라서 매우 작은 테이블
- 간단하고 빠른 시공
- LR (1) – LR 파서 :
- LR (1) 문법 전체 세트에서 작동
- 큰 테이블과 많은 상태를 생성합니다.
- 느린 건설
- LALR (1) – 미리보기 LR 파서 :
- 중간 크기의 문법 작업
- 상태 수는 SLR (1)과 동일합니다.
LR 구문 분석 알고리즘
다음은 LR 파서의 골격 알고리즘을 설명합니다.
token = next_token()
repeat forever
s = top of stack
if action[s, token] = “shift si” then
PUSH token
PUSH si
token = next_token()
else if action[s, token] = “reduce A::= β“ then
POP 2 * |β| symbols
s = top of stack
PUSH A
PUSH goto[s,A]
else if action[s, token] = “accept” then
return
else
error()
LL 대 LR
LL | LR |
---|---|
가장 왼쪽 파생을 수행합니다. | 역으로 가장 오른쪽 파생을 수행합니다. |
스택의 루트 비 터미널에서 시작합니다. | 스택에서 루트 비 터미널로 끝납니다. |
스택이 비어 있으면 종료됩니다. | 빈 스택으로 시작합니다. |
스택을 사용하여 여전히 예상되는 항목을 지정합니다. | 이미 보이는 것을 지정하기 위해 스택을 사용합니다. |
구문 분석 트리를 하향식으로 빌드합니다. | 구문 분석 트리 상향식을 작성합니다. |
스택에서 비 터미널을 계속 꺼내고 해당 오른쪽을 밀어냅니다. | 스택에서 오른쪽을 인식하고 팝하고 해당하는 비 터미널을 푸시합니다. |
비 터미널을 확장합니다. | 비 터미널을 줄입니다. |
스택에서 하나를 꺼내면 터미널을 읽습니다. | 스택에 푸시하는 동안 터미널을 읽습니다. |
구문 분석 트리의 사전 주문 순회. | 구문 분석 트리의 주문 후 순회. |