Automata 이론-퀵 가이드
Automata – 무엇입니까?
"Automata"라는 용어는 "자기 행동"을 의미하는 그리스어 "αὐτόματα"에서 파생되었습니다. 오토 마톤 (Automata in plural)은 자동으로 미리 결정된 일련의 작업을 따르는 추상적 인 자체 추진 컴퓨팅 장치입니다.
유한 수의 상태를 가진 자동 장치를 Finite Automaton (FA) 또는 Finite State Machine (FSM).
유한 오토 마톤의 형식적 정의
오토 마톤은 5- 튜플 (Q, ∑, δ, q 0 , F) 로 나타낼 수 있습니다.
Q 유한 한 상태 집합입니다.
∑ 유한 한 기호 집합입니다. alphabet 자동 기계의.
δ 전환 기능입니다.
q0입력이 처리되는 초기 상태입니다 (q 0 ∈ Q).
F Q의 최종 상태 / 상태 집합입니다 (F ⊆ Q).
관련 용어
알파벳
Definition − 안 alphabet 유한 기호 집합입니다.
Example − ∑ = {a, b, c, d}는 alphabet set 여기서 'a', 'b', 'c'및 'd'는 symbols.
끈
Definition − A string ∑에서 가져온 유한 한 기호 시퀀스입니다.
Example − 'cabcad'는 알파벳 세트 ∑ = {a, b, c, d}에서 유효한 문자열입니다.
문자열의 길이
Definition− 문자열에 존재하는 기호의 수입니다. (로 표시|S|).
Examples −
S = 'cabcad'이면 | S | = 6
| S | = 0이면 empty string (로 표시 λ 또는 ε)
Kleene Star
Definition − Kleene 스타, ∑*, 기호 또는 문자열 집합에 대한 단항 연산자입니다. ∑, 가능한 모든 길이의 가능한 모든 문자열의 무한 세트를 제공합니다. ∑ 포함 λ.
Representation− ∑ * = ∑ 0 ∪ ∑ 1 ∪ ∑ 2 ∪ ……. 여기서 ∑ p 는 길이가 p 인 가능한 모든 문자열의 집합입니다.
Example − 만약 ∑ = {a, b}, ∑ * = {λ, a, b, aa, ab, ba, bb, ……… ..}
Kleene 클로저 / 플러스
Definition − 세트 ∑+ λ를 제외한 ∑ 이상 가능한 모든 길이의 가능한 모든 문자열의 무한 세트입니다.
Representation− ∑ + = ∑ 1 ∪ ∑ 2 ∪ ∑ 3 ∪ ……
∑ + = ∑ * − {λ}
Example− ∑ = {a, b}, ∑ + = {a, b, aa, ab, ba, bb, ……… ..}
언어
Definition− 언어는 일부 알파벳 ∑에 대한 ∑ *의 하위 집합입니다. 유한하거나 무한 할 수 있습니다.
Example − 언어가 ∑ = {a, b}를 초과하는 길이 2의 가능한 모든 문자열을 취하면 L = {ab, aa, ba, bb}
유한 오토 마톤은 두 가지 유형으로 분류 할 수 있습니다.
- 결정 론적 유한 오토 마톤 (DFA)
- 비 결정적 유한 오토 마톤 (NDFA / NFA)
결정 론적 유한 오토 마톤 (DFA)
DFA에서는 각 입력 기호에 대해 머신이 이동할 상태를 결정할 수 있습니다. 따라서Deterministic Automaton. 유한 수의 상태를 가지고 있기 때문에 기계는Deterministic Finite Machine 또는 Deterministic Finite Automaton.
DFA의 공식적인 정의
DFA는 5- 튜플 (Q, ∑, δ, q 0 , F) 로 표현할 수 있습니다.
Q 유한 한 상태 집합입니다.
∑ 알파벳이라고하는 유한 한 기호 집합입니다.
δ δ : Q × ∑ → Q
q0입력이 처리되는 초기 상태입니다 (q 0 ∈ Q).
F Q의 최종 상태 / 상태 집합입니다 (F ⊆ Q).
DFA의 그래픽 표현
DFA는 state diagram.
- 정점은 상태를 나타냅니다.
- 입력 알파벳으로 표시된 호는 전환을 보여줍니다.
- 초기 상태는 빈 단일 들어오는 호로 표시됩니다.
- 최종 상태는 이중 원으로 표시됩니다.
예
결정 론적 유한 오토 마톤을 →
- Q = {a, b, c},
- ∑ = {0, 1},
- q 0 = {a},
- F = {c} 및
다음 표에 표시된 전이 함수 δ-
현재 상태 | 입력 0의 다음 상태 | 입력 1의 다음 상태 |
---|---|---|
a | ㅏ | 비 |
b | 씨 | ㅏ |
c | 비 | 씨 |
그래픽 표현은 다음과 같습니다.
NDFA에서 특정 입력 기호에 대해 기계는 기계의 모든 상태 조합으로 이동할 수 있습니다. 즉, 기계가 이동하는 정확한 상태를 확인할 수 없습니다. 따라서Non-deterministic Automaton. 유한 수의 상태를 가지고 있기 때문에 기계는Non-deterministic Finite Machine 또는 Non-deterministic Finite Automaton.
NDFA의 공식적인 정의
NDFA는 5- 튜플 (Q, ∑, δ, q 0 , F) 로 나타낼 수 있습니다.
Q 유한 한 상태 집합입니다.
∑ 알파벳이라고하는 유한 한 기호 집합입니다.
δδ : Q × ∑ → 2 Q
(여기서 Q (2의 멱 집합 Q는 NDFA의 경우 상태에서, Q는 전이 상태의 임의의 조합으로 발생할 수 있기 때문에) 수행되었다)
q0입력이 처리되는 초기 상태입니다 (q 0 ∈ Q).
F Q의 최종 상태 / 상태 집합입니다 (F ⊆ Q).
NDFA의 그래픽 표현 : (DFA와 동일)
NDFA는 상태 다이어그램이라는 digraphs로 표시됩니다.
- 정점은 상태를 나타냅니다.
- 입력 알파벳으로 표시된 호는 전환을 보여줍니다.
- 초기 상태는 빈 단일 들어오는 호로 표시됩니다.
- 최종 상태는 이중 원으로 표시됩니다.
Example
비 결정적 유한 오토 마톤을 →
- Q = {a, b, c}
- ∑ = {0, 1}
- q 0 = {a}
- F = {c}
다음과 같이 전이 함수 δ-
현재 상태 | 입력 0의 다음 상태 | 입력 1의 다음 상태 |
---|---|---|
ㅏ | a, b | 비 |
비 | 씨 | a, c |
씨 | b, c | 씨 |
그래픽 표현은 다음과 같습니다.
DFA와 NDFA
다음 표에는 DFA와 NDFA의 차이점이 나와 있습니다.
DFA | NDFA |
---|---|
상태에서 각 입력 기호에 대해 하나의 특정 다음 상태로 전환됩니다. 따라서 결정 론적 이라고 합니다. | 상태에서 각 입력 기호에 대해 여러 다음 상태로 전환 될 수 있습니다. 따라서 비 결정적 이라고 합니다. |
빈 문자열 전환은 DFA에 표시되지 않습니다. | NDFA는 빈 문자열 전환을 허용합니다. |
역 추적은 DFA에서 허용됩니다. | NDFA에서는 역 추적이 항상 가능한 것은 아닙니다. |
더 많은 공간이 필요합니다. | 더 적은 공간이 필요합니다. |
문자열이 최종 상태로 전환되면 DFA에서 허용됩니다. | 가능한 모든 전환 중 하나 이상이 최종 상태에서 끝나는 경우 NDFA에서 문자열을 수락합니다. |
수용자, 분류기 및 변환기
수락 자 (Recognizer)
부울 함수를 계산하는 자동 장치를 acceptor. 수락 자의 모든 상태는 주어진 입력을 수락하거나 거부합니다.
분류 자
ㅏ classifier 두 개 이상의 최종 상태가 있으며 종료시 단일 출력을 제공합니다.
변환기
현재 입력 및 / 또는 이전 상태를 기반으로 출력을 생성하는 자동 장치를 transducer. 변환기는 두 가지 유형이 있습니다.
Mealy Machine − 출력은 현재 상태와 현재 입력에 따라 달라집니다.
Moore Machine − 출력은 현재 상태에만 의존합니다.
DFA 및 NDFA의 허용 여부
초기 상태에서 시작하는 DFA / NDFA가 문자열을 완전히 읽은 후 수락 상태 (모든 최종 상태)로 끝나는 경우 DFA / NDFA에서 문자열을 수락합니다.
문자열 S는 DFA / NDFA (Q, ∑, δ, q 0 , F)에서 허용됩니다.
δ*(q0, S) ∈ F
언어 L DFA / NDFA에서 허용하는
{S | S ∈ ∑* and δ*(q0, S) ∈ F}
문자열 S '는 DFA / NDFA에서 허용되지 않습니다 (Q, ∑, δ, q 0 , F), iff
δ*(q0, S′) ∉ F
DFA / NDFA에서 허용하지 않는 언어 L '(허용되는 언어 L의 보완)은
{S | S ∈ ∑* and δ*(q0, S) ∉ F}
Example
그림 1.3에 표시된 DFA를 살펴 보겠습니다. DFA에서 허용되는 문자열을 파생 할 수 있습니다.
위 DFA에서 허용하는 문자열 : {0, 00, 11, 010, 101, ...........}
위 DFA에서 허용되지 않는 문자열 : {1, 011, 111, ........}
문제 설명
허락하다 X = (Qx, ∑, δx, q0, Fx)L (X) 언어를 허용하는 NDFA 여야합니다. 동등한 DFA를 설계해야합니다.Y = (Qy, ∑, δy, q0, Fy) 그런 L(Y) = L(X). 다음 절차는 NDFA를 동등한 DFA로 변환합니다.
연산
Input − NDFA
Output − 동등한 DFA
Step 1 − 주어진 NDFA에서 상태 테이블을 생성합니다.
Step 2 − 동등한 DFA에 대해 가능한 입력 알파벳 아래에 빈 상태 테이블을 생성합니다.
Step 3 − DFA의 시작 상태를 q0 (NDFA와 동일)으로 표시합니다.
Step 4− 가능한 각 입력 알파벳에 대한 상태 {Q 0 , Q 1 , ..., Q n } 조합을 찾으십시오 .
Step 5 − 입력 알파벳 열 아래에 새 DFA 상태를 생성 할 때마다 4 단계를 다시 적용해야합니다. 그렇지 않으면 6 단계로 이동합니다.
Step 6 − NDFA의 최종 상태를 포함하는 상태는 동등한 DFA의 최종 상태입니다.
예
아래 그림에 표시된 NDFA를 고려해 보겠습니다.
큐 | δ (q, 0) | δ (q, 1) |
---|---|---|
ㅏ | {에이 비 씨 디이} | {d, e} |
비 | {씨} | {이자형} |
씨 | ∅ | {비} |
디 | {이자형} | ∅ |
이자형 | ∅ | ∅ |
위의 알고리즘을 사용하여 동등한 DFA를 찾습니다. DFA의 상태 표는 아래와 같습니다.
큐 | δ (q, 0) | δ (q, 1) |
---|---|---|
[ㅏ] | [에이 비 씨 디이] | [d, e] |
[에이 비 씨 디이] | [에이 비 씨 디이] | [b, d, e] |
[d, e] | [이자형] | ∅ |
[b, d, e] | [c, e] | [이자형] |
[이자형] | ∅ | ∅ |
[c, e] | ∅ | [비] |
[비] | [씨] | [이자형] |
[씨] | ∅ | [비] |
DFA의 상태 다이어그램은 다음과 같습니다.
Myhill-Nerode 정리를 사용한 DFA 최소화
연산
Input − DFA
Output − 최소화 된 DFA
Step 1− 반드시 직접 연결되지 않은 모든 상태 쌍 (Q i , Q j )에 대한 표를 그립니다. [초기에는 모두 표시 해제 됨]
Step 2− Q i ∈ F 및 Q j ∉ F 또는 그 반대 인 DFA의 모든 상태 쌍 (Q i , Q j )을 고려 하고 표시합니다. [여기 F는 최종 상태 집합입니다.]
Step 3 − 더 이상 상태를 표시 할 수 없을 때까지이 단계를 반복합니다. −
표시되지 않은 쌍 (Q i , Q j )이있는 경우 일부 입력 알파벳에 대해 쌍 {δ (Q i , A), δ (Q i , A)}가 표시되어 있으면 표시하십시오.
Step 4− 표시되지 않은 모든 쌍 (Q i , Q j )을 결합하여 축소 된 DFA에서 단일 상태로 만듭니다.
예
알고리즘 2를 사용하여 아래 표시된 DFA를 최소화하겠습니다.
Step 1 − 모든 상태 쌍에 대한 표를 그립니다.
ㅏ | 비 | 씨 | 디 | 이자형 | 에프 | |
ㅏ | ||||||
비 | ||||||
씨 | ||||||
디 | ||||||
이자형 | ||||||
에프 |
Step 2 − 상태 쌍을 표시합니다.
ㅏ | 비 | 씨 | 디 | 이자형 | 에프 | |
ㅏ | ||||||
비 | ||||||
씨 | ✔ | ✔ | ||||
디 | ✔ | ✔ | ||||
이자형 | ✔ | ✔ | ||||
에프 | ✔ | ✔ | ✔ |
Step 3− 녹색 체크 표시로 상태 쌍을 전 이적으로 표시하려고합니다. 상태 'a'와 'f'에 1을 입력하면 각각 'c'와 'f'상태로 이동합니다. (c, f)는 이미 표시되어 있으므로 쌍 (a, f)를 표시합니다. 이제 'b'와 'f'상태에 1을 입력합니다. 각각 'd'와 'f'상태가됩니다. (d, f)는 이미 표시되어 있으므로 쌍 (b, f)를 표시합니다.
ㅏ | 비 | 씨 | 디 | 이자형 | 에프 | |
ㅏ | ||||||
비 | ||||||
씨 | ✔ | ✔ | ||||
디 | ✔ | ✔ | ||||
이자형 | ✔ | ✔ | ||||
에프 | ✔ | ✔ | ✔ | ✔ | ✔ |
3 단계 후에는 표시되지 않은 상태 조합 {a, b} {c, d} {c, e} {d, e}가 있습니다.
{c, d} {c, e} {d, e}를 {c, d, e}로 재결합 할 수 있습니다.
따라서 우리는-{a, b} 및 {c, d, e}와 같은 두 가지 결합 상태를 얻었습니다.
따라서 최소화 된 최종 DFA에는 {f}, {a, b} 및 {c, d, e}의 세 가지 상태가 포함됩니다.
등가 정리를 사용한 DFA 최소화
X와 Y가 DFA에서 두 상태 인 경우 구별 할 수없는 경우이 두 상태를 {X, Y}로 결합 할 수 있습니다. δ (X, S) 및 δ (Y, S) 중 하나는 수락하고 다른 하나는 수락하지 않는 문자열 S가 하나 이상있는 경우 두 상태를 구별 할 수 있습니다. 따라서 DFA는 모든 상태를 구별 할 수있는 경우에만 최소입니다.
알고리즘 3
Step 1 − 모든 주 Q 두 개의 파티션으로 나뉩니다. final states 과 non-final states 다음으로 표시됩니다. P0. 파티션의 모든 상태는 0 번째에 해당합니다. 카운터 가져가k 0으로 초기화합니다.
Step 2− k를 1 씩 증가시킵니다. P k의 각 분할에 대해 k로 구분할 수있는 경우 P k 의 상태 를 두 분할로 나눕니다 . 이 파티션 X와 Y 내의 두 상태는 입력이있는 경우 k로 구분할 수 있습니다.S 그런 δ(X, S) 과 δ(Y, S) (k-1) 구별 가능합니다.
Step 3− P k ≠ P k-1 이면 2 단계를 반복하고 그렇지 않으면 4 단계로 이동합니다.
Step 4− k 번째 등가 세트를 결합 하여 축소 된 DFA의 새로운 상태로 만듭니다.
예
다음 DFA를 살펴 보겠습니다.
큐 | δ (q, 0) | δ (q, 1) |
---|---|---|
ㅏ | 비 | 씨 |
비 | ㅏ | 디 |
씨 | 이자형 | 에프 |
디 | 이자형 | 에프 |
이자형 | 이자형 | 에프 |
에프 | 에프 | 에프 |
위의 DFA에 위의 알고리즘을 적용 해 보겠습니다.
- P 0 = {(c, d, e), (a, b, f)}
- P 1 = {(c, d, e), (a, b), (f)}
- P 2 = {(c, d, e), (a, b), (f)}
따라서 P 1 = P 2 .
축소 된 DFA에는 세 가지 상태가 있습니다. 축소 된 DFA는 다음과 같습니다.
큐 | δ (q, 0) | δ (q, 1) |
---|---|---|
(a, b) | (a, b) | (c, d, e) |
(c, d, e) | (c, d, e) | (에프) |
(에프) | (에프) | (에프) |
유한 오토마타는 각 전환에 해당하는 출력을 가질 수 있습니다. 출력을 생성하는 두 가지 유형의 유한 상태 기계가 있습니다.
- 가루 기계
- 무어 머신
가루 기계
Mealy Machine은 현재 입력뿐만 아니라 현재 상태에 따라 출력이 달라지는 FSM입니다.
6 개의 튜플 (Q, ∑, O, δ, X, q 0 ) 으로 설명 할 수 있습니다.
Q 유한 한 상태 집합입니다.
∑ 입력 알파벳이라고하는 유한 한 기호 집합입니다.
O 출력 알파벳이라고하는 유한 한 기호 집합입니다.
δ δ : Q × ∑ → Q 인 입력 전환 함수입니다.
X X : Q × ∑ → O 인 출력 전환 함수입니다.
q0입력이 처리되는 초기 상태입니다 (q 0 ∈ Q).
Mealy 머신의 상태 테이블은 다음과 같습니다.
현재 상태 | 다음 상태 | |||
---|---|---|---|---|
입력 = 0 | 입력 = 1 | |||
상태 | 산출 | 상태 | 산출 | |
→ a | 비 | x 1 | 씨 | x 1 |
비 | 비 | x 2 | 디 | x 3 |
씨 | 디 | x 3 | 씨 | x 1 |
디 | 디 | x 3 | 디 | x 2 |
위의 Mealy Machine의 상태 다이어그램은 다음과 같습니다.
무어 머신
무어 머신은 출력이 현재 상태에만 의존하는 FSM입니다.
무어 머신은 6 개의 튜플 (Q, ∑, O, δ, X, q 0 ) 으로 설명 할 수 있습니다.
Q 유한 한 상태 집합입니다.
∑ 입력 알파벳이라고하는 유한 한 기호 집합입니다.
O 출력 알파벳이라고하는 유한 한 기호 집합입니다.
δ δ : Q × ∑ → Q 인 입력 전환 함수입니다.
X X : Q → O 인 출력 전환 함수입니다.
q0입력이 처리되는 초기 상태입니다 (q 0 ∈ Q).
무어 머신의 상태 테이블은 다음과 같습니다.
현재 상태 | 다음 상태 | 산출 | |
---|---|---|---|
입력 = 0 | 입력 = 1 | ||
→ a | 비 | 씨 | x 2 |
비 | 비 | 디 | x 1 |
씨 | 씨 | 디 | x 2 |
디 | 디 | 디 | x 3 |
위의 Moore Machine의 상태 다이어그램은 다음과 같습니다.
밀리 머신 대 무어 머신
다음 표는 Mealy 머신과 Moore 머신을 구별하는 요점을 강조합니다.
가루 기계 | 무어 머신 |
---|---|
출력은 현재 상태와 현재 입력 모두에 따라 다릅니다. | 출력은 현재 상태에만 의존합니다. |
일반적으로 Moore Machine보다 상태가 적습니다. | 일반적으로 Mealy Machine보다 더 많은 상태가 있습니다. |
출력 함수의 값은 현재 상태의 입력 논리가 완료 될 때 전환 및 변경의 함수입니다. | 출력 함수의 값은 현재 상태의 함수이며 상태가 변경 될 때마다 클럭 에지에서 변경됩니다. |
Mealy 기계는 입력에 더 빠르게 반응합니다. 그들은 일반적으로 동일한 클록 사이클에서 반응합니다. | 무어 머신에서는 출력을 디코딩하는 데 더 많은 로직이 필요하므로 더 많은 회로 지연이 발생합니다. 일반적으로 한 클록주기 후에 반응합니다. |
무어 머신에서 밀리 머신으로
알고리즘 4
Input − 무어 머신
Output − 밀리 머신
Step 1 − 빈 Mealy Machine 전환 테이블 형식을 가져옵니다.
Step 2 − 모든 무어 머신 전환 상태를이 테이블 형식으로 복사합니다.
Step 3− Moore Machine 상태 테이블에서 현재 상태와 해당 출력을 확인합니다. 상태 Q i 출력이 m이면 Q i 가 다음 상태에 나타날 때마다 Mealy Machine 상태 테이블의 출력 열에 복사합니다 .
예
다음과 같은 Moore 기계를 고려해 보겠습니다.
현재 상태 | 다음 상태 | 산출 | |
---|---|---|---|
a = 0 | a = 1 | ||
→ a | 디 | 비 | 1 |
비 | ㅏ | 디 | 0 |
씨 | 씨 | 씨 | 0 |
디 | 비 | ㅏ | 1 |
이제 Algorithm 4를 적용하여 Mealy Machine으로 변환합니다.
Step 1 & 2 −
현재 상태 | 다음 상태 | |||
---|---|---|---|---|
a = 0 | a = 1 | |||
상태 | 산출 | 상태 | 산출 | |
→ a | 디 | 비 | ||
비 | ㅏ | 디 | ||
씨 | 씨 | 씨 | ||
디 | 비 | ㅏ |
Step 3 −
현재 상태 | 다음 상태 | |||
---|---|---|---|---|
a = 0 | a = 1 | |||
상태 | 산출 | 상태 | 산출 | |
=> a | 디 | 1 | 비 | 0 |
비 | ㅏ | 1 | 디 | 1 |
씨 | 씨 | 0 | 씨 | 0 |
디 | 비 | 0 | ㅏ | 1 |
밀리 머신에서 무어 머신으로
알고리즘 5
Input − 밀리 머신
Output − 무어 머신
Step 1− Mealy 머신의 상태 테이블에서 사용할 수있는 각 상태 (Q i )에 대해 서로 다른 출력 수를 계산합니다 .
Step 2− Qi의 모든 출력이 같으면 상태 Q i를 복사 합니다. 그것은 별개의 N 출력이 경우, Q를 중단 I를 Q로서 N 상태로 의n = 0, 1, 2 .......
Step 3 − 초기 상태의 출력이 1이면 처음에 0을 출력하는 새로운 초기 상태를 삽입합니다.
예
다음 Mealy Machine을 고려해 보겠습니다.
현재 상태 | 다음 상태 | |||
---|---|---|---|---|
a = 0 | a = 1 | |||
다음 상태 | 산출 | 다음 상태 | 산출 | |
→ a | 디 | 0 | 비 | 1 |
비 | ㅏ | 1 | 디 | 0 |
씨 | 씨 | 1 | 씨 | 0 |
디 | 비 | 0 | ㅏ | 1 |
여기서 상태 'a'와 'd'는 각각 1과 0의 출력 만 제공하므로 상태 'a'와 'd'를 유지합니다. 그러나 상태 'b'와 'c'는 다른 출력 (1 및 0)을 생성합니다. 그래서 우리는b 으로 b0, b1 과 c 으로 c0, c1.
현재 상태 | 다음 상태 | 산출 | |
---|---|---|---|
a = 0 | a = 1 | ||
→ a | d | b1 | 1 |
b0 | a | d | 0 |
b1 | a | d | 1 |
c0 | c1 | C0 | 0 |
c1 | c1 | C0 | 1 |
d | b0 | a | 0 |
n the literary sense of the term, grammars denote syntactical rules for conversation in natural languages. Linguistics have attempted to define grammars since the inception of natural languages like English, Sanskrit, Mandarin, etc.
The theory of formal languages finds its applicability extensively in the fields of Computer Science. Noam Chomsky gave a mathematical model of grammar in 1956 which is effective for writing computer languages.
Grammar
A grammar G can be formally written as a 4-tuple (N, T, S, P) where −
N or VN is a set of variables or non-terminal symbols.
T or ∑ is a set of Terminal symbols.
S is a special variable called the Start symbol, S ∈ N
P is Production rules for Terminals and Non-terminals. A production rule has the form α → β, where α and β are strings on VN ∪ ∑ and least one symbol of α belongs to VN.
Example
Grammar G1 −
({S, A, B}, {a, b}, S, {S → AB, A → a, B → b})
Here,
S, A, and B are Non-terminal symbols;
a and b are Terminal symbols
S is the Start symbol, S ∈ N
Productions, P : S → AB, A → a, B → b
Example
Grammar G2 −
(({S, A}, {a, b}, S,{S → aAb, aA → aaAb, A → ε } )
Here,
S and A are Non-terminal symbols.
a and b are Terminal symbols.
ε is an empty string.
S is the Start symbol, S ∈ N
Production P : S → aAb, aA → aaAb, A → ε
Derivations from a Grammar
Strings may be derived from other strings using the productions in a grammar. If a grammar G has a production α → β, we can say that x α y derives x β y in G. This derivation is written as −
x α y ⇒G x β y
Example
Let us consider the grammar −
G2 = ({S, A}, {a, b}, S, {S → aAb, aA → aaAb, A → ε } )
Some of the strings that can be derived are −
S ⇒ aAb using production S → aAb
⇒ aaAbb using production aA → aAb
⇒ aaaAbbb using production aA → aAb
⇒ aaabbb using production A → ε
The set of all strings that can be derived from a grammar is said to be the language generated from that grammar. A language generated by a grammar G is a subset formally defined by
L(G)={W|W ∈ ∑*, S ⇒G W}
If L(G1) = L(G2), the Grammar G1 is equivalent to the Grammar G2.
Example
If there is a grammar
G: N = {S, A, B} T = {a, b} P = {S → AB, A → a, B → b}
Here S produces AB, and we can replace A by a, and B by b. Here, the only accepted string is ab, i.e.,
L(G) = {ab}
Example
Suppose we have the following grammar −
G: N = {S, A, B} T = {a, b} P = {S → AB, A → aA|a, B → bB|b}
The language generated by this grammar −
L(G) = {ab, a2b, ab2, a2b2, ………}
= {am bn | m ≥ 1 and n ≥ 1}
Construction of a Grammar Generating a Language
We’ll consider some languages and convert it into a grammar G which produces those languages.
Example
Problem − Suppose, L (G) = {am bn | m ≥ 0 and n > 0}. We have to find out the grammar G which produces L(G).
Solution
Since L(G) = {am bn | m ≥ 0 and n > 0}
the set of strings accepted can be rewritten as −
L(G) = {b, ab,bb, aab, abb, …….}
Here, the start symbol has to take at least one ‘b’ preceded by any number of ‘a’ including null.
To accept the string set {b, ab, bb, aab, abb, …….}, we have taken the productions −
S → aS , S → B, B → b and B → bB
S → B → b (Accepted)
S → B → bB → bb (Accepted)
S → aS → aB → ab (Accepted)
S → aS → aaS → aaB → aab(Accepted)
S → aS → aB → abB → abb (Accepted)
Thus, we can prove every single string in L(G) is accepted by the language generated by the production set.
Hence the grammar −
G: ({S, A, B}, {a, b}, S, { S → aS | B , B → b | bB })
Example
Problem − Suppose, L (G) = {am bn | m > 0 and n ≥ 0}. We have to find out the grammar G which produces L(G).
Solution −
Since L(G) = {am bn | m > 0 and n ≥ 0}, the set of strings accepted can be rewritten as −
L(G) = {a, aa, ab, aaa, aab ,abb, …….}
Here, the start symbol has to take at least one ‘a’ followed by any number of ‘b’ including null.
To accept the string set {a, aa, ab, aaa, aab, abb, …….}, we have taken the productions −
S → aA, A → aA , A → B, B → bB ,B → λ
S → aA → aB → aλ → a (Accepted)
S → aA → aaA → aaB → aaλ → aa (Accepted)
S → aA → aB → abB → abλ → ab (Accepted)
S → aA → aaA → aaaA → aaaB → aaaλ → aaa (Accepted)
S → aA → aaA → aaB → aabB → aabλ → aab (Accepted)
S → aA → aB → abB → abbB → abbλ → abb (Accepted)
Thus, we can prove every single string in L(G) is accepted by the language generated by the production set.
Hence the grammar −
G: ({S, A, B}, {a, b}, S, {S → aA, A → aA | B, B → λ | bB })
According to Noam Chomosky, there are four types of grammars − Type 0, Type 1, Type 2, and Type 3. The following table shows how they differ from each other −
Grammar Type | Grammar Accepted | Language Accepted | Automaton |
---|---|---|---|
Type 0 | Unrestricted grammar | Recursively enumerable language | Turing Machine |
Type 1 | Context-sensitive grammar | Context-sensitive language | Linear-bounded automaton |
Type 2 | Context-free grammar | Context-free language | Pushdown automaton |
Type 3 | Regular grammar | Regular language | Finite state automaton |
Take a look at the following illustration. It shows the scope of each type of grammar −
Type - 3 Grammar
Type-3 grammars generate regular languages. Type-3 grammars must have a single non-terminal on the left-hand side and a right-hand side consisting of a single terminal or single terminal followed by a single non-terminal.
The productions must be in the form X → a or X → aY
where X, Y ∈ N (Non terminal)
and a ∈ T (Terminal)
The rule S → ε is allowed if S does not appear on the right side of any rule.
Example
X → ε
X → a | aY
Y → b
Type - 2 Grammar
Type-2 grammars generate context-free languages.
The productions must be in the form A → γ
where A ∈ N (Non terminal)
and γ ∈ (T ∪ N)* (String of terminals and non-terminals).
These languages generated by these grammars are be recognized by a non-deterministic pushdown automaton.
Example
S → X a
X → a
X → aX
X → abc
X → ε
Type - 1 Grammar
Type-1 grammars generate context-sensitive languages. The productions must be in the form
α A β → α γ β
where A ∈ N (Non-terminal)
and α, β, γ ∈ (T ∪ N)* (Strings of terminals and non-terminals)
The strings α and β may be empty, but γ must be non-empty.
The rule S → ε is allowed if S does not appear on the right side of any rule. The languages generated by these grammars are recognized by a linear bounded automaton.
Example
AB → AbBc
A → bcA
B → b
Type - 0 Grammar
Type-0 grammars generate recursively enumerable languages. The productions have no restrictions. They are any phase structure grammar including all formal grammars.
They generate the languages that are recognized by a Turing machine.
The productions can be in the form of α → β where α is a string of terminals and nonterminals with at least one non-terminal and α cannot be null. β is a string of terminals and non-terminals.
Example
S → ACaB
Bc → acB
CB → DB
aD → Db
A Regular Expression can be recursively defined as follows −
ε is a Regular Expression indicates the language containing an empty string. (L (ε) = {ε})
φ is a Regular Expression denoting an empty language. (L (φ) = { })
x is a Regular Expression where L = {x}
If X is a Regular Expression denoting the language L(X) and Y is a Regular Expression denoting the language L(Y), then
X + Y is a Regular Expression corresponding to the language L(X) ∪ L(Y) where L(X+Y) = L(X) ∪ L(Y).
X . Y is a Regular Expression corresponding to the language L(X) . L(Y) where L(X.Y) = L(X) . L(Y)
R* is a Regular Expression corresponding to the language L(R*)where L(R*) = (L(R))*
If we apply any of the rules several times from 1 to 5, they are Regular Expressions.
Some RE Examples
Regular Expressions | Regular Set |
---|---|
(0 + 10*) | L = { 0, 1, 10, 100, 1000, 10000, … } |
(0*10*) | L = {1, 01, 10, 010, 0010, …} |
(0 + ε)(1 + ε) | L = {ε, 0, 1, 01} |
(a+b)* | Set of strings of a’s and b’s of any length including the null string. So L = { ε, a, b, aa , ab , bb , ba, aaa…….} |
(a+b)*abb | Set of strings of a’s and b’s ending with the string abb. So L = {abb, aabb, babb, aaabb, ababb, …………..} |
(11)* | Set consisting of even number of 1’s including empty string, So L= {ε, 11, 1111, 111111, ……….} |
(aa)*(bb)*b | Set of strings consisting of even number of a’s followed by odd number of b’s , so L = {b, aab, aabbb, aabbbbb, aaaab, aaaabbb, …………..} |
(aa + ab + ba + bb)* | String of a’s and b’s of even length can be obtained by concatenating any combination of the strings aa, ab, ba and bb including null, so L = {aa, ab, ba, bb, aaab, aaba, …………..} |
Any set that represents the value of the Regular Expression is called a Regular Set.
Properties of Regular Sets
Property 1. The union of two regular set is regular.
Proof −
Let us take two regular expressions
RE1 = a(aa)* and RE2 = (aa)*
So, L1 = {a, aaa, aaaaa,.....} (Strings of odd length excluding Null)
and L2 ={ ε, aa, aaaa, aaaaaa,.......} (Strings of even length including Null)
L1 ∪ L2 = { ε, a, aa, aaa, aaaa, aaaaa, aaaaaa,.......}
(Strings of all possible lengths including Null)
RE (L1 ∪ L2) = a* (which is a regular expression itself)
Hence, proved.
Property 2. The intersection of two regular set is regular.
Proof −
Let us take two regular expressions
RE1 = a(a*) and RE2 = (aa)*
So, L1 = { a,aa, aaa, aaaa, ....} (Strings of all possible lengths excluding Null)
L2 = { ε, aa, aaaa, aaaaaa,.......} (Strings of even length including Null)
L1 ∩ L2 = { aa, aaaa, aaaaaa,.......} (Strings of even length excluding Null)
RE (L1 ∩ L2) = aa(aa)* which is a regular expression itself.
Hence, proved.
Property 3. The complement of a regular set is regular.
Proof −
Let us take a regular expression −
RE = (aa)*
So, L = {ε, aa, aaaa, aaaaaa, .......} (Strings of even length including Null)
Complement of L is all the strings that is not in L.
So, L’ = {a, aaa, aaaaa, .....} (Strings of odd length excluding Null)
RE (L’) = a(aa)* which is a regular expression itself.
Hence, proved.
Property 4. The difference of two regular set is regular.
Proof −
Let us take two regular expressions −
RE1 = a (a*) and RE2 = (aa)*
So, L1 = {a, aa, aaa, aaaa, ....} (Strings of all possible lengths excluding Null)
L2 = { ε, aa, aaaa, aaaaaa,.......} (Strings of even length including Null)
L1 – L2 = {a, aaa, aaaaa, aaaaaaa, ....}
(Strings of all odd lengths excluding Null)
RE (L1 – L2) = a (aa)* which is a regular expression.
Hence, proved.
Property 5. The reversal of a regular set is regular.
Proof −
We have to prove LR is also regular if L is a regular set.
Let, L = {01, 10, 11, 10}
RE (L) = 01 + 10 + 11 + 10
LR = {10, 01, 11, 01}
RE (LR) = 01 + 10 + 11 + 10 which is regular
Hence, proved.
Property 6. The closure of a regular set is regular.
Proof −
If L = {a, aaa, aaaaa, .......} (Strings of odd length excluding Null)
i.e., RE (L) = a (aa)*
L* = {a, aa, aaa, aaaa , aaaaa,……………} (Strings of all lengths excluding Null)
RE (L*) = a (a)*
Hence, proved.
Property 7. The concatenation of two regular sets is regular.
Proof −
Let RE1 = (0+1)*0 and RE2 = 01(0+1)*
Here, L1 = {0, 00, 10, 000, 010, ......} (Set of strings ending in 0)
and L2 = {01, 010,011,.....} (Set of strings beginning with 01)
Then, L1 L2 = {001,0010,0011,0001,00010,00011,1001,10010,.............}
Set of strings containing 001 as a substring which can be represented by an RE − (0 + 1)*001(0 + 1)*
Hence, proved.
Identities Related to Regular Expressions
Given R, P, L, Q as regular expressions, the following identities hold −
- ∅* = ε
- ε* = ε
- RR* = R*R
- R*R* = R*
- (R*)* = R*
- RR* = R*R
- (PQ)*P =P(QP)*
- (a+b)* = (a*b*)* = (a*+b*)* = (a+b*)* = a*(ba*)*
- R + ∅ = ∅ + R = R (The identity for union)
- R ε = ε R = R (The identity for concatenation)
- ∅ L = L ∅ = ∅ (The annihilator for concatenation)
- R + R = R (Idempotent law)
- L (M + N) = LM + LN (Left distributive law)
- (M + N) L = ML + NL (Right distributive law)
- ε + RR* = ε + R*R = R*
In order to find out a regular expression of a Finite Automaton, we use Arden’s Theorem along with the properties of regular expressions.
Statement −
Let P and Q be two regular expressions.
If P does not contain null string, then R = Q + RP has a unique solution that is R = QP*
Proof −
R = Q + (Q + RP)P [After putting the value R = Q + RP]
= Q + QP + RPP
When we put the value of R recursively again and again, we get the following equation −
R = Q + QP + QP2 + QP3…..
R = Q (ε + P + P2 + P3 + …. )
R = QP* [As P* represents (ε + P + P2 + P3 + ….) ]
Hence, proved.
Assumptions for Applying Arden’s Theorem
- The transition diagram must not have NULL transitions
- It must have only one initial state
Method
Step 1 − Create equations as the following form for all the states of the DFA having n states with initial state q1.
q1 = q1R11 + q2R21 + … + qnRn1 + ε
q2 = q1R12 + q2R22 + … + qnRn2
…………………………
…………………………
…………………………
…………………………
qn = q1R1n + q2R2n + … + qnRnn
Rij represents the set of labels of edges from qi to qj, if no such edge exists, then Rij = ∅
Step 2 − Solve these equations to get the equation for the final state in terms of Rij
Problem
Construct a regular expression corresponding to the automata given below −
Solution −
Here the initial state and final state is q1.
The equations for the three states q1, q2, and q3 are as follows −
q1 = q1a + q3a + ε (ε move is because q1 is the initial state0
q2 = q1b + q2b + q3b
q3 = q2a
Now, we will solve these three equations −
q2 = q1b + q2b + q3b
= q1b + q2b + (q2a)b (Substituting value of q3)
= q1b + q2(b + ab)
= q1b (b + ab)* (Applying Arden’s Theorem)
q1 = q1a + q3a + ε
= q1a + q2aa + ε (Substituting value of q3)
= q1a + q1b(b + ab*)aa + ε (Substituting value of q2)
= q1(a + b(b + ab)*aa) + ε
= ε (a+ b(b + ab)*aa)*
= (a + b(b + ab)*aa)*
Hence, the regular expression is (a + b(b + ab)*aa)*.
Problem
Construct a regular expression corresponding to the automata given below −
Solution −
Here the initial state is q1 and the final state is q2
Now we write down the equations −
q1 = q10 + ε
q2 = q11 + q20
q3 = q21 + q30 + q31
Now, we will solve these three equations −
q1 = ε0* [As, εR = R]
So, q1 = 0*
q2 = 0*1 + q20
So, q2 = 0*1(0)* [By Arden’s theorem]
Hence, the regular expression is 0*10*.
We can use Thompson's Construction to find out a Finite Automaton from a Regular Expression. We will reduce the regular expression into smallest regular expressions and converting these to NFA and finally to DFA.
Some basic RA expressions are the following −
Case 1 − For a regular expression ‘a’, we can construct the following FA −
Case 2 − For a regular expression ‘ab’, we can construct the following FA −
Case 3 − For a regular expression (a+b), we can construct the following FA −
Case 4 − For a regular expression (a+b)*, we can construct the following FA −
Method
Step 1 Construct an NFA with Null moves from the given regular expression.
Step 2 Remove Null transition from the NFA and convert it into its equivalent DFA.
Problem
Convert the following RA into its equivalent DFA − 1 (0 + 1)* 0
Solution
We will concatenate three expressions "1", "(0 + 1)*" and "0"
Now we will remove the ε transitions. After we remove the ε transitions from the NDFA, we get the following −
It is an NDFA corresponding to the RE − 1 (0 + 1)* 0. If you want to convert it into a DFA, simply apply the method of converting NDFA to DFA discussed in Chapter 1.
Finite Automata with Null Moves (NFA-ε)
A Finite Automaton with null moves (FA-ε) does transit not only after giving input from the alphabet set but also without any input symbol. This transition without input is called a null move.
An NFA-ε is represented formally by a 5-tuple (Q, ∑, δ, q0, F), consisting of
Q − a finite set of states
∑ − a finite set of input symbols
δ − a transition function δ : Q × (∑ ∪ {ε}) → 2Q
q0 − an initial state q0 ∈ Q
F − a set of final state/states of Q (F⊆Q).
The above (FA-ε) accepts a string set − {0, 1, 01}
Removal of Null Moves from Finite Automata
If in an NDFA, there is ϵ-move between vertex X to vertex Y, we can remove it using the following steps −
- Find all the outgoing edges from Y.
- Copy all these edges starting from X without changing the edge labels.
- If X is an initial state, make Y also an initial state.
- If Y is a final state, make X also a final state.
Problem
Convert the following NFA-ε to NFA without Null move.
Solution
Step 1 −
Here the ε transition is between q1 and q2, so let q1 is X and qf is Y.
Here the outgoing edges from qf is to qf for inputs 0 and 1.
Step 2 −
Now we will Copy all these edges from q1 without changing the edges from qf and get the following FA −
Step 3 −
Here q1 is an initial state, so we make qf also an initial state.
So the FA becomes −
Step 4 −
Here qf is a final state, so we make q1 also a final state.
So the FA becomes −
Theorem
Let L be a regular language. Then there exists a constant ‘c’ such that for every string w in L −
|w| ≥ c
We can break w into three strings, w = xyz, such that −
- |y| > 0
- |xy| ≤ c
- For all k ≥ 0, the string xykz is also in L.
Applications of Pumping Lemma
Pumping Lemma is to be applied to show that certain languages are not regular. It should never be used to show a language is regular.
If L is regular, it satisfies Pumping Lemma.
If L does not satisfy Pumping Lemma, it is non-regular.
Method to prove that a language L is not regular
At first, we have to assume that L is regular.
So, the pumping lemma should hold for L.
Use the pumping lemma to obtain a contradiction −
Select w such that |w| ≥ c
Select y such that |y| ≥ 1
Select x such that |xy| ≤ c
Assign the remaining string to z.
Select k such that the resulting string is not in L.
Hence L is not regular.
Problem
Prove that L = {aibi | i ≥ 0} is not regular.
Solution −
At first, we assume that L is regular and n is the number of states.
Let w = anbn. Thus |w| = 2n ≥ n.
By pumping lemma, let w = xyz, where |xy| ≤ n.
Let x = ap, y = aq, and z = arbn, where p + q + r = n, p ≠ 0, q ≠ 0, r ≠ 0. Thus |y| ≠ 0.
Let k = 2. Then xy2z = apa2qarbn.
Number of as = (p + 2q + r) = (p + q + r) + q = n + q
Hence, xy2z = an+q bn. Since q ≠ 0, xy2z is not of the form anbn.
Thus, xy2z is not in L. Hence L is not regular.
If (Q, ∑, δ, q0, F) be a DFA that accepts a language L, then the complement of the DFA can be obtained by swapping its accepting states with its non-accepting states and vice versa.
We will take an example and elaborate this below −
This DFA accepts the language
L = {a, aa, aaa , ............. }
over the alphabet
∑ = {a, b}
So, RE = a+.
Now we will swap its accepting states with its non-accepting states and vice versa and will get the following −
This DFA accepts the language
Ľ = {ε, b, ab ,bb,ba, ............... }
over the alphabet
∑ = {a, b}
Note − If we want to complement an NFA, we have to first convert it to DFA and then have to swap states as in the previous method.
Definition − A context-free grammar (CFG) consisting of a finite set of grammar rules is a quadruple (N, T, P, S) where
N is a set of non-terminal symbols.
T is a set of terminals where N ∩ T = NULL.
P is a set of rules, P: N → (N ∪ T)*, i.e., the left-hand side of the production rule P does have any right context or left context.
S is the start symbol.
Example
- The grammar ({A}, {a, b, c}, P, A), P : A → aA, A → abc.
- The grammar ({S, a, b}, {a, b}, P, S), P: S → aSa, S → bSb, S → ε
- The grammar ({S, F}, {0, 1}, P, S), P: S → 00S | 11F, F → 00F | ε
Generation of Derivation Tree
A derivation tree or parse tree is an ordered rooted tree that graphically represents the semantic information a string derived from a context-free grammar.
Representation Technique
Root vertex − Must be labeled by the start symbol.
Vertex − Labeled by a non-terminal symbol.
Leaves − Labeled by a terminal symbol or ε.
If S → x1x2 …… xn is a production rule in a CFG, then the parse tree / derivation tree will be as follows −
There are two different approaches to draw a derivation tree −
Top-down Approach −
Starts with the starting symbol S
Goes down to tree leaves using productions
Bottom-up Approach −
Starts from tree leaves
Proceeds upward to the root which is the starting symbol S
Derivation or Yield of a Tree
The derivation or the yield of a parse tree is the final string obtained by concatenating the labels of the leaves of the tree from left to right, ignoring the Nulls. However, if all the leaves are Null, derivation is Null.
Example
Let a CFG {N,T,P,S} be
N = {S}, T = {a, b}, Starting symbol = S, P = S → SS | aSb | ε
One derivation from the above CFG is “abaabb”
S → SS → aSbS → abS → abaSb → abaaSbb → abaabb
Sentential Form and Partial Derivation Tree
A partial derivation tree is a sub-tree of a derivation tree/parse tree such that either all of its children are in the sub-tree or none of them are in the sub-tree.
Example
If in any CFG the productions are −
S → AB, A → aaA | ε, B → Bb| ε
the partial derivation tree can be the following −
If a partial derivation tree contains the root S, it is called a sentential form. The above sub-tree is also in sentential form.
Leftmost and Rightmost Derivation of a String
Leftmost derivation − A leftmost derivation is obtained by applying production to the leftmost variable in each step.
Rightmost derivation − A rightmost derivation is obtained by applying production to the rightmost variable in each step.
Example
Let any set of production rules in a CFG be
X → X+X | X*X |X| a
over an alphabet {a}.
The leftmost derivation for the string "a+a*a" may be −
X → X+X → a+X → a + X*X → a+a*X → a+a*a
위 문자열의 단계적 파생은 다음과 같습니다.
위의 문자열에 대한 가장 오른쪽 파생 "a+a*a" 아마도-
X → X * X → X * a → X + X * a → X + a * a → a + a * a
위 문자열의 단계적 파생은 다음과 같습니다.
왼쪽 및 오른쪽 재귀 문법
문맥없는 문법 G, 형태로 제작이있는 경우 X → Xa 어디 X 비 터미널이고 ‘a’ 터미널의 문자열이며, left recursive production. 왼쪽 재귀 생성을 갖는 문법을left recursive grammar.
그리고 문맥없는 문법에서 G, 생산이있는 경우 형태로 X → aX 어디 X 비 터미널이고 ‘a’ 터미널의 문자열이며, right recursive production. 올바른 재귀 생성을 갖는 문법을right recursive grammar.
문맥 자유 문법 G 일부 문자열에 대해 둘 이상의 파생 트리가 있습니다. w ∈ L(G), 그것은 ambiguous grammar. 해당 문법에서 생성 된 일부 문자열에 대해 맨 오른쪽 또는 맨 왼쪽 파생이 여러 개 있습니다.
문제
문법 G와 생산 규칙을 확인하십시오-
X → X + X | X * X | X | ㅏ
모호하거나 아닙니다.
해결책
문자열 "a + a * a"에 대한 파생 트리를 찾아 보겠습니다. 가장 왼쪽에 두 개의 파생물이 있습니다.
Derivation 1− X → X + X → a + X → a + X * X → a + a * X → a + a * a
Parse tree 1 −
Derivation 2− X → X * X → X + X * X → a + X * X → a + a * X → a + a * a
Parse tree 2 −
단일 문자열 "a + a * a"에 대해 두 개의 구문 분석 트리가 있으므로 문법은 G 모호합니다.
문맥없는 언어는 closed 아래-
- Union
- Concatenation
- Kleene Star 운영
노동 조합
L 1 과 L 2를 문맥 자유 언어로 두십시오. 그러면 L 1 ∪ L 2 도 문맥이 없습니다.
예
L 1 = {a n b n , n> 0} 이라고합시다 . 해당 문법 G 1 은 P : S1 → aAb | ab를 갖습니다.
L 2 = {c m d m , m ≥ 0} 이라고합시다 . 해당 문법 G 2 는 P : S2 → cBb | ε
L 1 과 L 2의 결합 , L = L 1 ∪ L 2 = {a n b n } ∪ {c m d m }
해당 문법 G는 추가 생산 S → S1 | S2
연쇄
L 1 및 L 2 가 문맥 자유 언어 인 경우 L 1 L 2 도 문맥 자유입니다.
예
언어 L 1 및 L 2 , L = L 1 L 2 = {a n b n c m d m }
해당 문법 G는 추가 생산 S → S1 S2를 갖습니다.
Kleene Star
L이 문맥 자유 언어이면 L *도 문맥 자유입니다.
예
L = {a n b n , n ≥ 0} 이라고합시다 . 해당 문법 G는 P : S → aAb | ε
Kleene Star L 1 = {a n b n } *
해당 문법 G 1 에는 추가 제작물 S1 → SS 1 | ε
문맥없는 언어는 not closed 아래-
Intersection − L1과 L2가 문맥 자유 언어 인 경우 L1 ∩ L2는 문맥 자유가 아닐 수도 있습니다.
Intersection with Regular Language − L1이 일반 언어이고 L2가 문맥 자유 언어 인 경우 L1 ∩ L2는 문맥 자유 언어입니다.
Complement − L1이 문맥 자유 언어 인 경우 L1 '은 문맥 자유가 아닐 수 있습니다.
CFG에서 문자열 파생에 모든 생산 규칙과 기호가 필요하지 않을 수 있습니다. 게다가, 일부 무효 제작 및 단위 제작이있을 수 있습니다. 이러한 제작물과 상징의 제거를simplification of CFGs. 단순화는 기본적으로 다음 단계로 구성됩니다.
- CFG 감소
- 단위 생산 제거
- Null 프로덕션 제거
CFG 감소
CFG는 두 단계로 감소합니다.
Phase 1 − 동등한 문법의 도출, G’, CFG에서 G, 각 변수는 일부 터미널 문자열을 파생시킵니다.
Derivation Procedure −
1 단계-모든 기호 포함, W1, 일부 터미널을 파생하고 초기화합니다. i=1.
2 단계-모든 기호 포함, Wi+1, 그 파생 Wi.
3 단계-증분 i 2 단계를 반복합니다. Wi+1 = Wi.
4 단계- Wi 그것에.
Phase 2 − 동등한 문법의 도출, G”, CFG에서 G’, 각 기호가 감각적 형태로 나타납니다.
Derivation Procedure −
1 단계-시작 기호 포함 Y1 및 초기화 i = 1.
2 단계-모든 기호 포함, Yi+1, 파생 될 수있는 Yi 적용된 모든 생산 규칙을 포함합니다.
3 단계-증분 i 2 단계를 반복합니다. Yi+1 = Yi.
문제
생산 규칙이있는 문법 G에 해당하는 축약 된 문법 찾기 P : S → AC | B, A → a, C → c | BC, E → aA | 이자형
해결책
Phase 1 −
T = {a, c, e}
W 1 = {A, C, E} 규칙 A → a, C → c 및 E → aA
W 2 = {A, C, E} U {S} 규칙 S → AC
승 3 = {A, C, E, S} U ∅
W 2 = W 3 이므로 G '를 다음과 같이 유도 할 수 있습니다.
G '= {{A, C, E, S}, {a, c, e}, P, {S}}
여기서 P : S → AC, A → a, C → c, E → aA | 이자형
Phase 2 −
Y 1 = {S}
Y 2 = {S, A, C} 규칙 S → AC
Y 3 = {S, A, C, a, c} 규칙 A → a 및 C → c
Y 4 = {S, A, C, a, c}
Y 3 = Y 4 이므로 G”를 다음과 같이 유도 할 수 있습니다.
G”= {{A, C, S}, {a, c}, P, {S}}
여기서 P : S → AC, A → a, C → c
단위 생산 제거
A → B 형식의 모든 생산 규칙 (A, B ∈ 비 터미널이 호출 됨) unit production..
제거 절차-
Step 1 − 제거하려면 A → B, 프로덕션 추가 A → x 문법 규칙에 B → x문법에서 발생합니다. [x ∈ 터미널, x는 Null 일 수 있음]
Step 2 − 삭제 A → B 문법에서.
Step 3 − 모든 단위 생산이 제거 될 때까지 1 단계부터 반복합니다.
Problem
다음에서 단위 생산 제거-
S → XY, X → a, Y → Z | b, Z → M, M → N, N → a
Solution −
문법에는 3 개의 단위 제작이 있습니다.
Y → Z, Z → M 및 M → N
At first, we will remove M → N.
N → a로 M → a를 추가하고 M → N을 제거합니다.
생산 세트는
S → XY, X → a, Y → Z | b, Z → M, M → a, N → a
Now we will remove Z → M.
M → a로 Z → a를 추가하고 Z → M을 제거합니다.
생산 세트는
S → XY, X → a, Y → Z | b, Z → a, M → a, N → a
Now we will remove Y → Z.
Z → a로 Y → a를 추가하고 Y → Z를 제거합니다.
생산 세트는
S → XY, X → a, Y → a | b, Z → a, M → a, N → a
이제 Z, M 및 N에 연결할 수 없으므로 제거 할 수 있습니다.
최종 CFG는 단위 생산이 필요 없습니다.
S → XY, X → a, Y → a | 비
Null 프로덕션 제거
CFG에서 비 터미널 기호 ‘A’ 프로덕션이있는 경우 nullable 변수입니다. A → ε 또는 다음에서 시작하는 파생이 있습니다. A 그리고 마지막으로
ε : A → .......… → ε
제거 절차
Step 1 − ε을 도출하는 nullable 비 말단 변수를 찾습니다.
Step 2 − 각 제작 A → a, 모든 제작물 구성 A → x 어디 x 에서 얻은 ‘a’ 1 단계에서 하나 또는 여러 개의 비 터미널을 제거하여
Step 3 − 원본 제작물을 2 단계의 결과와 결합하고 제거 ε - productions.
Problem
다음에서 null 생산을 제거하십시오-
S → ASA | aB | b, A → B, B → b | ∈
Solution −
두 개의 nullable 변수가 있습니다- A 과 B
At first, we will remove B → ε.
제거 후 B → ε, 생산 세트는-
S → ASA | aB | b | a, A ε B | b | 엡실론, B → b
Now we will remove A → ε.
제거 후 A → ε, 생산 세트는-
S → ASA | aB | b | a | SA | 그대로 | S, A → B | b, B → b
이것은 null 전환이없는 최종 프로덕션 세트입니다.
CFG는 프로덕션이 다음 형식 인 경우 Chomsky Normal 형식입니다.
- A → a
- A → BC
- S → ε
여기서 A, B 및 C는 비 터미널이고 a 터미널입니다.
촘스키 정규 형식으로 변환하는 알고리즘 −
Step 1 − 시작 기호 S 오른쪽에 발생하면 새 시작 기호를 만듭니다. S’ 그리고 새로운 생산 S’→ S.
Step 2− Null 프로덕션을 제거합니다. (앞에서 설명한 Null 프로덕션 제거 알고리즘 사용)
Step 3− 단위 생산을 제거합니다. (앞에서 설명한 단위 생산 제거 알고리즘 사용)
Step 4 − 각 생산물 교체 A → B1…Bn 어디 n > 2 와 A → B1C 어디 C → B2 …Bn. 오른쪽에 두 개 이상의 기호가있는 모든 프로덕션에 대해이 단계를 반복합니다.
Step 5 − 제작물의 오른쪽이 다음과 같은 형태 인 경우 A → aB a는 터미널이고 A, B 터미널이 아닌 경우 프로덕션이 A → XB 과 X → a. 양식에있는 모든 프로덕션에 대해이 단계를 반복하십시오.A → aB.
문제
다음 CFG를 CNF로 변환
S → ASA | aB, A → B | S, B → b | ε
해결책
(1) 이후 S RHS에 표시되면 새 상태를 추가합니다. S0 과 S0→S 생산 세트에 추가되고-
S 0 → S, S → ASA | aB, A → B | S, B → b | ∈
(2) 이제 우리는 null 생산을 제거 할 것입니다.
B → ∈ 및 A → ∈
B → ε을 제거한 후 생산 세트는-
S 0 → S, S → ASA | aB | a, A → B | S | ∈, B → b
A → ∈를 제거한 후 생산 세트는-
S 0 → S, S → ASA | aB | a | 그대로 | SA | S, A → B | S, B → b
(3) 이제 단위 생산을 제거합니다.
S → S를 제거한 후 생산 세트는-
S 0 → S, S → ASA | aB | a | 그대로 | SA, A → B | S, B → b
S 0 → S를 제거한 후 생산 세트는-
S 0 → ASA | aB | a | 그대로 | SA, S → ASA | aB | a | 그대로 | SA
A → B | S, B → b
A → B를 제거한 후 생산 세트는-
S 0 → ASA | aB | a | 그대로 | SA, S → ASA | aB | a | 그대로 | SA
A → S | 비
B → b
A → S를 제거한 후 생산 세트는-
S 0 → ASA | aB | a | 그대로 | SA, S → ASA | aB | a | 그대로 | SA
A → b | ASA | aB | a | 그대로 | SA, B → b
(4) 이제 RHS에서 두 개 이상의 변수를 찾을 수 있습니다.
여기서 S 0 → ASA, S → ASA, A → ASA는 RHS에서 두 개의 비 터미널을 위반합니다.
따라서 4 단계와 5 단계를 적용하여 CNF에있는 다음 최종 프로덕션 세트를 얻습니다.
S 0 → AX | aB | a | 그대로 | SA
S → AX | aB | a | 그대로 | SA
A → b | AX | aB | a | 그대로 | SA
B → b
X → SA
(5)프로덕션을 바꿔야합니다 S 0 → aB, S → aB, A → aB
그리고 최종 생산 세트는-
S 0 → AX | YB | a | 그대로 | SA
S → AX | YB | a | 그대로 | SA
A → b A → b | AX | YB | a | 그대로 | SA
B → b
X → SA
Y → a
CFG는 프로덕션이 다음과 같은 형태 인 경우 Greibach Normal Form에 있습니다.
A → b
A → bD 1 … D n
S → ε
여기서 A, D 1 , ...., D n 은 비 터미널이고 b는 터미널입니다.
CFG를 Greibach 정규 형식으로 변환하는 알고리즘
Step 1 − 시작 기호 S 오른쪽에 발생하면 새 시작 기호를 만듭니다. S’ 그리고 새로운 생산 S’ → S.
Step 2− Null 프로덕션을 제거합니다. (앞에서 설명한 Null 프로덕션 제거 알고리즘 사용)
Step 3− 단위 생산을 제거합니다. (앞에서 설명한 단위 생산 제거 알고리즘 사용)
Step 4 − 모든 직접 및 간접 왼쪽 재귀를 제거합니다.
Step 5 − 적절한 형태의 GNF로 변환하기 위해 생산물을 적절하게 대체하십시오.
문제
다음 CFG를 CNF로 변환
S → XY | Xn | 피
X → mX | 미디엄
Y → Xn | 영형
해결책
여기, S프로덕션의 오른쪽에 표시되지 않으며 프로덕션 규칙 세트에 단위 또는 널 프로덕션이 없습니다. 따라서 1 단계에서 3 단계로 건너 뛸 수 있습니다.
Step 4
이제 교체 후
X in S → XY | Xo | 피
와
mX | 미디엄
우리는 얻는다
S → mXY | mY | mXo | mo | 피.
그리고 교체 후
X in Y → X n | 영형
오른쪽으로
X → mX | 미디엄
우리는 얻는다
Y → mXn | 백만 | 영형.
두 개의 새로운 프로덕션 O → o 및 P → p가 프로덕션 세트에 추가되고 다음과 같이 최종 GNF에 도달했습니다.
S → mXY | mY | mXC | mC | 피
X → mX | 미디엄
Y → mXD | mD | 영형
O → o
피 → 피
정리
만약 L 문맥이없는 언어이고 펌핑 길이가 있습니다. p 모든 문자열 w ∈ L 길이 ≥ p 다음과 같이 쓸 수 있습니다. w = uvxyz, 어디 vy ≠ ε, |vxy| ≤ p, 그리고 모두 i ≥ 0, uvixyiz ∈ L.
펌핑 기본형의 응용
펌핑 기본형은 문법에 문맥이 없는지 여부를 확인하는 데 사용됩니다. 예를 들어 확인 방법을 보여 드리겠습니다.
문제
언어 여부 확인 L = {xnynzn | n ≥ 1} 문맥이 없는지 여부.
해결책
허락하다 L컨텍스트가 없습니다. 그때,L 펌핑 기본형을 충족해야합니다.
먼저 번호를 선택하세요 n펌핑 기본형의. 그런 다음 z를 0 n 1 n 2 n 로 취 합니다.
단절 z 으로 uvwxy, 어디
|vwx| ≤ n and vx ≠ ε.
그 후 vwx마지막 0과 처음 2가 적어도 (n + 1) 위치 떨어져 있기 때문에 0과 2를 모두 포함 할 수 없습니다. 두 가지 경우가 있습니다-
Case 1 − vwx2가 없습니다. 그때vx0과 1 만 있습니다. 그때uwy, 있어야합니다. L, has n 2 초, 이하 n 0 또는 1.
Case 2 − vwx 0이 없습니다.
여기서 모순이 발생합니다.
그 후, L 문맥이없는 언어가 아닙니다.
PDA의 기본 구조
푸시 다운 자동화는 일반적인 문법을 위해 DFA를 설계하는 것과 유사한 방식으로 문맥없는 문법을 구현하는 방법입니다. DFA는 한정된 양의 정보를 기억할 수 있지만 PDA는 무한한 양의 정보를 기억할 수 있습니다.
기본적으로 푸시 다운 오토 마톤은-
"Finite state machine" + "a stack"
푸시 다운 오토 마톤에는 세 가지 구성 요소가 있습니다.
- 입력 테이프,
- 제어 장치 및
- 무한한 크기의 스택.
스택 헤드는 스택의 맨 위 기호를 스캔합니다.
스택은 두 가지 작업을 수행합니다.
Push − 새 기호가 상단에 추가됩니다.
Pop − 상단 기호를 읽고 제거합니다.
PDA는 입력 기호를 읽을 수도 있고 읽지 않을 수도 있지만 모든 전환에서 스택의 맨 위를 읽어야합니다.
PDA는 공식적으로 7- 튜플 (Q, ∑, S, δ, q 0 , I, F) 로 설명 할 수 있습니다.
Q 유한 한 수의 상태
∑ 입력 알파벳입니다
S 스택 기호
δ 전환 함수 : Q × (∑ ∪ {ε}) × S × Q × S *
q0초기 상태 (q 0 ∈ Q)
I 초기 스택 상단 기호 (I ∈ S)
F 수용 상태 집합 (F ∈ Q)
다음 다이어그램은 상태 q 1 에서 상태 q 2 로의 PDA 전환을 보여줍니다. a, b → c −
이것은 상태 q1, 입력 문자열을 만나면 ‘a’ 스택의 상단 기호는 ‘b’, 우리는 팝 ‘b’, 푸시 ‘c’ 스택 상단에 상태로 이동 q2.
PDA 관련 용어
즉각적인 설명
PDA의 순간 설명 (ID)은 삼중 항 (q, w, s)으로 표시됩니다.
q 상태입니다
w 소비되지 않은 입력
s 스택 내용입니다.
개찰구 표기법
"turnstile"표기법은 PDA의 하나 또는 여러 이동을 나타내는 ID 쌍을 연결하는 데 사용됩니다. 전환 과정은 개찰구 기호 "⊢"로 표시됩니다.
PDA (Q, ∑, S, δ, q 0 , I, F)를 고려하십시오. 천이는 다음 개찰구 표기법으로 수학적으로 표현할 수 있습니다.
(p, aw, Tβ) ⊢ (q, w, αb)
이것은 상태에서 전환하는 동안 p 상태로 q, 입력 기호 ‘a’ 소비되고 스택의 맨 위 ‘T’ 새 문자열로 대체됩니다. ‘α’.
Note − PDA를 0 개 이상 이동하려면 기호 (⊢ *)를 사용해야합니다.
PDA 수락 가능성을 정의하는 방법에는 두 가지가 있습니다.
최종 상태 수용 가능성
최종 상태 허용 가능성에서 PDA는 전체 문자열을 읽은 후 PDA가 최종 상태에있을 때 문자열을 허용합니다. 시작 상태에서 스택 값을 사용하여 최종 상태로 끝나는 움직임을 만들 수 있습니다. 스택 값은 최종 상태에 도달하는 한 관련이 없습니다.
PDA (Q, ∑, S, δ, q 0 , I, F)의 경우 최종 상태 집합 F에서 허용되는 언어는 다음과 같습니다.
L (PDA) = {w | (q 0 , w, I) ⊢ * (q, ε, x), q ∈ F}
모든 입력 스택 문자열 x.
빈 스택 수용 가능성
여기서 PDA는 전체 문자열을 읽은 후 PDA가 스택을 비 웠을 때 문자열을받습니다.
PDA (Q, ∑, S, δ, q 0 , I, F)의 경우 빈 스택에서 허용되는 언어는 다음과 같습니다.
L (PDA) = {w | (q 0 , w, I) ⊢ * (q, ε, ε), q ∈ Q}
예
수락하는 PDA 구성 L = {0n 1n | n ≥ 0}
해결책
이 언어는 L = {ε, 01, 0011, 000111, .............................}을 허용합니다.
여기이 예에서 ‘a’ 과 ‘b’ 동일해야합니다.
처음에는 특별한 기호를 넣었습니다. ‘$’ 빈 스택에.
그런 다음 상태 q2, 입력 0이 발생하고 top이 Null이면 0을 스택에 넣습니다. 반복 될 수 있습니다. 입력 1을 만나고 top이 0이면이 0을 팝합니다.
그런 다음 상태 q3, 입력 1을 만나고 top이 0이면이 0을 팝합니다. 이것은 반복 될 수도 있습니다. 입력 1이 발생하고 상단이 0이면 상단 요소를 팝합니다.
스택 맨 위에서 특수 기호 '$'가 발견되면 튀어 나와 마침내 수락 상태 q 4로 이동 합니다.
예
L = {ww R | w = (a + b) *}
Solution
처음에는 특수 기호 '$'를 빈 스택에 넣었습니다. 상태q2, w읽고 있습니다. 상태q3, 각 0 또는 1은 입력과 일치 할 때 팝됩니다. 다른 입력이 주어지면 PDA는 데드 상태가됩니다. 특수 기호 '$'에 도달하면 수락 상태로 이동합니다.q4.
문법이라면 G 문맥 자유롭고, 문맥 자유 문법에 의해 생성 된 언어를 받아들이는 동등한 비 결정적 PDA를 구축 할 수 있습니다. G. 문법을위한 파서를 만들 수 있습니다.G.
또한 P 푸시 다운 자동자이며, 동등한 문맥 자유 문법 G는 다음 위치에서 구성 될 수 있습니다.
L(G) = L(P)
다음 두 주제에서는 PDA에서 CFG로 또는 그 반대로 변환하는 방법에 대해 설명합니다.
주어진 CFG에 해당하는 PDA를 찾는 알고리즘
Input − CFG, G = (V, T, P, S)
Output− 동등한 PDA, P = (Q, ∑, S, δ, q 0 , I, F)
Step 1 − CFG의 생산물을 GNF로 변환합니다.
Step 2 − PDA에는 {q} 상태가 하나만 있습니다.
Step 3 − CFG의 시작 기호는 PDA에서 시작 기호가됩니다.
Step 4 − CFG의 모든 비 터미널은 PDA의 스택 심볼이되고 CFG의 모든 터미널은 PDA의 입력 심볼이됩니다.
Step 5 − 형태의 각 생산에 대해 A → aX a는 터미널이고 A, X 터미널과 비 터미널의 조합입니다. δ (q, a, A).
문제
다음 CFG에서 PDA를 구성합니다.
G = ({S, X}, {a, b}, P, S)
제작이 어디에-
S → XS | ε , A → aXb | Ab | ab
해결책
동등한 PDA를 보자,
P = ({q}, {a, b}, {a, b, X, S}, δ, q, S)
여기서 δ −
δ (q, ε, S) = {(q, XS), (q, ε)}
δ (q, ε, X) = {(q, aXb), (q, Xb), (q, ab)}
δ (q, a, a) = {(q, ε)}
δ (q, 1, 1) = {(q, ε)}
주어진 PDA에 해당하는 CFG를 찾는 알고리즘
Input − CFG, G = (V, T, P, S)
Output− 동등한 PDA, P = (Q, ∑, S, δ, q 0 , I, F) 문법 G의 비 말단이 {X wx | w, x ∈ Q}이고 시작 상태는 A q0, F 입니다.
Step 1− 모든 w, x, y, z ∈ Q, m ∈ S 및 a, b ∈ ∑, δ (w, a, ε)에 (y, m)이 포함되고 (z, b, m)에 (x, ε), 문법 G에 생산 규칙 X wx → a X yz b를 추가합니다 .
Step 2− 모든 w, x, y, z ∈ Q에 대해 문법 G에서 생산 규칙 X wx → X wy X yx 를 추가합니다 .
Step 3− w ∈ Q의 경우 문법 G에 생산 규칙 X ww → ε을 추가합니다 .
구문 분석은 문법의 생산 규칙을 사용하여 문자열을 파생하는 데 사용됩니다. 문자열의 허용 여부를 확인하는 데 사용됩니다. 컴파일러는 문자열의 구문이 올바른지 여부를 확인하는 데 사용됩니다. 파서는 입력을 받아 파스 트리를 만듭니다.
파서는 두 가지 유형이 될 수 있습니다.
Top-Down Parser − 하향식 구문 분석은 시작 기호가있는 맨 위에서 시작하여 구문 분석 트리를 사용하여 문자열을 파생합니다.
Bottom-Up Parser − 상향식 구문 분석은 문자열이있는 맨 아래부터 시작하여 구문 분석 트리를 사용하여 시작 기호에 도달합니다.
하향식 파서 설계
하향식 구문 분석의 경우 PDA에는 다음 네 가지 유형의 전환이 있습니다.
스택 맨 위에있는 프로덕션의 왼쪽에있는 비 터미널을 팝하고 오른쪽 스트링을 누릅니다.
스택의 맨 위 기호가 읽고있는 입력 기호와 일치하면 팝하십시오.
시작 기호 'S'를 스택에 밀어 넣습니다.
입력 문자열을 완전히 읽고 스택이 비어 있으면 최종 상태 'F'로 이동합니다.
예
다음 생산 규칙을 사용하여 문법 G에 대한 "x + y * z"표현식에 대한 하향식 파서를 설계합니다.
P : S → S + X | X, X → X * Y | Y, Y → (S) | 신분증
Solution
PDA가 (Q, ∑, S, δ, q 0 , I, F)이면 하향식 파싱은 다음과 같습니다.
(x + y * z, I) ⊢ (x + y * z, SI) ⊢ (x + y * z, S + XI) ⊢ (x + y * z, X + XI)
⊢ (x + y * z, Y + XI) ⊢ (x + y * z, x + XI) ⊢ (+ y * z, + XI) ⊢ (y * z, XI)
⊢ (y * z, X * YI) ⊢ (y * z, y * YI) ⊢ (* z, * YI) ⊢ (z, YI) ⊢ (z, zI) ⊢ (ε, I)
상향식 파서 설계
상향식 구문 분석의 경우 PDA에는 다음과 같은 네 가지 유형의 전환이 있습니다.
현재 입력 기호를 스택에 넣습니다.
스택 맨 위에있는 프로덕션의 오른쪽을 왼쪽으로 바꿉니다.
스택 요소의 맨 위가 현재 입력 기호와 일치하면 팝하십시오.
입력 문자열이 완전히 읽혀지고 시작 기호 'S'가 스택에 남아있는 경우에만이를 팝하고 최종 상태 'F'로 이동합니다.
예
다음 생산 규칙을 사용하여 문법 G에 대한 "x + y * z"표현식에 대한 하향식 파서를 설계합니다.
P : S → S + X | X, X → X * Y | Y, Y → (S) | 신분증
Solution
PDA가 (Q, ∑, S, δ, q 0 , I, F)이면 상향식 파싱은 다음과 같습니다.
(x + y * z, I) ⊢ (+ y * z, xI) ⊢ (+ y * z, YI) ⊢ (+ y * z, XI) ⊢ (+ y * z, SI)
⊢ (y * z, + SI) ⊢ (* z, y + SI) ⊢ (* z, Y + SI) ⊢ (* z, X + SI) ⊢ (z, * X + SI)
⊢ (ε, z * X + SI) ⊢ (ε, Y * X + SI) ⊢ (ε, X + SI) ⊢ (ε, SI)
Turing Machine은 유형 0 문법에 의해 생성 된 언어 (재귀 적으로 열거 가능한 집합)를 받아들이는 장치입니다. Alan Turing이 1936 년에 발명했습니다.
정의
Turing Machine (TM)은 입력이 제공되는 셀로 분할 된 무한 길이 테이프로 구성된 수학적 모델입니다. 입력 테이프를 읽는 헤드로 구성됩니다. 상태 레지스터는 튜링 머신의 상태를 저장합니다. 입력 기호를 읽은 후 다른 기호로 대체되고 내부 상태가 변경되며 한 셀에서 오른쪽 또는 왼쪽으로 이동합니다. TM이 최종 상태에 도달하면 입력 문자열이 승인되고 그렇지 않으면 거부됩니다.
TM은 공식적으로 7- 튜플 (Q, X, ∑, δ, q 0 , B, F)로 설명 할 수 있습니다.
Q 유한 한 상태 집합입니다.
X 테이프 알파벳입니다
∑ 입력 알파벳입니다.
δ전환 함수입니다. δ : Q × X → Q × X × {Left_shift, Right_shift}.
q0 초기 상태입니다.
B 빈 기호입니다.
F 최종 상태의 집합입니다.
이전 오토 마톤과의 비교
다음 표는 튜링 기계가 유한 오토 마톤 및 푸시 다운 오토 마톤과 어떻게 다른지 비교 한 것입니다.
기계 | 스택 데이터 구조 | 결정 론적? |
---|---|---|
유한 오토 마톤 | NA | 예 |
푸시 다운 오토 마톤 | 후입 선출 (LIFO) | 아니 |
튜링 머신 | 무한 테이프 | 예 |
튜링 머신의 예
튜링 머신 M = (Q, X, ∑, δ, q 0 , B, F)
- Q = {q 0 , q 1 , q 2 , q f }
- X = {a, b}
- ∑ = {1}
- q 0 = {q 0 }
- B = 공백 기호
- F = {q f }
δ는 −
테이프 알파벳 기호 | 현재 상태 'q 0 ' | 현재 상태 'q 1 ' | 현재 상태 'q 2 ' |
---|---|---|---|
ㅏ | 1Rq 1 | 1Lq 0 | 1Lq f |
비 | 1Lq 2 | 1Rq 1 | 1Rq f |
여기서 1Rq 1 전이 는 쓰기 기호가 1이고 테이프가 오른쪽으로 이동하며 다음 상태가 q 1 임을 의미합니다 . 마찬가지로 전환 1Lq 2 는 쓰기 기호가 1이고 테이프가 왼쪽으로 이동하며 다음 상태가 q 2 임을 의미합니다 .
튜링 머신의 시간 및 공간 복잡성
Turing 기계의 경우 시간 복잡도는 기계가 일부 입력 기호에 대해 초기화 될 때 테이프가 이동하는 횟수의 척도를 나타내며 공간 복잡도는 기록 된 테이프의 셀 수입니다.
모든 합리적인 기능의 시간 복잡성-
T(n) = O(n log n)
TM의 공간 복잡성-
S(n) = O(n)
TM은 입력 문자열 w에 대해 최종 상태가되면 언어를 허용합니다. 언어는 Turing 머신에서 허용되는 경우 재귀 적으로 열거 할 수 있습니다 (Type-0 문법에 의해 생성됨).
TM은 언어를 수락하면 언어를 결정하고 해당 언어가 아닌 입력에 대해 거부 상태가됩니다. 튜링 머신에 의해 결정되는 언어는 재귀 적입니다.
TM이 멈추지 않는 경우가있을 수 있습니다. 그러한 TM은 언어를 받아들이지 만 결정하지는 않습니다.
튜링 머신 설계
튜링 머신 설계의 기본 지침은 몇 가지 예를 통해 아래에 설명되어 있습니다.
예 1
홀수의 α로 구성된 모든 문자열을 인식하도록 TM을 설계합니다.
Solution
튜링 머신 M 다음과 같은 이동으로 건설 할 수 있습니다.
허락하다 q1 초기 상태입니다.
만약 M 에 q1; α를 스캔하면 상태로 들어갑니다.q2 그리고 쓴다 B (공백).
만약 M 에 q2; α를 스캔하면 상태로 들어갑니다.q1 그리고 쓴다 B (공백).
위의 움직임에서 우리는 M 주에 들어가다 q1 짝수 개의 α를 스캔하여 상태가되면 q2홀수의 α를 스캔하는 경우. 그 후q2 유일한 수용 상태입니다.
그 후,
M = {{q 1 , q 2 }, {1}, {1, B}, δ, q 1 , B, {q 2 }}
여기서 δ는 −
테이프 알파벳 기호 | 현재 상태 'q 1 ' | 현재 상태 'q 2 ' |
---|---|---|
α | BRq 2 | BRq 1 |
예 2
이진수를 나타내는 문자열을 읽고 문자열의 모든 선행 0을 지우는 Turing Machine을 설계합니다. 그러나 문자열이 0으로 만 구성된 경우 하나의 0을 유지합니다.
Solution
입력 문자열이 문자열의 각 끝에있는 공백 기호 B로 종료된다고 가정합니다.
튜링 머신, M, 다음 이동에 의해 건설 될 수 있습니다-
허락하다 q0 초기 상태입니다.
만약 M 에 q0, 0을 읽으면 오른쪽으로 이동하여 상태로 들어갑니다. q1 0을 지 웁니다. 1을 읽으면 상태가됩니다. q2 오른쪽으로 이동합니다.
만약 M 에 q1, 0을 읽을 때 오른쪽으로 이동하고 0을 지 웁니다. 즉, 0을 B로 대체합니다. 맨 왼쪽 1에 도달하면q2오른쪽으로 이동합니다. B에 도달하면 즉, 문자열이 0으로 만 구성되면 왼쪽으로 이동하여 상태로 들어갑니다.q3.
만약 M 에 q2, 0 또는 1을 읽으면 오른쪽으로 이동합니다. B에 도달하면 왼쪽으로 이동하여 상태로 들어갑니다.q4. 이것은 문자열이 0과 1로만 구성되어 있는지 확인합니다.
만약 M 에 q3, B를 0으로 대체하고 왼쪽으로 이동하여 최종 상태에 도달합니다. qf.
만약 M 에 q4, 0 또는 1을 읽으면 왼쪽으로 이동합니다. 문자열의 시작 부분에 도달하면 즉, B를 읽을 때 최종 상태에 도달합니다.qf.
그 후,
M = {{q 0 , q 1 , q 2 , q 3 , q 4 , q f }, {0,1, B}, {1, B}, δ, q 0 , B, {q f }}
여기서 δ는 −
테이프 알파벳 기호 | 현재 상태 'q 0 ' | 현재 상태 'q 1 ' | 현재 상태 'q 2 ' | 현재 상태 'q 3 ' | Present State ‘q4’ |
---|---|---|---|---|---|
0 | BRq1 | BRq1 | ORq2 | - | OLq4 |
1 | 1Rq2 | 1Rq2 | 1Rq2 | - | 1Lq4 |
B | BRq1 | BLq3 | BLq4 | OLqf | BRqf |
Multi-tape Turing Machines have multiple tapes where each tape is accessed with a separate head. Each head can move independently of the other heads. Initially the input is on tape 1 and others are blank. At first, the first tape is occupied by the input and the other tapes are kept blank. Next, the machine reads consecutive symbols under its heads and the TM prints a symbol on each tape and moves its heads.
A Multi-tape Turing machine can be formally described as a 6-tuple (Q, X, B, δ, q0, F) where −
Q is a finite set of states
X is the tape alphabet
B is the blank symbol
δ is a relation on states and symbols where
δ: Q × Xk → Q × (X × {Left_shift, Right_shift, No_shift })k
where there is k number of tapes
q0 is the initial state
F is the set of final states
Note − Every Multi-tape Turing machine has an equivalent single-tape Turing machine.
Multi-track Turing machines, a specific type of Multi-tape Turing machine, contain multiple tracks but just one tape head reads and writes on all tracks. Here, a single tape head reads n symbols from n tracks at one step. It accepts recursively enumerable languages like a normal single-track single-tape Turing Machine accepts.
A Multi-track Turing machine can be formally described as a 6-tuple (Q, X, ∑, δ, q0, F) where −
Q is a finite set of states
X is the tape alphabet
∑ is the input alphabet
δ is a relation on states and symbols where
δ(Qi, [a1, a2, a3,....]) = (Qj, [b1, b2, b3,....], Left_shift or Right_shift)
q0 is the initial state
F is the set of final states
Note − For every single-track Turing Machine S, there is an equivalent multi-track Turing Machine M such that L(S) = L(M).
In a Non-Deterministic Turing Machine, for every state and symbol, there are a group of actions the TM can have. So, here the transitions are not deterministic. The computation of a non-deterministic Turing Machine is a tree of configurations that can be reached from the start configuration.
An input is accepted if there is at least one node of the tree which is an accept configuration, otherwise it is not accepted. If all branches of the computational tree halt on all inputs, the non-deterministic Turing Machine is called a Decider and if for some input, all branches are rejected, the input is also rejected.
A non-deterministic Turing machine can be formally defined as a 6-tuple (Q, X, ∑, δ, q0, B, F) where −
Q is a finite set of states
X is the tape alphabet
∑ is the input alphabet
δ is a transition function;
δ : Q × X → P(Q × X × {Left_shift, Right_shift}).
q0 is the initial state
B is the blank symbol
F is the set of final states
A Turing Machine with a semi-infinite tape has a left end but no right end. The left end is limited with an end marker.
It is a two-track tape −
Upper track − It represents the cells to the right of the initial head position.
Lower track − It represents the cells to the left of the initial head position in reverse order.
The infinite length input string is initially written on the tape in contiguous tape cells.
The machine starts from the initial state q0 and the head scans from the left end marker ‘End’. In each step, it reads the symbol on the tape under its head. It writes a new symbol on that tape cell and then it moves the head either into left or right one tape cell. A transition function determines the actions to be taken.
It has two special states called accept state and reject state. If at any point of time it enters into the accepted state, the input is accepted and if it enters into the reject state, the input is rejected by the TM. In some cases, it continues to run infinitely without being accepted or rejected for some certain input symbols.
Note − Turing machines with semi-infinite tape are equivalent to standard Turing machines.
A linear bounded automaton is a multi-track non-deterministic Turing machine with a tape of some bounded finite length.
Length = function (Length of the initial input string, constant c)
Here,
Memory information ≤ c × Input information
The computation is restricted to the constant bounded area. The input alphabet contains two special symbols which serve as left end markers and right end markers which mean the transitions neither move to the left of the left end marker nor to the right of the right end marker of the tape.
A linear bounded automaton can be defined as an 8-tuple (Q, X, ∑, q0, ML, MR, δ, F) where −
Q is a finite set of states
X is the tape alphabet
∑ is the input alphabet
q0 is the initial state
ML is the left end marker
MR is the right end marker where MR ≠ ML
δ is a transition function which maps each pair (state, tape symbol) to (state, tape symbol, Constant ‘c’) where c can be 0 or +1 or -1
F is the set of final states
A deterministic linear bounded automaton is always context-sensitive and the linear bounded automaton with empty language is undecidable..
A language is called Decidable or Recursive if there is a Turing machine which accepts and halts on every input string w. Every decidable language is Turing-Acceptable.
A decision problem P is decidable if the language L of all yes instances to P is decidable.
For a decidable language, for each input string, the TM halts either at the accept or the reject state as depicted in the following diagram −
Example 1
Find out whether the following problem is decidable or not −
Is a number ‘m’ prime?
Solution
Prime numbers = {2, 3, 5, 7, 11, 13, …………..}
Divide the number ‘m’ by all the numbers between ‘2’ and ‘√m’ starting from ‘2’.
If any of these numbers produce a remainder zero, then it goes to the “Rejected state”, otherwise it goes to the “Accepted state”. So, here the answer could be made by ‘Yes’ or ‘No’.
Hence, it is a decidable problem.
Example 2
Given a regular language L and string w, how can we check if w ∈ L?
Solution
Take the DFA that accepts L and check if w is accepted
Some more decidable problems are −
- Does DFA accept the empty language?
- Is L1 ∩ L2 = ∅ for regular sets?
Note −
If a language L is decidable, then its complement L' is also decidable
If a language is decidable, then there is an enumerator for it.
For an undecidable language, there is no Turing Machine which accepts the language and makes a decision for every input string w (TM can make decision for some input string though). A decision problem P is called “undecidable” if the language L of all yes instances to P is not decidable. Undecidable languages are not recursive languages, but sometimes, they may be recursively enumerable languages.
Example
- The halting problem of Turing machine
- The mortality problem
- The mortal matrix problem
- The Post correspondence problem, etc.
Input − A Turing machine and an input string w.
Problem − Does the Turing machine finish computing of the string w in a finite number of steps? The answer must be either yes or no.
Proof − At first, we will assume that such a Turing machine exists to solve this problem and then we will show it is contradicting itself. We will call this Turing machine as a Halting machine that produces a ‘yes’ or ‘no’ in a finite amount of time. If the halting machine finishes in a finite amount of time, the output comes as ‘yes’, otherwise as ‘no’. The following is the block diagram of a Halting machine −
Now we will design an inverted halting machine (HM)’ as −
If H returns YES, then loop forever.
If H returns NO, then halt.
The following is the block diagram of an ‘Inverted halting machine’ −
Further, a machine (HM)2 which input itself is constructed as follows −
- If (HM)2 halts on input, loop forever.
- Else, halt.
Here, we have got a contradiction. Hence, the halting problem is undecidable.
Rice theorem states that any non-trivial semantic property of a language which is recognized by a Turing machine is undecidable. A property, P, is the language of all Turing machines that satisfy that property.
Formal Definition
If P is a non-trivial property, and the language holding the property, Lp , is recognized by Turing machine M, then Lp = {<M> | L(M) ∈ P} is undecidable.
Description and Properties
Property of languages, P, is simply a set of languages. If any language belongs to P (L ∈ P), it is said that L satisfies the property P.
A property is called to be trivial if either it is not satisfied by any recursively enumerable languages, or if it is satisfied by all recursively enumerable languages.
A non-trivial property is satisfied by some recursively enumerable languages and are not satisfied by others. Formally speaking, in a non-trivial property, where L ∈ P, both the following properties hold:
Property 1 − There exists Turing Machines, M1 and M2 that recognize the same language, i.e. either ( <M1>, <M2> ∈ L ) or ( <M1>,<M2> ∉ L )
Property 2 − There exists Turing Machines M1 and M2, where M1 recognizes the language while M2 does not, i.e. <M1> ∈ L and <M2> ∉ L
Proof
Suppose, a property P is non-trivial and φ ∈ P.
Since, P is non-trivial, at least one language satisfies P, i.e., L(M0) ∈ P , ∋ Turing Machine M0.
Let, w be an input in a particular instant and N is a Turing Machine which follows −
On input x
- Run M on w
- If M does not accept (or doesn't halt), then do not accept x (or do not halt)
- If M accepts w then run M0 on x. If M0 accepts x, then accept x.
A function that maps an instance ATM = {<M,w>| M accepts input w} to a N such that
- If M accepts w and N accepts the same language as M0, Then L(M) = L(M0) ∈ p
- If M does not accept w and N accepts φ, Then L(N) = φ ∉ p
Since ATM is undecidable and it can be reduced to Lp, Lp is also undecidable.
The Post Correspondence Problem (PCP), introduced by Emil Post in 1946, is an undecidable decision problem. The PCP problem over an alphabet ∑ is stated as follows −
Given the following two lists, M and N of non-empty strings over ∑ −
M = (x1, x2, x3,………, xn)
N = (y1, y2, y3,………, yn)
We can say that there is a Post Correspondence Solution, if for some i1,i2,………… ik, where 1 ≤ ij ≤ n, the condition xi1 …….xik = yi1 …….yik satisfies.
Example 1
Find whether the lists
M = (abb, aa, aaa) and N = (bba, aaa, aa)
have a Post Correspondence Solution?
Solution
x1 | x2 | x3 | |
---|---|---|---|
M | Abb | aa | aaa |
N | Bba | aaa | aa |
Here,
x2x1x3 = ‘aaabbaaa’
and y2y1y3 = ‘aaabbaaa’
We can see that
x2x1x3 = y2y1y3
Hence, the solution is i = 2, j = 1, and k = 3.
Example 2
Find whether the lists M = (ab, bab, bbaaa) and N = (a, ba, bab) have a Post Correspondence Solution?
Solution
x1 | x2 | x3 | |
---|---|---|---|
M | ab | bab | bbaaa |
N | a | ba | bab |
In this case, there is no solution because −
| x2x1x3 | ≠ | y2y1y3 | (Lengths are not same)
Hence, it can be said that this Post Correspondence Problem is undecidable.