Desain Kompiler - Pemulihan Kesalahan
Pengurai harus dapat mendeteksi dan melaporkan kesalahan apa pun dalam program. Diharapkan bahwa ketika terjadi kesalahan, pengurai harus dapat menanganinya dan melanjutkan penguraian masukan lainnya. Sebagian besar dari parser diharapkan untuk memeriksa kesalahan, tetapi kesalahan dapat ditemukan pada berbagai tahap proses kompilasi. Suatu program mungkin memiliki jenis kesalahan berikut pada berbagai tahap:
Lexical : nama beberapa pengenal tidak diketik dengan benar
Syntactical : titik koma hilang atau tanda kurung tidak seimbang
Semantical : penugasan nilai yang tidak kompatibel
Logical : kode tidak dapat dijangkau, loop tak terbatas
Ada empat strategi pemulihan kesalahan umum yang dapat diterapkan di parser untuk menangani kesalahan dalam kode.
Mode panik
Saat parser menemukan kesalahan di mana pun dalam pernyataan, ia mengabaikan pernyataan lainnya dengan tidak memproses masukan dari masukan yang salah ke pembatas, seperti titik koma. Ini adalah cara termudah untuk pemulihan kesalahan dan juga mencegah parser mengembangkan loop tak terbatas.
Mode pernyataan
Ketika pengurai menemui kesalahan, ia mencoba untuk mengambil tindakan korektif sehingga masukan pernyataan lainnya memungkinkan pengurai untuk mengurai terlebih dahulu. Misalnya, memasukkan titik koma yang hilang, mengganti koma dengan titik koma, dll. Desainer parser harus berhati-hati di sini karena satu koreksi yang salah dapat menyebabkan loop tak terbatas.
Produksi kesalahan
Beberapa kesalahan umum diketahui oleh perancang kompilator yang mungkin terjadi dalam kode. Selain itu, desainer dapat membuat tata bahasa tambahan untuk digunakan, sebagai produksi yang menghasilkan konstruksi yang salah saat kesalahan ini ditemui.
Koreksi global
Parser mempertimbangkan program yang ada di tangan secara keseluruhan dan mencoba untuk mencari tahu apa program yang dimaksudkan untuk dilakukan dan mencoba untuk menemukan yang paling cocok untuk itu, yang bebas dari kesalahan. Ketika input yang salah (pernyataan) X diumpankan, itu membuat pohon parse untuk beberapa pernyataan bebas kesalahan terdekat Y. Hal ini memungkinkan parser membuat perubahan minimal dalam kode sumber, tetapi karena kompleksitas (waktu dan ruang) dari strategi ini, belum diimplementasikan dalam praktiknya.
Pohon Sintaks Abstrak
Representasi parse tree tidak mudah diurai oleh compiler, karena mengandung lebih banyak detail daripada yang sebenarnya dibutuhkan. Ambil pohon parse berikut sebagai contoh:
Jika diamati lebih dekat, kami menemukan sebagian besar node daun adalah anak tunggal dari node induknya. Informasi ini dapat dihilangkan sebelum memasukkannya ke fase berikutnya. Dengan menyembunyikan informasi tambahan, kita dapat memperoleh pohon seperti yang ditunjukkan di bawah ini:
Pohon abstrak dapat direpresentasikan sebagai:
AST adalah struktur data penting dalam kompiler dengan informasi yang paling tidak diperlukan. AST lebih kompak daripada pohon parse dan dapat dengan mudah digunakan oleh kompilator.