Derleyici Tasarımı - Kod Optimizasyonu

Optimizasyon, kodu daha az kaynak (yani CPU, Bellek) tüketmesini ve yüksek hız sunmasını sağlayarak iyileştirmeye çalışan bir program dönüştürme tekniğidir.

Optimizasyonda, üst düzey genel programlama yapıları, çok verimli düşük düzeyli programlama kodlarıyla değiştirilir. Bir kod optimizasyon süreci aşağıda verilen üç kuralı izlemelidir:

  • Çıkış kodu, hiçbir şekilde programın anlamını değiştirmemelidir.

  • Optimizasyon programın hızını artırmalı ve mümkünse program daha az kaynak talep etmelidir.

  • Optimizasyon hızlı olmalı ve genel derleme sürecini geciktirmemelidir.

Optimize edilmiş bir kod için çabalar, süreci derlemenin çeşitli seviyelerinde yapılabilir.

  • Başlangıçta kullanıcılar kodu değiştirebilir / yeniden düzenleyebilir veya kodu yazmak için daha iyi algoritmalar kullanabilir.

  • Ara kodu oluşturduktan sonra, derleyici ara kodu adres hesaplamaları ve döngüleri iyileştirerek değiştirebilir.

  • Hedef makine kodunu üretirken, derleyici bellek hiyerarşisini ve CPU kayıtlarını kullanabilir.

Optimizasyon genel olarak iki türe ayrılabilir: makineden bağımsız ve makineye bağlı.

Makineden bağımsız Optimizasyon

Bu optimizasyonda, derleyici ara kodu alır ve kodun herhangi bir CPU kaydı ve / veya mutlak bellek konumu içermeyen bir bölümünü dönüştürür. Örneğin:

do
{
   item = 10;
   value = value + item; 
} while(value<100);

Bu kod, tanımlayıcı öğenin tekrar tekrar atanmasını içerir, bu şekilde koyarsak:

Item = 10;
do
{
   value = value + item; 
} while(value<100);

sadece CPU döngülerini kurtarmakla kalmamalı, aynı zamanda herhangi bir işlemcide kullanılabilir.

Makineye Bağlı Optimizasyon

Makineye bağlı optimizasyon, hedef kod oluşturulduktan sonra ve kod, hedef makine mimarisine göre dönüştürüldüğünde yapılır. CPU kayıtlarını içerir ve göreceli referanslardan ziyade mutlak bellek referanslarına sahip olabilir. Makineye bağımlı iyileştiriciler, bellek hiyerarşisinden maksimum yararlanma çabası gösterir.

Temel Bloklar

Kaynak kodları genellikle her zaman sırayla yürütülen ve kodun temel blokları olarak kabul edilen bir dizi talimata sahiptir. Bu temel bloklar, aralarında herhangi bir atlama ifadesine sahip değildir, yani, ilk komut yürütüldüğünde, aynı temel bloktaki tüm komutlar, programın akış kontrolünü kaybetmeden görünüm sıralarına göre yürütülecektir.

Bir program, IF-THEN-ELSE, SWITCH-CASE koşullu ifadeler ve DO-WHILE, FOR ve REPEAT-UNTIL gibi döngüler gibi temel bloklar olarak çeşitli yapılara sahip olabilir.

Temel blok tanımlama

Bir programdaki temel blokları bulmak için aşağıdaki algoritmayı kullanabiliriz:

  • Temel bloğun başladığı tüm temel blokların başlık ifadelerini arayın:

    • Bir programın ilk ifadesi.
    • Herhangi bir dalın hedefi olan ifadeler (koşullu / koşulsuz).
    • Herhangi bir şube bildirimini izleyen ifadeler.
  • Başlık ifadeleri ve bunları izleyen ifadeler temel bir blok oluşturur.

  • Temel bir blok, diğer herhangi bir temel bloğun herhangi bir başlık ifadesini içermez.

Temel bloklar, hem kod üretimi hem de optimizasyon açısından önemli kavramlardır.

Temel bloklar, tek bir temel blokta birden fazla kullanılan değişkenlerin tanımlanmasında önemli bir rol oynar. Herhangi bir değişken birden fazla kullanılıyorsa, bu değişkene tahsis edilen yazmaç belleğinin, blok yürütmeyi bitirmediği sürece boşaltılmasına gerek yoktur.

Kontrol Akış Grafiği

Bir programdaki temel bloklar, kontrol akış grafikleri aracılığıyla gösterilebilir. Bir kontrol akış grafiği, program kontrolünün bloklar arasında nasıl geçirildiğini gösterir. Programdaki istenmeyen döngüleri bulmaya yardımcı olarak optimizasyona yardımcı olan kullanışlı bir araçtır.

Döngü Optimizasyonu

Çoğu program, sistemde bir döngü olarak çalışır. CPU döngülerini ve hafızayı korumak için döngüleri optimize etmek gerekli hale gelir. Döngüler aşağıdaki tekniklerle optimize edilebilir:

  • Invariant code: Döngüde bulunan ve her yinelemede aynı değeri hesaplayan bir kod parçası, döngüde değişmeyen kod olarak adlandırılır. Bu kod, her yinelemeyle değil, yalnızca bir kez hesaplanmak üzere kaydedilerek döngüden çıkarılabilir.

  • Induction analysis : Bir değişken, değeri döngü içinde döngüde değişmeyen bir değerle değiştirilirse, tümevarım değişkeni olarak adlandırılır.

  • Strength reduction: Daha fazla CPU döngüsü, zamanı ve belleği tüketen ifadeler vardır. Bu ifadeler, ifade çıktısından ödün vermeden daha ucuz ifadelerle değiştirilmelidir. Örneğin, çarpma (x * 2), CPU döngüleri açısından (x << 1) ile karşılaştırıldığında pahalıdır ve aynı sonucu verir.

Ölü kod Eliminasyonu

Ölü kod, bir veya birden fazla kod ifadesidir, bunlar:

  • Ya hiç uygulanmaz ya da ulaşılmaz,
  • Veya çalıştırılırsa, çıktıları asla kullanılmaz.

Böylece, ölü kod herhangi bir program işleminde rol oynamaz ve bu nedenle basitçe ortadan kaldırılabilir.

Kısmen ölü kod

Hesaplanan değerleri yalnızca belirli koşullar altında kullanılan bazı kod ifadeleri vardır, yani bazen değerler kullanılır ve bazen kullanılmazlar. Bu tür kodlar kısmen ölü kod olarak bilinir.

Yukarıdaki kontrol akış grafiği, 'a' değişkeninin 'x * y' ifadesinin çıktısını atamak için kullanıldığı bir program yığınını gösterir. 'A'ya atanan değerin döngü içinde asla kullanılmadığını varsayalım. Kontrol döngüden çıktıktan hemen sonra,' a 'değişkenine daha sonra programda kullanılacak olan' z 'değişkenine atanır. Burada, 'a' atama kodunun hiçbir zaman hiçbir yerde kullanılmadığı sonucuna varıyoruz, bu nedenle elimine edilmeye uygun.

Benzer şekilde, yukarıdaki resim koşullu ifadenin her zaman yanlış olduğunu ve gerçek durumda yazılan kodun asla çalıştırılmayacağını, dolayısıyla kaldırılabileceğini ima eder.

Kısmi Artıklık

Fazlalıklı ifadeler, işlenenlerde herhangi bir değişiklik olmaksızın paralel yolda birden çok kez hesaplanır. Burada kısmi-fazlalık ifadeler, işlenenlerde herhangi bir değişiklik olmaksızın bir yolda birden fazla kez hesaplanır. Örneğin,

[gereksiz ifade]

[kısmen gereksiz ifade]

Döngüde değişmeyen kod kısmen fazlalıktır ve bir kod hareketi tekniği kullanılarak ortadan kaldırılabilir.

Kısmen yedekli bir kodun başka bir örneği şunlar olabilir:

If (condition)
{
   a = y OP z;
}
else
{
   ...
}
c = y OP z;

İşlenenlerin değerlerinin (y ve z) değişken atamasından değiştirilmez a değişkene c. Burada, koşul ifadesi doğruysa, y OP z iki kez, aksi takdirde bir kez hesaplanır. Bu fazlalığı ortadan kaldırmak için aşağıda gösterildiği gibi kod hareketi kullanılabilir:

If (condition)
{
   ...
   tmp = y OP z;
   a = tmp;
   ...
}
else
{
   ...
   tmp = y OP z;
}
c = tmp;

Burada koşulun doğru veya yanlış olup olmadığı; y OP z yalnızca bir kez hesaplanmalıdır.