Pengorbanan Perangkat Lunak Perangkat Keras
Ada banyak metode untuk mengurangi biaya perangkat keras. Salah satu metodenya adalah dengan mengintegrasikan bantuan komunikasi dan jaringan yang tidak terlalu erat ke dalam node pemrosesan dan meningkatkan latensi dan okupansi komunikasi.
Metode lainnya adalah menyediakan replikasi otomatis dan koherensi dalam perangkat lunak daripada perangkat keras. Metode terakhir menyediakan replikasi dan koherensi dalam memori utama, dan dapat dijalankan pada berbagai perincian. Ini memungkinkan penggunaan suku cadang komoditas off-the-shelf untuk node dan interkoneksi, meminimalkan biaya perangkat keras. Ini memberi tekanan pada programmer untuk mencapai kinerja yang baik.
Model Konsistensi Memori Santai
Model konsistensi memori untuk ruang alamat bersama mendefinisikan batasan dalam urutan di mana operasi memori di lokasi yang sama atau berbeda tampaknya dijalankan satu sama lain. Sebenarnya, setiap lapisan sistem yang mendukung model penamaan ruang alamat bersama harus memiliki model konsistensi memori yang mencakup antarmuka pemrogram, antarmuka sistem pengguna, dan antarmuka perangkat keras-perangkat lunak. Perangkat lunak yang berinteraksi dengan lapisan itu harus menyadari model konsistensi memorinya sendiri.
Spesifikasi Sistem
Spesifikasi sistem dari sebuah arsitektur menentukan pengurutan dan pengubahan urutan operasi memori dan seberapa banyak kinerja yang sebenarnya dapat diperoleh darinya.
Berikut adalah beberapa model spesifikasi yang menggunakan relaksasi dalam urutan program -
Relaxing the Write-to-Read Program Order- Model kelas ini memungkinkan perangkat keras untuk menekan latensi operasi tulis yang terlewat di memori cache tingkat pertama. Ketika kesalahan tulis ada di buffer tulis dan tidak terlihat oleh prosesor lain, prosesor dapat menyelesaikan pembacaan yang mengenai memori cache-nya atau bahkan satu pembacaan yang terlewat di memori cache-nya.
Relaxing the Write-to-Read and Write-to-Write Program Orders- Mengizinkan penulisan untuk melewati penulisan luar biasa sebelumnya ke berbagai lokasi memungkinkan beberapa penulisan untuk digabungkan dalam buffer tulis sebelum memperbarui memori utama. Dengan demikian beberapa kesalahan tulis menjadi tumpang tindih dan menjadi terlihat rusak. Motivasinya adalah untuk lebih meminimalkan dampak latensi tulis pada waktu istirahat prosesor, dan untuk meningkatkan efisiensi komunikasi di antara prosesor dengan membuat nilai data baru terlihat oleh prosesor lain.
Relaxing All Program Orders- Tidak ada perintah program yang dijamin secara default kecuali data dan ketergantungan kontrol dalam suatu proses. Dengan demikian, keuntungannya adalah bahwa beberapa permintaan baca dapat menjadi luar biasa pada saat yang sama, dan dalam urutan program dapat dilewati oleh penulisan kemudian, dan dapat diselesaikan dengan sendirinya, memungkinkan kita untuk menyembunyikan latensi baca. Jenis model ini sangat berguna untuk prosesor yang dijadwalkan secara dinamis, yang dapat melanjutkan kesalahan pembacaan sebelumnya ke referensi memori lainnya. Mereka mengizinkan banyak pengurutan ulang, bahkan penghapusan akses yang dilakukan oleh pengoptimalan compiler.
Antarmuka Pemrograman
Antarmuka pemrograman mengasumsikan bahwa urutan program tidak harus dipertahankan sama sekali di antara operasi sinkronisasi. Dipastikan bahwa semua operasi sinkronisasi secara eksplisit diberi label atau diidentifikasi seperti itu. Pustaka runtime atau compiler menerjemahkan operasi sinkronisasi ini ke dalam operasi pemeliharaan pesanan yang sesuai yang dipanggil oleh spesifikasi sistem.
Sistem kemudian memastikan eksekusi yang konsisten secara berurutan meskipun sistem dapat menyusun ulang operasi di antara operasi sinkronisasi dengan cara apa pun yang diinginkannya tanpa mengganggu ketergantungan ke lokasi dalam suatu proses. Hal ini memungkinkan kompiler yang cukup fleksibel di antara titik-titik sinkronisasi untuk pengurutan ulang yang diinginkan, dan juga memberikan prosesor untuk melakukan pengurutan ulang sebanyak yang diizinkan oleh model memorinya. Pada antarmuka pemrogram, model konsistensi harus sekurang-kurangnya sama lemahnya dengan antarmuka perangkat keras, tetapi tidak harus sama.
Mekanisme Terjemahan
Di sebagian besar mikroprosesor, menerjemahkan label untuk memesan mekanisme pemeliharaan sama dengan memasukkan instruksi penghalang memori yang sesuai sebelum dan / atau setelah setiap operasi diberi label sebagai sinkronisasi. Ini akan menghemat instruksi dengan muatan / penyimpanan individu yang menunjukkan pemesanan apa yang harus diberlakukan dan menghindari instruksi tambahan. Namun, karena operasi biasanya jarang, ini bukanlah cara yang diambil kebanyakan mikroprosesor sejauh ini.
Mengatasi Keterbatasan Kapasitas
Kami telah membahas sistem yang menyediakan replikasi otomatis dan koherensi dalam perangkat keras hanya dalam memori cache prosesor. Cache prosesor, tanpa itu direplikasi di memori utama lokal terlebih dahulu, mereplikasi data yang dialokasikan dari jarak jauh secara langsung setelah referensi.
Masalah dengan sistem ini adalah cakupan replikasi lokal terbatas pada cache perangkat keras. Jika sebuah blok diganti dari memori cache, blok itu harus diambil dari memori jarak jauh saat diperlukan lagi. Tujuan utama dari sistem yang dibahas dalam bagian ini adalah untuk memecahkan masalah kapasitas replikasi tetapi tetap memberikan koherensi dalam perangkat keras dan perincian yang bagus dari blok cache untuk efisiensi.
Cache Tersier
Untuk mengatasi masalah kapasitas replikasi, salah satu metode adalah menggunakan cache akses jarak jauh yang besar tetapi lebih lambat. Ini diperlukan untuk fungsionalitas, ketika node mesin itu sendiri multiprosesor skala kecil dan dapat dibuat lebih besar untuk kinerja. Ini juga akan menahan blok jarak jauh yang direplikasi yang telah diganti dari memori cache prosesor lokal.
Arsitektur Memori Cache-only (COMA)
Di mesin COMA, setiap blok memori di seluruh memori utama memiliki tag perangkat keras yang terhubung dengannya. Tidak ada node tetap di mana selalu ada jaminan akan ada ruang yang dialokasikan untuk blok memori. Data secara dinamis bermigrasi ke atau direplikasi dalam memori utama node yang mengakses / menariknya. Ketika sebuah blok jarak jauh diakses, itu direplikasi dalam memori atraksi dan dibawa ke cache, dan dijaga konsisten di kedua tempat tersebut oleh perangkat keras. Blok data dapat berada di memori atraksi apa pun dan dapat berpindah dengan mudah dari satu ke yang lain.
Mengurangi Biaya Perangkat Keras
Mengurangi biaya berarti memindahkan beberapa fungsionalitas perangkat keras khusus ke perangkat lunak yang berjalan pada perangkat keras yang ada. Jauh lebih mudah bagi perangkat lunak untuk mengelola replikasi dan koherensi dalam memori utama daripada di cache perangkat keras. Metode berbiaya rendah cenderung memberikan replikasi dan koherensi dalam memori utama. Agar koherensi dapat dikontrol secara efisien, masing-masing komponen fungsional bantuan lainnya dapat memanfaatkan spesialisasi dan integrasi perangkat keras.
Upaya penelitian bertujuan untuk menurunkan biaya dengan pendekatan yang berbeda, seperti dengan melakukan kontrol akses pada perangkat keras khusus, tetapi menetapkan aktivitas lain ke perangkat lunak dan perangkat keras komoditas. Pendekatan lain adalah dengan melakukan kontrol akses dalam perangkat lunak, dan dirancang untuk membagikan abstraksi ruang alamat bersama yang koheren pada node komoditas dan jaringan tanpa dukungan perangkat keras khusus.
Implikasi untuk Perangkat Lunak Paralel
Model konsistensi memori yang santai membutuhkan program paralel yang memberi label akses berkonflik yang diinginkan sebagai titik sinkronisasi. Sebuah bahasa pemrograman menyediakan dukungan untuk memberi label pada beberapa variabel sebagai sinkronisasi, yang kemudian akan diterjemahkan oleh compiler ke instruksi pemeliharaan pesanan yang sesuai. Untuk membatasi pengubahan urutan akses sendiri oleh kompiler ke memori bersama, kompilator dapat menggunakan label dengan sendirinya.